采访 | 张红月 嘉宾|刘童璇出品 | CSDN(ID:CSDNnews)2025 年,AI 基础设施(AI Infra)告别了技术概念的空谈模式,转入了由成本和效率定义的残酷现实。在 3 月,DeepSeek 抛出了一个极具冲击力的事实:基于其 ...
在数字化转型浪潮席卷各行业的当下,企业如何构建高效智能体成为技术突破的关键。近日,一份名为《DeepSeek智能体开发通用设计方案》的153页技术文档引发业界关注,该方案通过模块化架构与标准化工具链,为复杂业务场景下的智能体开发提供了系统性解决方案。
北京时间2026年1月1日,DeepSeek团队在arXiv(预印本)网站和Hugging Face上同步发布了最新论文,名为《mHC: Manifold-Constrained ...
清华大学TSAIL实验室携手生数科技,重磅发布并开源了视频生成加速框架TurboDiffusion。 这个框架一出,立刻在全球AI社区引发热议。OpenAI、Meta、vLLM等多个机构和开源社区的研究者、工程师纷纷点赞、转发。
The World Resources Institute (USA) Beijing Representative Office is looking for one highly self-motivated student to be an intern at the Research, Data & Impact (RDI) team.
自教育部2020年发布《新文科建设宣言》以来,国内高校纷纷开设跨学科、跨专业新兴交叉课程、多学士学位,推动文科与理工农医的交叉融合。近两年,不少高校都推出了“文科+AI”、AI辅修、AI类微专业等,南开大学今年首次试点跨学科辅修制度,将辅修专业修读纳 ...
全球数学界正经历一场静默的变革,几项突破性进展引发学界持续讨论。国产大模型DeepSeek-V3.2-Speciale在国际数学奥林匹克竞赛与国际信息学奥林匹克竞赛中斩获金牌级成绩,标志着人工智能在基础学科竞赛领域取得重大突破。与此同时,菲尔兹奖得主陶哲轩借助升级版谷歌Gemini模型,仅用十分钟便补全了困扰学界多年的埃尔德什难题证明,完成从论证分析到结论确 ...
DeepSeek-V3.2很强很火爆,但随着讨论的深入,还是有bug被发现了。 并且是个老问题:浪费token。 图源:x@Hangslin 不少网友都提到,DeepSeek-V3.2的长思考增强版Speciale,确确实实以开源之姿又给闭源TOP们上了压力,但问题也很明显: 在面对复杂任务时,消耗的token数偏 ...
IT之家12 月 1 日消息,DeepSeek V3.2 正式版今日发布,强化 Agent 能力,融入思考推理。 官方今日同时发布两个正式版模型:DeepSeek-V3.2 和 DeepSeek-V3.2-Speciale。 官方网页端、App 和 API 均已更新为正式版 DeepSeek-V3.2。Speciale 版本目前仅以临时 API 服务形式开放,以供社区 ...
大家好,这里是人工智能最前沿。OCR 赛道悄悄展开了一个机会。 DeepSeek 官方已经正式开源了「DeepSeek-OCR」,并宣布已原生支持 vLLM 推理框架。 这意味着:企业现在可以 本地化部署一款高质量视觉大模型,不依赖第三方 API,也无需担心数据外泄,相信大多数 ...
在人工智能飞速发展的浪潮中,DeepSeek团队再次带来令人振奋的开源力作——DeepSeek-OCR!这款基于“上下文光学压缩”创新 ...
使用微信扫码将网页分享到微信 就在刚刚,DeepSeek 开源了一个 3B 模型 DeepSeek-OCR。虽然 3B 体量不大,但模型思路创新的力度着实不小。 众所周知,当前所有 LLM 处理长文本时都面临一个绕不开的困境:计算复杂度是平方级增长的。序列越长,算力烧得越狠。