2025大年初一的时候我曾发了一篇如何在本地部署DeepSeek大模型的流程教程,意外的获得了超多的点击和收藏,也了解到了许多用户遇到的问题,经过一段时间的使用,我发现蒸馏过的32b DeepSeek用起来不太如意,遂折腾了一下,成功部署并能较为流畅的运行70b的 ...
2025年9月29日,DeepSeek-V3.2-Exp发布并开源,引入稀疏Attention架构。昇腾已快速基于vLLM/SGLang等推理框架完成适配部署,实现DeepSeek ...
DoNews12月1日消息,据DeepSeek官方公众号公布,两个月前,实验性的 DeepSeek-V3.2-Exp发布,收到了众多热心用户反馈的对比测试结果。目前未发现 V3.2-Exp 在任何特定场景中显著差于 V3.1-Terminus,这验证了 DSA 稀疏注意力机制的有效性。 今天,DeepSeek同时发布两个正式版 ...
IT之家 12 月 1 日消息,DeepSeek V3.2 正式版今日发布,强化 Agent 能力,融入思考推理。 官方今日同时发布两个正式版模型:DeepSeek-V3.2 和 DeepSeek-V3.2-Speciale。 官方网页端、App 和 API 均已更新为正式版 DeepSeek-V3.2。Speciale 版本目前仅以临时 API 服务形式开放,以供社区 ...
蛇年春节前后,中国人工智能企业深度求索(DeepSeek)以其开源模型DeepSeek-R1在全球掀起一场“惊叹风暴”。 爆火的速度令人惊叹。1月20日,DeepSeek正式发布DeepSeek-R1。一周之内,DeepSeek便登顶中美两国苹果手机应用商店免费榜榜首,不久又在约140个国家的手机 ...
V3.1编程击败Claude 4,训练扩增10倍 DeepSeek-V3.1官宣了,作为首款「混合推理」模型,将开启智能体新时代。新模型共有671B参数,编码实力碾压DeepSeek-R1、Claude 4 Opus,登顶编程开源第一。 官宣了! 刚刚,DeepSeek正式上线DeepSeek-V3.1,这是迈向智能体时代第一步。
DeepSeek荣登Nature封面,实至名归!今年1月,梁文锋带队R1新作,开创了AI推理新范式——纯粹RL就能激发LLM无限推理能力。Nature还特发一篇评论文章,对其大加赞赏。 刚刚,DeepSeek-R1登上了Nature封面! 今年1月,DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via ...
【DeepSeek-V3.2正式发布 这些高研发概念股获机构关注(名单)】涉及DeepSeek概念的上市公司普遍重视研发创新,共有162只概念股前三季度研发费用超5000万元,其中紫光股份、大华股份投入研发费用均超30亿元,海光信息、传音控股、用友网络、昆仑万维、视源股份等 ...