2025大年初一的时候我曾发了一篇如何在本地部署DeepSeek大模型的流程教程,意外的获得了超多的点击和收藏,也了解到了许多用户遇到的问题,经过一段时间的使用,我发现蒸馏过的32b DeepSeek用起来不太如意,遂折腾了一下,成功部署并能较为流畅的运行70b的 ...
2025年9月29日,DeepSeek-V3.2-Exp发布并开源,引入稀疏Attention架构。昇腾已快速基于vLLM/SGLang等推理框架完成适配部署,实现DeepSeek ...
新浪科技讯 12月1日晚间消息,继两个月前发布实验性的 DeepSeek-V3.2-Exp后,DeepSeek今日宣布同时发布两个正式版模型:DeepSeek-V3.2 和 DeepSeek-V3.2-Speciale。 目前,官方网页端、App 和 API 均已更新为正式版 DeepSeek-V3.2,供广大用户使用。Speciale 版本目前仅以临时 API 服务 ...
【TechWeb】9月23日消息,DeepSeek官方宣布DeepSeek-V3.1更新至 DeepSeek-V3.1-Terminus 版本。 据介绍,此次更新在保持模型原有能力的基础上,针对用户反馈的问题进行了改进,包括:语言一致性:缓解了中英文混杂、偶发异常字符等情况;Agent 能力:进一步优化了 Code Agent ...
V3.1编程击败Claude 4,训练扩增10倍 DeepSeek-V3.1官宣了,作为首款「混合推理」模型,将开启智能体新时代。新模型共有671B参数,编码实力碾压DeepSeek-R1、Claude 4 Opus,登顶编程开源第一。 官宣了! 刚刚,DeepSeek正式上线DeepSeek-V3.1,这是迈向智能体时代第一步。
蛇年春节前后,中国人工智能企业深度求索(DeepSeek)以其开源模型DeepSeek-R1在全球掀起一场“惊叹风暴”。 爆火的速度令人惊叹。1月20日,DeepSeek正式发布DeepSeek-R1。一周之内,DeepSeek便登顶中美两国苹果手机应用商店免费榜榜首,不久又在约140个国家的手机 ...
【DeepSeek-V3.2正式发布 这些高研发概念股获机构关注(名单)】涉及DeepSeek概念的上市公司普遍重视研发创新,共有162只概念股前三季度研发费用超5000万元,其中紫光股份、大华股份投入研发费用均超30亿元,海光信息、传音控股、用友网络、昆仑万维、视源股份等 ...