AI 圈的头条被 DeepSeek 承包了十几天,昨天,OpenAI 终于坐不住了,推出了全新推理模型系列 o3-mini。不仅首次向免费用户开放了推理模型,而且相比之前的 o1 系列,成本更是降低了 15 倍之多。 OpenAI 也称这是其推理模型系列中最新、最具成本效益的模型: 刚刚 ...
适用于常规 AI 模型和 MoE。 DeepSeek 的开源周已经进行到了第三天(前两天报道见文末「相关阅读」)。今天开源的项目名叫 DeepGEMM,是一款支持密集型和专家混合(MoE)GEMM 的 FP8 GEMM 库,为 V3/R1 的训练和推理提供了支持,在 Hopper GPU 上可以达到 1350+ FP8 TFLOPS 的 ...
“对不起,我还没学会如何思考这类问题,我擅长数学、程式码、逻辑类的题目,欢迎与我交流。” “习近平是谁?” “对不起,我还没学会如何思考这类问题,我擅长数学、程式码、逻辑类的题目,欢迎与我交流。” “台湾是什么地方?” “对不起,我还没 ...
中国初创公司DeepSeek能以极低的成本建立与OpenAI不相上下的人工智能模型,这一消息让硅谷陷入恐慌。 Violeta Santos Moura/Reuters 在中国国内,它被称为与美国进行全球技术竞争的临界点,也是硅谷的“至暗时刻”,这话让人想起温斯顿·丘吉尔。这可能是改变国运的 ...
DeepSeek的成功使其创始人梁文锋引起了中国最高层的关注。上个月,他与一些民企高管一起与习近平会面。 Florence Lo/Reuters 自从中国的人工智能初创公司DeepSeek的创始人上个月与中国最高领导人习近平握手后,全国各地的官员都在争先恐后地展示他们是如何使用该 ...