“模型更大、数据更多、算力更强”这套线性扩展逻辑,在GPT-3到GPT-4 阶段被反复验证,也直接催生了以GPU 为核心的全球算力竞赛。 但进入2025年后,行业逐渐意识到一个现实问题:算力已不再是通过简单“堆芯片”就能持续放大的变量。万亿参数模型、MoE 架构、Agentic AI、物理 AI 的快速演进,带来的不只是FLOPS 需求的指数级增长,更引发了通信、内存、调度、能耗与系统协同层面的失 ...
腾讯微信 AI 团队提出 WeDLM(WeChat Diffusion Language Model),通过在标准因果注意力下实现扩散式解码,在数学推理等任务上实现相比 vLLM 部署的 AR 模型 3 倍以上加速,低熵场景更可达 10 ...
NVIDIA给出的答案是NVLink Spine——一个完全基于铜缆的机架背板互连系统。在Rubin架构中,NVIDIA利用高度定制的400 Gbps SerDes技术,让电信号能够直接驱动铜缆从机架顶部贯穿到底部。
科技行者 on MSN
上海交大突破:大语言模型实现高效实时推理
这项由 上海交通大学 的范琪、邹安和马叶涵领导的研究团队在2025年12月发表的突破性成果,为解决大语言模型在实时系统中的应用难题提供了全新方案。研究论文题为"TimeBill: Time- Budgeted Inference for Large ...
北京时间6日上午10点30分,美国拉斯维加斯,在全球“科技春晚”——国际消费电子展(CES)的聚光灯下,继英伟达CEO黄仁勋后,AMD董事长兼CEO苏姿丰带着AMD的AI全家桶登台亮相。 “自ChatGPT发布以来,使用AI的活跃用户从100万增至10亿,而到2030年使用AI的活跃用户将达到50亿.....",苏姿丰开场大谈AI需求的暴涨,针对这一变化趋势,AMD的解决方案是最新的MI455X ...
华尔街见闻 on MSN
黄仁勋CES演讲全文来了!Rubin全面投产,算力暴涨5倍,砸掉智驾门槛all ...
英伟达Vera ...
2025年CES, 英伟达 展示了量产的Blackwell芯片和完整的物理AI技术栈。在会上,黄仁勋强调,一个“物理AI时代”正在开启。他描绘了一个充满想象力的未来:自动驾驶汽车具备推理能力, 机器人 能够理解并思考,AI ...
陈雨露在致辞中说,核心数学与组合数学教育部重点实验室从2000年成立以来,始终以治学兴邦、为国育才为己任,依托南开数学和统计两个国家一流学科,构筑起兼具深厚积淀与创新活力的科研高地,有效强化在基础数学与组合数学领域的突出优势,并在图论与组合优化、统计 ...
Chinese graphics chipmaker Moore Threads Technology on Friday sought to reassure investors and developers about its long-term competitiveness after a blockbuster listing on Shanghai’s STAR Market thru ...
从组织架构的设置上看,GPT-4 幕后的研发团队大致可分为七个部分:预训练(Pretraining)、长上下文(Long context)、视觉(Vision)、强化学习 & 对齐(RL & alignment)、评估 & 分析(Evaluation ...
AI at Scale is an applied research initiative that works to evolve Microsoft products with the adoption of deep learning for both natural language text and image processing.… Using DeepSpeed and ...
芯东西 on MSN
刚刚,壁仞科技敲钟上市!GPU在手订单超12亿,拿下多个国产第一
芯东西(公众号:aichip001) 作者 | ZeR0 编辑 | 漠影 芯东西1月2日报道,刚刚,上海GPU龙头企业壁仞科技在港交所挂牌上市,成为港股“国产GPU第一股”,也是2026年港股市场首只上市新股。
一些您可能无法访问的结果已被隐去。
显示无法访问的结果