Inference Model - 搜索 News

1 小时

NVIDIA: Rubin平台面市 ,系统级“AI工厂”成型，物理AI加速落地

“模型更大、数据更多、算力更强”这套线性扩展逻辑，在GPT-3到GPT-4 阶段被反复验证，也直接催生了以GPU 为核心的全球算力竞赛。但进入2025年后，行业逐渐意识到一个现实问题：算力已不再是通过简单“堆芯片”就能持续放大的变量。万亿参数模型、MoE 架构、Agentic AI、物理 AI 的快速演进，带来的不只是FLOPS 需求的指数级增长，更引发了通信、内存、调度、能耗与系统协同层面的失 ...

腾讯网

微信炼出扩散语言模型，实现vLLM部署AR模型3倍加速，低熵场景超10倍

腾讯微信 AI 团队提出 WeDLM（WeChat Diffusion Language Model），通过在标准因果注意力下实现扩散式解码，在数学推理等任务上实现相比 vLLM 部署的 AR 模型 3 倍以上加速，低熵场景更可达 10 ...

腾讯网

CES 2026 | NVIDIA新风向: Rubin平台面市，系统级“AI工厂”成型，物理AI ...

NVIDIA给出的答案是NVLink Spine——一个完全基于铜缆的机架背板互连系统。在Rubin架构中，NVIDIA利用高度定制的400 Gbps SerDes技术，让电信号能够直接驱动铜缆从机架顶部贯穿到底部。

科技行者 on MSN

上海交大突破：大语言模型实现高效实时推理

这项由上海交通大学的范琪、邹安和马叶涵领导的研究团队在2025年12月发表的突破性成果，为解决大语言模型在实时系统中的应用难题提供了全新方案。研究论文题为"TimeBill: Time- Budgeted Inference for Large ...

头部财经

苏姿丰CES演讲全文来了！尧字节时代来临，Helios登场，“未来四年 ...

北京时间6日上午10点30分，美国拉斯维加斯，在全球“科技春晚”——国际消费电子展（CES）的聚光灯下，继英伟达CEO黄仁勋后，AMD董事长兼CEO苏姿丰带着AMD的AI全家桶登台亮相。 “自ChatGPT发布以来，使用AI的活跃用户从100万增至10亿，而到2030年使用AI的活跃用户将达到50亿....."，苏姿丰开场大谈AI需求的暴涨，针对这一变化趋势，AMD的解决方案是最新的MI455X ...

华尔街见闻 on MSN

黄仁勋CES演讲全文来了!Rubin全面投产，算力暴涨5倍，砸掉智驾门槛all ...

英伟达Vera ...

天天基金网

黄仁勋CES2026最新演讲：三个关键话题，一台“芯片怪兽”

2025年CES，英伟达展示了量产的Blackwell芯片和完整的物理AI技术栈。在会上，黄仁勋强调，一个“物理AI时代”正在开启。他描绘了一个充满想象力的未来：自动驾驶汽车具备推理能力，机器人能够理解并思考，AI ...

南开大学新闻网

核心数学与组合数学教育部重点实验室召开工作汇报会与学术委员会 ...

陈雨露在致辞中说，核心数学与组合数学教育部重点实验室从2000年成立以来，始终以治学兴邦、为国育才为己任，依托南开数学和统计两个国家一流学科，构筑起兼具深厚积淀与创新活力的科研高地，有效强化在基础数学与组合数学领域的突出优势，并在图论与组合优化、统计 ...

15 天

China’s Moore Threads Courts Developers as it Takes Aim at Nvidia After IPO

Chinese graphics chipmaker Moore Threads Technology on Friday sought to reassure investors and developers about its long-term competitiveness after a blockbuster listing on Shanghai’s STAR Market thru ...

6 天

GPT-4背后的开发者：七大团队，三十余位华人

从组织架构的设置上看，GPT-4 幕后的研发团队大致可分为七个部分：预训练（Pretraining）、长上下文（Long context）、视觉（Vision）、强化学习 & 对齐（RL & alignment）、评估 & 分析（Evaluation ...

Microsoft

Xia Song at Microsoft Research | 宋夏

AI at Scale is an applied research initiative that works to evolve Microsoft products with the adoption of deep learning for both natural language text and image processing.… Using DeepSpeed and ...