Mamba - 搜索 News

22 小时

原作亲自下场，Mistral首款开源7B Mamba模型「埃及艳后」效果惊艳

【导读】最近，7B小模型又成为了AI巨头们竞相追赶的潮流。继谷歌的Gemma2 7B后，Mistral今天又发布了两个7B模型，分别是针对STEM学科的Mathstral，以及使用Mamaba架构的代码模型Codestral Mamba。

一文看懂Mamba，Transformer最强竞争者

Mamba 虽好，但发展尚早。深度学习架构有很多，但近些年最成功的莫过于 Transformer，其已经在多个应用领域确立了自己的主导地位。如此成功的一大关键推动力是注意力机制，这能让基于 Transformer 的模型关注与输入序列相关的部分，实现更好的上下文理解。

腾讯网

Mamba正式被ICLR拒收！“年度最佳技术原理解读”却火了

在较高层次上，S4学习如何通过中间状态 h(t) 将输入x(t) 映射到输出 y(t) 上。在此，由于SSM被设计于很好地处理连续数据，例如音频、传感器数据和图像，因此x、y、t 是x的函数。 S4通过三个连续参数矩阵A、B和C将它们互联，具体形式表现为以下两个方程（Mamba ...

5 个月

Mamba-2新架构出世一统江湖，普林斯顿CMU华人再出神作，性能狂飙8倍

如今，线性注意力和SSM连接起来后，前途一片大好，更快的算法、更好的系统优化，就在眼前了。【导读】在开源社区引起「海啸」的Mamba架构，再次卷土重来！这次，Mamba-2顺利拿下ICML。通过统一SSM和注意力机制，Transformer和SSM直接成了「一家亲」，Mamba-2这是要一统江湖了？年前，Mamba被顶会ICLR拒稿的消息曾引起轩然大波。不同的是，作者在更高的视角上，统一了状 ...

生物通

WMamba：一种基于小波变换（Wavelet Transform）和Mamba算法的频率解耦增强 ...

在计算机视觉领域，卷积神经网络（CNN）受限于其有限的感受野，难以捕捉全局特征。尽管变换器（Transformers）弥补了CNN的不足，在提取全局特征方面表现出色，但在高分辨率场景下却面临计算复杂性的问题。如今，Mamba凭借其线性复杂性和全局建模能力展现了 ...

新浪网

Mamba-3惊现AI顶会ICLR 2026！CMU知名华人教授一作首代工作AI圈爆红

【新智元导读】曼巴回来了！Transformer框架最有力挑战者之一Mamba的最新进化版本Mamba-3来了，已进入ICLR 2026盲审环节，超长文本处理和低延时是其相对Transformer的显著优势。另一个挑战者是FBAM，从不同的角度探索Transformer的下一代框架。算法巨蟒「Mamba」悄然蜕变 ...

生物通

Geo-Mamba：一个基于数据的Mamba框架，用于结合多源地理因素的时空建模

本文提出Geo-Mamba框架，创新性地将地理因素分类为动态、静态和类别型，结合Mamba架构的线性时空建模能力与KAN网络的高精度数值回归特性，实现异质时空数据的多尺度融合与高效建模，在地下水存储异常（RMSE=1.916）、净生态系统交换（R2=0.986）和水覆盖分类（OA ...

来自MSN

黄仁勋又投了个AI创企！创始团队有两位华人大牛，还有Mamba、谷歌背景

智东西11月3日消息，10月29日，美国语音生成创企Cartesia创始人兼首席执行官Karan Goel在社交平台X上宣布推出全新的语音模型Sonic-3，同时还披露其已完成1亿美元（约合人民币7.12亿元）融资，英伟达参投。 Cartesia创立于2023年，由5位斯坦福AI实验室研究员创立，其中 ...

来自MSN

Meta新突破：Transformer与Mamba融合，打造高效长文本处理AI新架构

人工智能领域迎来一项突破性进展，国际研究团队成功开发出一种融合Transformer与Mamba架构优势的新型语言模型。这项由多国科研人员共同完成的研究，通过创新性架构设计实现了模型性能与效率的双重突破，为自然语言处理技术开辟了新路径。传统语言模型 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果