不是工具,是会陪你一起成长的数字伙伴2026年2月25日,一个名为 Hermes Agent 的开源项目在 GitHub 上悄然上线。短短一个多月,它收获了超过 6 万颗 Stars,成为 AI 智能体领域的新星。它凭什么这么火?一句话:别的 AI ...
博士生Hanchen Li和合作者Hao Wang等人发布名为“Terminator-1”的AI Agent,声称其在两大主流编码基准——SWE-bench Verified和Terminal-Bench上取得95%以上的高分,甚至部分达到100%。
每周都有新的AI大模型登顶评测榜单。公司在新闻稿里吹嘘这些分数,投资人用它们来推高估值,工程师靠它们来决定部署哪个模型。大家潜意识里都相信一个简单的逻辑:分数越高,系统越强。 但这个承诺已经破产了。 加州大学伯克利分校的研究团队刚刚发布了一项重磅研究 ...
1.美国财政部长与美联储主席紧急召集华尔街主要银行高管会议,推动使用Anthropic公司Mythos AI模型检测金融系统安全漏洞,涉及摩根大通、高盛、花旗等系统重要性金融机构。
现在,每当我们听到人工智能写代码的故事时,总是会产生这样的疑问:这些AI助手真的能像人类程序员一样,不仅写出正确的代码,还能像资深工程师那样思考复杂问题、处理各种意外情况吗?快手科技的KwaiKAT团队最近给出了一个令人惊喜的答案。他们开发的KAT-Coder-V2就像是编程界的"瑞士军刀",不仅能写代码,还能修复软件漏洞、设计网页界面、操作命令行系统,甚至 ...