科技行者 on MSN
浙江大学揭秘AI训练:为什么主流的LoRA方法竟然不是最佳选择
这项由浙江大学殷清宇团队联合香港科技大学、中南大学、中国科学技术大学等多所院校共同完成的研究,发表于2025年12月29日的arXiv预印本平台(论文编号:arXiv:2512.23165v1),首次系统性地评估了12种不同的参数高效微调方法在强化学习场景下的表现。有兴趣深入了解的读者可以通过该编号查询完整论文。 当我们谈论人工智能模型训练时,就像在讨论如何培养一个天才学生。传统的训练方式好比让这 ...
昨天我们报道了2025年国内机构在数学四大顶刊发文情况的前半部分,详见:2025年数学四大顶刊国内机构发文情况(前半部分),北大、西湖大学、中科大和复旦上榜。今天,我们继续后半部分的内容,顺接前半部分: ...
一点资讯 on MSN
这些巨人走过的,是数学尚不存在的地方
科学的演进往往通过推倒旧体系来建立新知,这让数学显得有些异类:它不断向前推进,却几乎从不否定自己的过去。欧几里得的公理,至今仍构成数学的基础。数学的历史是建立在证明之上的一条延绵的思想脉络。著名数学家、科普作家伊恩·斯图尔特(Ian Stewart)试图追问一个更根本的问题:数学的新领域究竟是如何被“创造”出来的?为此,他选择了 25 ...
科技行者 on MSN
浙江大学团队提出C2DLM:让AI推理更像人类思维的全新语言模型
人工智能领域迎来了一项重要突破。这项由浙江大学计算机科学与技术学院韩凯容、单暖桥、赵子俞等研究人员以及华为诺亚方舟实验室合作完成的研究,于2025年11月发表在人工智能顶级会议论文中,论文编号为arXiv:2511.22146v1。有兴趣深入了解的读者可以通过该编号查询完整论文。 当我们思考问题时,比如解决一道数学题,我们的大脑并不是简单地从左到右逐字逐句地处理信息。相反,我们会建立概念之间的因果 ...
5 天on MSN
DeepSeek新年送“贺礼”:MHC架构或为大模型演进指明新方向
人工智能领域迎来一项突破性进展,DeepSeek团队在最新发表的论文中提出了名为mHC(流形约束超连接)的创新网络架构。这项研究聚焦于解决大规模模型训练中的核心痛点,通过重构神经网络连接机制,为提升模型训练稳定性与可扩展性提供了全新思路。
近日在上海举行的第十届世界华人数学家大会(简称ICCM)上,纽约大学教授、法国高等科学研究所终身教授王虹,芝加哥大学教授邓煜以及北京大学北京国际数学研究中心教授袁新意获颁有“华人菲尔兹奖”之称的ICCM数学奖金奖。
中国消费者报海口讯 (记者 董芳忠 )近日,在海南省海口市举办的全国信标委人工智能分委会“标准周”活动期间,国内首张大模型高阶通用能力国家标准符合性测试证书正式颁发,标志着我国大模型高阶通用能力评测实现标准化落地,为大模型产业规范化发展树立了关键里程碑。
一些您可能无法访问的结果已被隐去。
显示无法访问的结果