一款名为IQuest-Coder-V1的中国代码生成模型系列近日引发全球科技界关注。该模型在SWE-Bench Verified榜单中取得突破性成绩,其40B参数版本以81.4%的准确率超越外界推测参数规模达千亿至万亿级的Claude Opus-4.5和GPT-5.2,成为当前代码生成领域最受瞩目的新星。
本文从原理到实践系统地分享了如何高效使用AI编程工具。涵盖其底层机制(如Token计算、工具调用、Codebase索引与Merkle ...
阅读之前记得关注+星标⭐️,,每天才能第一时间接收到更新 Claude Code之父Boris Cherny ,刚刚公开了他的个人工作流出人意料的是,他的配置相当原生态,他表示,Claude ...
麦姆斯咨询获悉,近日,浙江大学信息与电子工程学院车录锋教授团队在可穿戴贴片构筑全ASCII码触觉闭环人机交互方面取得最新进展,相关研究成果以“A Fully Integrated Patch for Real-Time AI-Enhanced Haptic Closed-Loop Interaction of Complete 128 ASCII Codes”为题,发表于国际材料领域顶级期刊《 ...
睡前看了下X,果然不出我所料,感慨一下: 1. 81.4是一个典型的reward hacking现象,swe bench的老版本其实在git里藏了正确答案的,模型一旦学会了查看git的所有提交,就可能直接拿正确答案的pr去交差。
在早期, Fine-Tuning 被视为一种直接方案:通过在大模型层面注入领域知识,补充其世界模型的盲区。但实践很快证明,这种方式在 AI Coding 场景下成本高昂、灵活性不足,且难以应对多模型频繁切换的现实需求。相比之下,以 RAG 为代表的 ...
中国量化私募领域再掀波澜,九坤投资旗下至知创新研究院推出的IQuest-Coder-V1代码生成模型系列引发全球开发者关注。这款覆盖7B、14B和40B参数规模的模型,在SWE-Bench ...
最近在 X(即 Twitter )上看到 Greg Isenberg 的一条长推,标题是「 HOW TO BUILD MOBILE APPS WITH AI IN 2026 」。 Greg 是硅谷连续创业者,公司被 WeWork 收购过,现在专门做 ...