九章云极发布新AI慢思考模型,开放性技术路径赋能复杂推理
近日,中国人民大学STILL项目团队、北京智源研究院团队、九章云极DataCanvas联合发布了大模型慢思考推理系列研究成果:在DataCanvas Alaya NeW智算操作系统上完成初步复现类R1推理模型,并向外界完整开源了强化学习与监督微调的训练代码与训练数据。进一步,创新性提出使用代码工具来增强模型推理性能,在AIME 2024数学推理测试中超越DeepSeek-R1的模型性能。
该研究成果发布在知名技术社区GitHub后,引发了广泛关注。
自DeepSeek-R1技术报告公布后,慢思考推理模型的复现仍然面临训练细节缺失、超参数调试复杂等共性难题,九章云极DataCanvas联合团队通过AI基础设施深度融合实现突破。研究开源了该模型在DataCanvas Alaya NeW智算操作系统上完成的强化学习与监督微调全过程完整训练日志、训练数据及容器化部署方案,为当前大多数的复杂推理大模型复现提供了从理论到实践的完整闭环支持。
值得关注的是,DeepSeek以及蒸馏模型在推理过程中无法调用外部代码工具。针对这一问题,该研究结果介绍了九章云极新的工具增强推理模型STILL-3-Tool-32B在AIME 2024基准测试上的领先表现。研究结果显示,该模型在AIME 2024基准测试中取得了81.70%准确率(采样),超越了DeepSeek-R1满血版,以15.56%的显著优势超越其基座训练模型,与OpenAI o3-mini持平,并超越OpenAI o1。
研究结果显示,DataCanvas Alaya NeW智算操作系统在开源工具链与基座模型适配、算法与算力协同、逻辑推理与多步决策等复杂任务框架方面表现出明显优势。业界人员表示,这一成果不仅验证了九章云极在大模型慢思考推理、强化学习训练框架方面的深厚积累,也为开源模型复现提供了新的思路和方法。
在业界看来,完整复现DeepSeek-R1模型存在较高技术门槛,但也为此带来较大研究契机。此前包括HuggingFace、伯克利大学、上海交大等机构均有相关复现研究,九章云极凭借强大的技术储备和人才储备,通过长期深耕,系统掌握大模型慢思考推理技术。同时,九章云极注重技术的开源与产品化,致力于让普通开发者像拼乐高积木一样快速搭建出类R1性能的推理模型,实现了 "低成本高回报" 的技术跃迁。
据悉,该相关研究成果已形成论文《An Empirical Study on Eliciting and Improving R1-like Reasoning Models》,已在全球科研人员前沿成果预印版论文网站arXiv发表。
- 第三届“光华杯”千兆光网应用创新大赛数字乡村专题赛在昆明圆满落幕
- 10年赋新!2024年西安买房必看招商蛇口!
- 《聚焦三中全会政策解读,共促统一大市场建设》
- 连续满房、效益翻倍!格林豪泰4.0引发存量酒店翻建新潮
- 小雪,是中国二十四节气中的第二十个节气,也是冬季的第二个节气
- Kyung-Ah Kim Named as President and Chief Executive Officer of Samsung Bioepis
- 吉林省首届民俗高级人才培训班在舒兰市举办
- DeAgentAI's Marketing Lead : From Movement's Success to Joe's Cat Season, Web3 Embrac
- 临商银行罗庄支行变“诉”为“金”巧营销,赢得客户赞赏
- Hitachi Energy to appoint Andreas Schierenbeck as new Chief Executive Officer, Claudio Facchin to st
- PUMA推出大型品牌活动,强化运动性能定位
- 笔生灵韵·妙笔传神——国画名家俞桂中百家媒体聚焦报道
- Instagram协议号采集工具,ins自动化私信软件,ig群发助手/ins协议号源头
- “交付力”卷出新高度!2024西安买房还看招商蛇口!
- 香港国际机场HKairportShop.com网上商店父亲节购物奖赏
- 鼎茂科技助力银行客户,轻松完成40+监控工具的统一智能告警管理
- Takeda Signs Option Agreement with Ascentage Pharma to Enter into Exclusive Global License for Olver
- 情感与哲思的交织 ——读汀屿老师《太阳来信》有感
- 艺术家电邂逅美酒文化:gorenje在“醉爱如斯”晚宴中大放异彩
- Energy Vault与Skidmore, Owings & Merrill (SOM)宣布建立独家全球重力储能合作伙伴关系,将储能融入建筑设计
- 格力售后服务的五大晾晒贴士:清新衣物、卫生健康、环保节能
- 中央戏剧学院学生李天玖国际声乐比赛获得一等奖
- 新书揭示全球品牌首次使用神经科学驱动的生成式AI工具赢得消费者
- 《哈尔滨1944》收官 演员郜峰饰演“最强毒唯”小武表现抢眼
- “以智慧 悦生活”——悦宠生活携手卡奥斯创智物联在宠物设备智造生态领域达成战略合作
- Bridge Champ展望2025:引领桥牌未来的数字化变革
- “国民营养第四餐 全民健康骆驼奶”专家共识研讨会在京举行
- “深圳市千礼千寻贸易有限公司”受邀参加《品质国货》节目评选
- 向上而生,向远而行|全球嘉年华谋新篇,天狮集团新年开好局
- 推动日本遗产故事走向海外以促进入境旅游——面向国际观众特别制作的推广视频《穿越我们的历史》于2024年11月22日首映
推荐
-
一个“江浙沪人家的孩子已经不卷学习了”的新闻引发议论纷纷 星标★ 来源:桌子的生活观(ID:zzdshg) 没 资讯
-
中央气象台连发四则气象灾害预警 暴雪橙色预警+冰冻橙色预警+大雾黄色预警+ 资讯
-
王自如被强制执行3383万 据中国执行信息公开网消息,近期,王自如新增一 资讯
-
国足13次出战亚洲杯首次小组赛0进球 北京时间1月23日消息,2023亚洲杯小组 资讯
-
海南大学生返校机票贵 有什么好的解决办法吗? 近日,有网友在“人民网领导留言板&rdqu 资讯
-
新增供热能力3200万平方米 新疆最大热电联产项目开工 昨天(26日),新疆最大的热电联产项目—&md 资讯
-
奥运冠军刘翔更新社交账号晒出近照 时隔473天更新动态! 2月20日凌晨2点,奥运冠军刘翔更新社交账号晒 资讯
-
产业数字化 为何需要一朵实体云? 改革开放前,国内供应链主要依靠指标拉动,其逻 资讯
-
中国减排方案比西方更有优势 如今,人为造成的全球变暖是每个人都关注的问 资讯
-
透过数据看城乡居民医保“含金量” 缴费标准是否合理? 记者从国家医保局了解到,近期,全国大部分地区 资讯