科大讯飞登上Nature子刊:AI解化学奥赛题超越人类选手平均水平
近日,国际学术期刊《通讯-化学》(Communications Chemistry)刊发了一项引发业界关注的研究成果。来自科大讯飞研究院与认知智能全国重点实验室的联合团队,构建了一套面向化学领域的多模态评测基准,系统检验了当前主流大模型的科学推理能力,并首次揭示了AI在处理科学图像时存在的“视觉失配”现象。
这一发现被认为对未来科学智能的发展具有重要参考价值。

让AI“看懂”化学图表,难在哪里?
化学研究离不开分子结构式、反应机理图、实验装置示意图等视觉信息。与普通图像识别不同,理解这些科学图像需要AI同时具备符号解析与逻辑推演能力——这恰恰是当前多模态大模型的薄弱环节。
研究团队构建的USNCO-V评测基准,收录了二十余年美国化学奥林匹克竞赛中的473道图文结合题目,覆盖分子结构、实验装置、反应曲线等多种类型。这一基准填补了AI for Science领域在化学视觉推理系统性分析方向的空白。
测试结果:顶尖模型超越人类选手平均成绩
研究对包括GPT-5、OpenAI o3、Gemini-2.5-Pro在内的40款主流多模态大模型进行了系统评估。结果显示,表现最佳的GPT-5以93.2%的准确率位居榜首,显著超越参赛选手44.6%的平均成绩。
然而,研究也发现了一个耐人寻味的现象:部分模型在移除图像输入后,答题准确率反而提升。这一“视觉干扰效应”表明,当前AI在处理科学图像时,视觉与语言模块尚未实现真正的协同工作。
业内专家指出,这一发现对于改进下一代多模态模型具有重要指导意义。
人工智能国家队的AI for Science版图
作为国内人工智能领域的代表性企业,科大讯飞近年来在AI for Science方向持续布局。依托认知智能全国重点实验室和国家新一代人工智能开放创新平台,该公司已在多个科学领域取得进展。
据公开资料显示,科大讯飞与中国科学院共建的“星火科研助手”平台,目前已服务全国1300余所高校的17万余名科研人员;在化工领域,其与中科院大连化物所合作研发的智能化工大模型已迭代至3.0版本;在核聚变研究方向,其团队联合中国科学技术大学在《Nuclear Fusion》发表的PaMMA-Net模型,突破了等离子体磁测量演化建模的技术瓶颈。
值得关注的是,科大讯飞在推进全国产技术路线方面的努力。该公司强调其星火大模型实现了全栈自主可控,从底层算力到上层应用均采用国产化方案,这在当前国际技术竞争背景下具有特殊意义。
从“语言理解”到“科学理解”
有分析人士认为,此次研究成果的发表,标志着国内大模型企业正从通用智能向科学智能纵深拓展。当AI不仅能够处理日常对话,还能理解复杂的科学图表、进行专业领域的逻辑推演时,其应用价值将发生质的飞跃。
不过,研究也坦承当前技术仍存在明显短板——在分子结构识别与实验装置理解等任务上,即便是最先进的模型也表现欠佳。这意味着AI真正成为科学家的得力助手,仍有相当长的路要走。
随着国内多家科技企业加速布局AI for Science赛道,这一领域的竞争正在升温。而此次Nature子刊论文的发表,或许只是国内人工智能国家队在科学智能领域发力的一个缩影。
- 首届北京中国白·德化瓷文化艺术嘉年华在京盛大开幕
- Al战略伙伴集之互动首创AIGC 陪跑模式
- 金融街物业宣布2024年度业绩 持续增强服务质量 市场竞争力不断提升
- 邯郸玛丽亚医院泌尿科治疗早泄怎么样——专业守护男性健康,早泄问题科学应对
- Ortoli Rosenstadt LLP Announces the Third Annual ORY APAC-US Conference on July 8-9, 2025 at Capella
- 李梦男国庆档《破密》精湛演绎蔡申熙军长,再现历史英雄风采
- Plug Signs Technical Evaluation Phase Contract for 25 MW of PEM Electrolyzers with Dourogás and CapW
- 长三角产业协同再添新引擎 上海长三角产业促进会绿色数智供应链分会正式成立
- 献礼新年!易事特启东300MWh储能电站竣工验收,打造能源转型标杆示范项目
- McLaren Racing宣布:Optimum Nutrition成为McLaren一级方程式车队的运动营养品官方合作伙伴
- WPE&WHPE2024观展注册通道全面开启!提前观展注册,参与“超级团长”福利,赢取千元现金!更有专车接送尊贵服务!
- nCino Announces Appointment of Sean Desmond as President and Chief Executive Officer
- Cathay Cargo Leveraged Descartes Air Cargo Tracking Solution to Help Support Safe Journey of Giant P
- 京东工业配售结果出炉:MRO龙头实力领跑 全链条数智化解决方案释放长期价值
- “佛山市安安美容保健品有限公司”受邀参加央广网《品质国货》节目评选
- 无“油”无虑,盛夏焕“发”生机进行时
- Nu:ionic Technologies and RW Energy Announce Strategic Alliance for Distributed Scale Hydrogen Produ
- 加速AI规模应用,释放企业新质生产力,IBM中国企业级AI巅峰论坛成功举办
- 我国著名品牌策划专家李长征一行深入到南水北调源头富锶山泉公司考察调研
- 春游江淮 请来池州 | 3天2晚 您的专属高铁游线路来啦
- Duoer资本管理公司:构建资金安全“双轮驱动” 生态
- CICC 2025 GBA Wealth Management Forum successfully held in Hong Kong
- BlueCat appoints Scott Fulton as Chief Product and Technology Officer
- 芯原推出低功耗AI降噪与AI超分辨率系列IP
- 144小时过境免签,开启云南的奇妙之旅:“有一种叫云南的生活”等着你
- Valeura Energy Inc.: First Quarter 2024 Results
- View韩国地包天手术面诊指南 | 应该沟通些什么?
- AI-Media 与 AVE 宣布达成独家合作,为澳大利亚现场活动提供无障碍支持
- 文化传承者的精神共鸣——中国茶文化研究院院长罗大友
- 中国文化 世界共享 ——艺术大师刘继胜
推荐
-
周星驰新片《少林女足》在台湾省举办海选,吸引了不少素人和足球爱好者前来参加
周星驰新片《少林女足》在台湾省举办海选,吸
资讯
-
国足13次出战亚洲杯首次小组赛0进球
北京时间1月23日消息,2023亚洲杯小组
资讯
-
王自如被强制执行3383万
据中国执行信息公开网消息,近期,王自如新增一
资讯
-
大家一起关注新疆乌什7.1级地震救援见闻
看到热气腾腾的抓饭马上就要出锅、村里大家
资讯
-
透过数据看城乡居民医保“含金量” 缴费标准是否合理?
记者从国家医保局了解到,近期,全国大部分地区
资讯
-
中央气象台连发四则气象灾害预警
暴雪橙色预警+冰冻橙色预警+大雾黄色预警+
资讯
-
新增供热能力3200万平方米 新疆最大热电联产项目开工
昨天(26日),新疆最大的热电联产项目—&md
资讯
-
奥运冠军刘翔更新社交账号晒出近照 时隔473天更新动态!
2月20日凌晨2点,奥运冠军刘翔更新社交账号晒
资讯
-
海南大学生返校机票贵 有什么好的解决办法吗?
近日,有网友在“人民网领导留言板&rdqu
资讯
-
一个“江浙沪人家的孩子已经不卷学习了”的新闻引发议论纷纷
星标★
来源:桌子的生活观(ID:zzdshg)
没
资讯

