TII推出Falcon Reasoning:全球顶尖70亿参数AI模型,性能超越更大规模模型
• Falcon H1R 7B将先进的推理能力融入紧凑型70亿参数模型,该模型针对速度和效率进行了优化
• TII的最新AI模型在关键基准测试中超越了微软、阿里巴巴和英伟达等规模更大的竞争对手
阿布扎比先进技术研究委员会(ATRC)下属的重要应用研究机构——科技创新研究所(TII)发布新一代AI模型Falcon H1R 7B。该模型以紧凑、高效且开源的形式提供世界一流的推理能力,显著提升了先进AI的普及度。
Falcon H1R 7B仅有70亿个参数,却能够挑战并在多个方面超越全球更大型的开源AI模型,包括微软的Phi 4 Reasoning Plus 14B、阿里巴巴的Qwen3 32B以及英伟达的Nemotron H 47B。此次模型发布再次巩固了TII在高效AI创新领域的领先地位,并强化了阿联酋在全球技术领先国家中与日俱增的影响力。
阿联酋总统顾问兼ATRC秘书长Faisal al Bannai阁下表示:“Falcon H1R体现了阿联酋致力于构建开放、负责任的AI,为国家和全球创造真正价值的承诺。我们将世界一流的推理能力融入紧凑高效的模型,从而以一种推动经济增长、科研领导力和长期技术韧性的方式,扩大先进AI的普及范围。”
测试时推理的突破
Falcon H1R 7B在Falcon H1-7B的基础上,采用专门的训练方法和混合Transformer-Mamba架构,提高了准确性和速度。
“Falcon H1R 7B标志着紧凑型AI系统推理能力的飞跃。”TII首席执行官Najwa Aaraj博士表示,“它在顶级基准测试中取得了近乎完美的成绩,同时将内存和能耗控制在极低水平——这些正是现实部署和可持续发展的关键指标。”
这种方法释放了研究人员所谓的“潜在智能”,使Falcon H1R 7B能够更有效且高效地进行推理。该模型设定了一个新的帕累托边界,即性能的最佳平衡点,在这个平衡点上,速度的提升不会以牺牲质量为代价。
最佳基准测试
在竞争激烈的基准测试中,Falcon H1R 7B取得了卓越的成绩:
- 数学:AIME-24测试得分达88.1%,超越了ServiceNow AI的Apriel 1.5 (15B) (86.2%)——这证明了紧凑型7B模型可与规模更大的系统相媲美,甚至超越。
- 代码与代理任务:准确率达68.6%,在80亿参数以下模型中表现最佳,并在LCB v6、SciCode Sub和TB Hard基准测试中得分更高。Falcon H1R的得分为34%,高于中国的DeepSeek R1-0528 Qwen 3 8B (26.9%),甚至超过了Qwen3-32B (33.4%) 等更大规模的竞争者。
- 通用推理:展现出强大的逻辑推理和指令执行能力,性能与微软Phi 4 Reasoning Plus (14B) 等规模更大的模型相当或接近,而参数量仅为后者的一半。
- 效率:在批量64时,单GPU峰值性能达每秒1500个令牌,凭借混合Transformer-Mamba架构,其速度几乎达到中国Qwen3-8B的两倍——在保持准确性的同时,实现了更快的可扩展性能。
“该模型是世界一流研究和工程的成果,展现了科学的精确性与可扩展设计的完美结合。”TII人工智能与数字研究中心首席研究员Hakim Hacid博士表示,“我们很自豪能够推出这样一个模型,帮助社区构建更智能、更快速、更易用的AI系统。”
开源与社区驱动
秉承TII对AI透明度和协作的承诺,Falcon H1R 7B以开源模型形式发布,并采用Falcon TII许可证。全球的开发者、研究人员和机构可通过Hugging Face访问该模型,并获取完整的技术报告,其中详细介绍了训练策略和在关键推理基准测试中的表现。
此次新版本的发布建立在TII Falcon项目全球成功的基础之上。Falcon模型自问世以来,一直位列全球顶级AI系统之列,前四代在其各自类别中均取得了全球第一的排名。历经多次迭代升级之后,Falcon在性能、效率和实际部署能力方面均树立了新标杆,证明了紧凑型、自主运行的模型能够超越规模更大的系统。这一座座里程碑凸显了阿布扎比乃至整个阿联酋在前沿人工智能领域日益增强的领导地位,同时也印证了TII开展全球顶尖研究的能力。
*来源: AETOSWire
TII推出Falcon Reasoning:全球顶尖70亿参数AI模型,性能超越更大规模模型 (图片:AETOSWire)
- 德力静®获批一周年:突破“糖痛”患者治疗困境,推动DPNP诊疗规范化提升
- Teledyne's new 2.5 GigE Vision line scan camera delivers industry-leading performance in a cost
- 万邦奔富与中非能源合作,共谱绿色能源未来
- MissWiss × 张柏芝:在防晒衣橱里 看见时光绕行的轨迹
- Ascent AeroSystems Elevates Paul Fermo to President
- 记中医传承人著名中西合壁李万泉
- 恒隆宣布拨款港币1,100万元成立 "大埔宏福苑火灾赈灾基金"
- 出海赋能,神州控股科捷与全球服务机器人领导者普渡达成战略合作
- PRD Therapeutics宣布启动PRD001的首例人体研究
- 春天里·议国是|共担文化使命——任玉岭
- 解锁中国市场,意大利葡萄酒与烈酒行业论坛暨品鉴大师班在成都拉开帷幕
- 佛山陶企创造行业性超级风口!为中国陶业指明方向!
- 销量同比增长超200%!Witsbb健敏思解码婴童营养品牌增长新势能
- Passengers Are Already Digital. This Is a Big Opportunity for Aviation
- 传奇IP开启新征程:娱美德亮相消博会,宣布加大中国投资
- 以患者需求为导向,首部医疗界《十万个为什么》征稿启动
- 2025中式糕点博览会精彩速递 中焙蛋挞首日人气爆棚,全球战略蓝图公开
- “浙江盛为新材料科技有限公司”——环保与创新并行
- 朔豪优选:开启品质电商新篇章,让消费更智慧
- Alvarez & Marsal Tax Expands Across Asia Pacific Hiring James Badenach as Managing Director to L
- 陈昊森官宣LOEWE罗意威品牌挚友 携手探索多彩时尚魅力
- 威雅学校夏校:开营首周精彩全记录!第二期四大主题营火热加报中!
- 最新研究发现83%的供应链无法在24小时内对中断做出响应
- 维萃美麦角硫因琉光瓶:以“细胞级抗衰黑科技”重塑肌龄逆生长新纪元
- “云医务室+”—央国企医务室的高质量探索
- 构象好用吗?深度解析【构象CoreX】明星产品编织霜与亮感水!
- AI如何改变厨房?老板电器AWE发布会揭秘AI烹饪黑科技
- 浪潮软件探索AI在数字政府领域的应用
- eXp Realty Launches in Japan, Marking Fourth Global Market Entry in 2025
- TFOS理事Fiona:让世界看到中国干眼领域的发展成就
推荐
-
奥运冠军刘翔更新社交账号晒出近照 时隔473天更新动态!
2月20日凌晨2点,奥运冠军刘翔更新社交账号晒
资讯
-
周星驰新片《少林女足》在台湾省举办海选,吸引了不少素人和足球爱好者前来参加
周星驰新片《少林女足》在台湾省举办海选,吸
资讯
-
新增供热能力3200万平方米 新疆最大热电联产项目开工
昨天(26日),新疆最大的热电联产项目—&md
资讯
-
透过数据看城乡居民医保“含金量” 缴费标准是否合理?
记者从国家医保局了解到,近期,全国大部分地区
资讯
-
海南大学生返校机票贵 有什么好的解决办法吗?
近日,有网友在“人民网领导留言板&rdqu
资讯
-
一个“江浙沪人家的孩子已经不卷学习了”的新闻引发议论纷纷
星标★
来源:桌子的生活观(ID:zzdshg)
没
资讯
-
男子“机闹”后航班取消,同机旅客准备集体起诉
1月4日,一男子大闹飞机致航班取消的新闻登上
资讯
-
王自如被强制执行3383万
据中国执行信息公开网消息,近期,王自如新增一
资讯
-
大家一起关注新疆乌什7.1级地震救援见闻
看到热气腾腾的抓饭马上就要出锅、村里大家
资讯
-
国足13次出战亚洲杯首次小组赛0进球
北京时间1月23日消息,2023亚洲杯小组
资讯

