IBM 推出Granite 3.2:全新企业级多模态及推理的AI模型
- Granite 3.2是小型的 AI 模型,通过对开发人员友好的授权条款,提供推理、视觉和护栏功能
- 更新后的 Granite 时间序列模型可提供长期预测,参数少于10M;适用于金融与经济趋势分析、供应链需求预测,以及零售业的季节性库存规划等用例
北京, 2025年3月4日 /美通社/ -- IBM于2月底推出其 Granite 大型语言模型家族的最新一代产品 Granite 3.2,持续推动小型、高效、企业专用的 AI,为实际应用创造效益。
IBM 推出 Granite 3.2 大语言模型,体现 IBM 发展企业专用、小型、高效与实用 AI 的策略。
所有 Granite 3.2 模型均采用宽松的 Apache 2.0 开源授权条款,可在 Hugging Face 下载。部分模型现已在 IBM watsonx.ai、Ollama、Replicate 和 LM Studio 上提供,预计不久将支援 RHEL AI 1.5,为企业与开源社区注入更强大的 AI 能力。
主要亮点
- 全新视觉语言模型:专为理解文件任务而设计,在关键企业基准测试 DocVQA、ChartQA、AI2D 和 OCRBench[1] 中,表现可媲美甚至超越更大规模的模型(如 Llama 3.2 11B 和 Pixtral 12B)。除了强大的训练数据外,IBM 也利用其开源 Docling 工具包处理8千5百万份 PDF 文件,并生成2千6百万个合成问答配对,提升视觉语言模型在处理大量文件工作流时的能力。
- 增强推理功能:Granite 3.2的2B与8B模型加入了「思维链」(Chain of Thought,CoT)推理机制,且使用者可以开启或关闭推理功能以优化效率。通过这项能力,8B 模型在 ArenaHard 和 Alpaca Eval 等指令遵循基准测试中的表现[2],比前一代优异比例达到两位数,且不影响其他领域的安全性或性能。此外,通过创新的推理扩展方法,Granite 3.2 8B 模型可以调整至接近 Claude 3.5 Sonnet 或 GPT-4o 在数学推理基准(如 AIME2024 和 MATH500[3])上的表现。
- Granite Guardian 安全模型更轻巧:在保持 Granite 3.1 Guardian 模型性能的同时,模型尺寸减少三成。此外,Granite 3.2 系列还引入了语言化信心评估(Verbalized Confidence)新功能,可提供更精细的风险评估,帮助安全监测系统识别不确定性。
IBM 持续推动企业专用的小型 AI 模型策略,并已在测试中展现高效能。例如,Granite 3.1 8B 模型在 Salesforce 大型语言模型CRM基准测试中获得高分,显示其在实际应用中的准确度和可靠性。
IBM Granite 模型家族拥有广大的合作伙伴生态体系,许多领先的软件公司已将Granite模型嵌入其技术。Granite 3.2 是 IBM 在推动企业专用小型 AI 方面的重要进展,体现了 IBM 致力于提供小型、高效、实用 AI 的产品策略。
CrushBank 首席技术官 David Tan 表示:"在 CrushBank,我们亲眼目睹了 IBM 开放、高效的人工智能模型如何为企业人工智能带来真正的价值--在性能、成本效益和可扩展性之间实现适当的平衡。Granite 3.2 通过新的推理功能更进一步,我们很高兴能在构建新的代理(智能体)解决方案时探索这些功能。"
Granite 3.2 是 IBM 产品组合和战略发展的重要一步,旨在为企业提供小型实用的 AI。虽然思维链在推理任务中表现强大,但它需要大量计算资源,并非所有任务都必须启用。因此,IBM 在 Granite 3.2 模型中加入了程式化开关功能,使用者可以根据需求开启或关闭推理模式;模型可在不启用推理的情况下运行较简单的任务,以降低不必要的计算成本。
此外,其他推理技术(例如推理扩展 Inference Scaling) 已显示 Granite 3.2 8B 模型能够在标准数学推理基准测试中,媲美甚至超越更大模型的性能。持续发展这项推理技术也是 IBM 研究团队的重点方向[4],以进一步提升 AI 的效能与应用范围。
除了 Granite 3.2 的指令、视觉和防护模型之外,IBM 也推出了新一代 TinyTimeMixers(TTM)时间序列模型,这些模型的参数少于1千万,具备长期预测能力,可进行长达两年的长期预测。这些模型为长期趋势分析提供强大工具,适用于金融与经济趋势分析、供应链需求预测,以及零售业的季节性库存规划。
IBM AI 研究副总裁 Sriram Raghavan 表示:"AI 的下一个时代将聚焦效率、整合与实际应用的影响力 — 企业应该能够在不过度消耗计算资源的情境下,取得强大的 AI 效益。IBM 最新的 Granite 模型发展专注于开放式解决方案,逐步推动 AI 的普及,使其更具成本效益,为现代企业创造更大价值。"
欲了解Granite 3.2 的技术细节,请参阅相关技术文章。
- 软通动力ESG重大突破:首获深交所国证最高AAA评级
- 诺和新元第一季度按预期实现了4%的有机销售额增长 合并持续推进
- 北京科技大学"立邦奖学金"颁发, 校企携手共促高质量人才培养
- Mobileye北京技术展及首次城区NOP试驾体验完美收官
- Amazon Bedrock推出全新功能 助力数万客户构建和扩展安全的生成式AI应用程序
- 北京市级政府引导基金领投!量子计算产业链长企业玻色量子获A+轮融资
- 裸心再出新花样 轻度假品牌"naked Home裸心隐乡"焕新亮相
- 立邦创始人吴清亮:事业有成反哺家乡 初心不忘建设祖国
- 首届"湾芯展"蓄势待发 彰显湾区半导体产业"芯"势力
- Venture Global 宣布推出最先进的液化天然气船队
- 精准高效的NEVTec新能源汽车技术创新与应用大会5月亮相"苏锡常"
- 映恩生物和BioNTech在2024 ESMO Asia大会上公布了B7H3 ADC (DB-1311/BNT324)在晚期实体瘤患者中积极的研究数据
- 首发官宣|妙盈科技成为CDP中国首位全球金牌官方合作伙伴
- AUTOMOBILI PININFARINA 打造定制版双子超跑
- PhotonPay光子易与Coshine开先软件达成合作,共同优化全球支付体验
- 厚植品牌优势,铸就行业标杆 水星家纺荣膺上海市品牌引领标杆企业
- 信念医药与AskBio达成战略合作共同探索创新基因疗法潜力
- 花茶相伴,暖冬驱郁:A.O. 史密斯冷热即饮净水机助你畅享纯净健康生活
- 澎湃新闻携手复旦大学、默沙东中国启动"美好共建计划校园行"活动
- 呋喹替尼获欧洲药品管理局CHMP积极意见用于结直肠癌
- 大牌祛魅,自牌向上,ALDI奥乐齐悠白打造值得信赖的零售乳品自牌
- 钱泳辰惊喜现身北大夫妇直播间 携手花皙蔻开启38女神节
- 企云方受邀加入电科金仓“金兰组织”,推动国产化价值替代
- 持续关注 撒播希望丨牡丹夫妇携手花皙蔻回访天贵希望小学
- Gallotti&Radice惊艳亮相 2024 年米兰国际家具展
- Syntax Systems收购Argon Supply Chain Solutions
- 知名网球运动员 - 梅德韦杰夫、德米纳尔和博尔特正和他们的新教练约翰•麦肯罗(80年代)一起训练
- 富卫集团公布2024年第一季度稳健业绩
- C-Crete Technologies在曼哈顿超高层建筑浇筑全球首个无硅酸盐水泥和二氧化碳排放的花岗岩混凝土
- 低碳前行,西门子金融服务共协力、促转型
推荐
-
我们时常把创业想得太过简单,认为获得成功轻而易举 我们时常把创业想得太过简单,认为获得成功 财商
-
日股盘中再破34年新高,今年还涨得动吗? 今年日股开局强势,1月5日以来开启连涨行情,日 财商
-
春节将至,抢票再次成为广大网友关注的热门话题 春节将至,抢票再次成为广大网友关注的热门话 财商
-
供应“安全感”超过红海“危机感”?欧洲天然气价格大跌 虽然冬季极寒天气来临,而且卡塔尔似乎已经暂 财商
-
为何娃哈哈纯净水线上会卖断货? 随着网络上关于娃哈哈和农夫山泉之争的持续 财商
-
娃哈哈这艘商业巨舰将驶向何方,我们试目以待 2月25日,娃哈哈集团在官网发布讣告,娃哈哈创 财商
-
广东省药监局调研恒昌医药集团,聚焦药品流通产业高质量发展 日前,广东省药品监督管理局党组成员、副 财商