IBM 推出 Granite 3.0:专为企业打造的高性能AI模型
- 新推出的 Granite 3.0 8B 和 2B 模型,在宽松的 Apache 2.0 许可证下发布,在许多学术和企业基准测试中表现出强大的性能,能够超越或匹敌类似规模的模型。
- 新推出的 Granite Guardian 3.0 模型提供了 IBM 最全面的护栏功能,以推进安全且值得信赖的人工智能。
- 新推出的 Granite 3.0 专家混合模型(Mixture-of-Experts models)可实现极其高效的推理和低延迟,适用于基于 CPU 的部署和边缘计算。
- 全新的 Granite 时间序列模型在零样本/少样本预测中实现了最先进的性能,超越了大10倍的模型。
- IBM 推出了下一代基于 Granite 的 watsonx Code Assistant,适用于通用编码;在 watsonx.ai 中首次推出用于构建和部署 AI 应用程序和智能体(Agents)的新工具。
- 宣布 Granite 将成为 Consulting Advantage 的默认模型,这是一个由 AI 驱动的交付平台,IBM 的 160,000 名顾问使用该平台,可以更快地为客户提供新解决方案。
北京2024年10月22日 /美通社/ -- 在美国时间10月21日举行的IBM(纽约证券交易所代码:IBM)年度TechXchange大会上,IBM宣布推出其迄今为止最先进的AI模型家族——Granite 3.0。IBM的第三代Granite旗舰语言模型在许多学术和行业基准测试中均能超越或匹敌同类领先模型提供商的模型,展示出强大的性能、透明性和安全性。
IBM 推出 Granite 3.0:专为企业打造的高性能AI模型
与公司对开源 AI 的承诺一致,Granite 模型在宽松的 Apache 2.0 许可证下发布,它们凭借在性能、灵活性和自主性方面的独特组合能够为企业客户和整个社区提供服务。
IBM的Granite 3.0家族系列包括:
- 通用/语言模型:Granite 3.0 8B Instruct, Granite 3.0 2B Instruct, Granite 3.0 8B Base, Granite 3.0 2B Base
- 护栏与安全模型:Granite Guardian 3.0 8B, Granite Guardian 3.0 2B
- 专家混合模型:Granite 3.0 3B-A800M Instruct, Granite 3.0 1B-A400M Instruct, Granite 3.0 3B-A800M Base, Granite 3.0 1B-A400M Base
新款 Granite 3.0 8B 和 2B 语言模型被设计为企业级AI的"主力"模型,能够在检索增强生成(RAG)、分类、摘要、实体提取和工具使用等任务中提供强大的性能。这些紧凑的多功能模型旨在根据企业数据进行微调,并在各种业务环境或工作流程中无缝集成。
许多大型语言模型(LLM)是基于公开可用的数据进行训练的,绝大多数企业数据仍然未被利用。通过将小型 Granite 模型与企业数据相结合,特别是使用 IBM 和 RedHat 在五月推出的革命性对齐技术 InstructLab, IBM 相信企业可以实现与大型模型相媲美的特定任务性能,而成本只是其中的一小部分(基于在几个早期概念验证中观察到的成本比大型前沿模型低 3 到 23 倍的范围[i])。
Granite 3.0 版本的发布重申了 IBM 对建立 AI 产品透明度、安全性和信任的承诺。Granite 3.0 技术报告和负责任使用指南提供了用于训练这些模型的数据集描述,详细说明了所应用的过滤、清洗和处理步骤,并全面展示了模型在主要学术和企业基准测试中的性能结果。
至关重要的是,IBM 为 watsonx.ai 上的所有 Granite 模型提供知识产权赔偿,旨在增强企业客户将企业数据融入模型的信心。
提高标准:Granite 3.0 基准测试
Granite 3.0 语言模型在原始性能上也展示出良好的结果。
在 Hugging Face 的 OpenLLM 排行榜定义的标准学术基准测试中,Granite 3.0 8B Instruct 模型的整体性能平均领先于 Meta 和 Mistral 中类似大小的开源模型的最先进性能。在 IBM 的先进 AttaQ 安全基准测试中,Granite 3.0 8B Instruct 模型在所有测量的安全维度上均领先于 Meta 和 Mistral 的模型[ii]。
在检索增强生成(RAG)、工具使用和网络安全领域的核心企业任务中,Granite 3.0 8B Instruct 模型的平均表现优于Mistral 和 Meta 中类似规模的开源模型[iii]。
Granite 3.0 模型是在超过 12 万亿个标记上进行训练的,这些数据来自 12 种不同的自然语言和 116 种不同的编程语言,采用了一种新颖的两阶段训练方法,利用了数千个旨在优化数据质量、数据选择和训练参数的实验结果。到今年年底,预计 3.0 8B 和 2B 语言模型将支持扩展的 128K 上下文窗口和多模态文档理解能力。
IBM 展示了性能和推理成本的完美平衡,提供了其 Granite 专家混合(MoE)机构模型,Granite 3.0 1B-A400M 和 Granite 3.0 3B-A800M,这些较小且轻量级的模型可用于低延迟应用程序以及基于 CPU 的部署。
IBM 还宣布了其预训练 Granite 时间序列模型的更新版本,早期版本于今年早些时候发布。这些新模型在 3 倍的数据上进行训练,在所有三个主要时间序列基准测试中表现出色,超越了来自 Google、Alibaba 等公司 10 倍更大模型的性能。更新后的模型还提供了更大的建模灵活性,支持外部变量和滚动预测[iv]。
Granite Guardian 3.0:开启负责任AI的新时代
作为此次发布的一部分,IBM 还推出了一个新的 Granite Guardian 模型系列,允许应用程序开发人员通过检查用户提示和 LLM 响应来实施安全护栏,以发现各种风险。Granite Guardian 3.0、8B 和 2B 型号提供了当今市场上最全面的风险和危害检测功能。
除了社会偏见、仇恨、毒性、亵渎、暴力、越狱等危害维度外,这些模型还提供了一系列独特的检索增强生成(RAG)特定检查,如基于事实性、上下文相关性和答案相关性。在针对 19 项安全性和 RAG 基准的广泛测试中,Granite Guardian 3.0 8B 模型在危害检测方面的整体准确性平均高于 Meta 的所有三代 Llama Guard 模型。它在幻觉检测方面的整体性能也与专门的幻觉检测模型 WeCheck 和 MiniCheck 相当[v]。
虽然 Granite Guardian 模型派生自相应的 Granite 语言模型,但它们可以与任何开放或专有的 AI 模型一起使用,以实施安全保护措施。
Granite 3.0 模型的可用性
整个 Granite 3.0 模型套件和更新的时间序列模型都可以在 HuggingFace 上根据宽松的 Apache 2.0 许可证下载。新的 Granite 3.0 8B 和 2B 语言模型的指令(instruct)变体以及 Granite Guardian 3.0 8B 和 2B 模型现已在 IBM 的 watsonx 平台上提供商业用途。部分 Granite 3.0 模型也将作为 NVIDIA NIM 微服务提供,并通过 Google Cloud 的 Vertex AI Model Garden与 HuggingFace 的集成提供。
为给开发者提供多种选择和易用性,并支持本地和边缘部署,一套精选的 Granite 3.0 模型也可在 Ollama 和 Replicate 上获得。最新一代 Granite 模型扩展了 IBM 强大的开源 LLM 目录。IBM 与 AWS、Docker、Domo、Qualcomm Technologies, Inc.(通过其 Qualcomm® AI Hub)、Salesforce、SAP 等生态系统合作伙伴合作,将多种 Granite 模型集成到这些合作伙伴的产品中,或在他们的平台上提供 Granite 模型,为全球企业提供更大的选择空间。
从助理(Assistants)到智能体(Agents):实现企业级AI 的未来
IBM 正在通过一系列技术推进企业级AI的发展,从模型和助理 (Assistants),到为公司独特的数据和用例调优和部署 AI 所需的工具。IBM 还在为未来能够自我导向、反思并在动态商业环境中执行复杂任务的 AI 智能体(AI agents)铺平道路。
IBM 不断发展其 AI 助理(Assitants)技术组合,从帮助公司通过低代码工具和自动化构建自己的助理的watsonx Orchestrate,到用于特定任务和领域(如客户服务、人力资源、销售和营销)的各种预构建助理。全球各地的组织已经使用 watsonx Assistant 帮助他们构建 AI 助理,用于回答客户或员工的日常问题、实现大型机和传统 IT 应用程序现代化、帮助学生探索潜在的职业路径,或为购房者提供数字抵押贷款支持等任务。
IBM 还公布了即将发布的下一代 watsonx Code Assistant,该版本由 Granite 代码模型提供支持,能够为 C、C++、Go、Java 和 Python 等语言提供通用编码辅助,并为企业级 Java 应用程序[vi]提供高级应用程序现代化功能。Granite 的代码功能现在也可以通过 Visual Studio Code 扩展程序 IBM Granite.Code访问。
IBM 还计划发布新工具来帮助开发人员,利用watsonx.ai 更高效地构建、定制和部署 AI,包括代理框架、与现有环境的集成以及用于常见用例(如 RAG 和智能体)的低代码自动化[vii]。
IBM 专注于开发具有更高自主性、复杂推理能力和多步骤问题解决能力的 AI 智能体(AI Agents)技术。Granite 3.0 8B 模型的初始版本支持关键的智能体功能,如高级推理和用于实现工具使用工作流程的高度结构化聊天模板和提示风格。IBM 还计划在 IBM watsonx Orchestrate 中引入新的 AI 智能体聊天功能,利用智能体功能协调 AI 助理、技能和自动化,帮助用户提高整体的团队生产力[viii]。IBM 计划在 2025 年继续在其产品组合中构建智能体功能,包括为特定领域和用例预构建的智能体。
扩展的 AI 驱动的交付平台,以 AI 增强 IBM 顾问的能力
IBM 还宣布大幅扩展其 AI 驱动的交付平台 IBM Consulting Advantage。该多模型平台包含 AI 智能体、应用程序和方法(如可重用的框架),赋能 16 万名 IBM 顾问,以更低的成本、更好更快地为客户提供价值。
作为扩展的一部分,Granite 3.0 语言模型将成为 Consulting Advantage 的默认模型。借助 Granite 的性能和效率, IBM Consulting 将能够帮助最大限度地提高 IBM 客户的生成式 AI 项目的投资回报。
扩展的另一个关键部分是引入 IBM Consulting Advantage for Cloud Transformation and Management 和 IBM Consulting Advantage for Business Operations。每一项都包括特定领域的 AI 智能体、应用程序和融合了 IBM 最佳实践的方法,使 IBM 顾问能够帮助客户加速云和 AI 转型任务(如代码现代化和质量工程),或跨领域(如财务、人力资源和采购)实施转型和运营。
- 必品阁全球标志正式焕新,一起感受好吃好生活
- Avalanche Dog 2.0:全新Mammut Barryvox® S2
- 宏工科技全方位布局电池产业链,推动绿色、可持续发展
- 威斯津生物的全球首款EB病毒相关肿瘤mRNA治疗性疫苗,获国家批准开展临床试验
- 2024中国互联网综合实力百强企业发布,白山云科技再度入选!
- 国家标准《电子采购交易规范 非招标方式》发布,北京筑龙参与起草并出席宣贯会议
- 达信携手亚马逊及六家专业保险机构推出全新商业综合责任险投保平台
- 科华数能获颁TÜV南德德国中高压并网产品认证证书
- 东莞市棋盛金属制品有限公司——为客户提供钟表后盖高端解决方案
- 金山软件公布2023年全年及第四季度业绩
- 耀中耀华“共探幼教实践之路”研讨会暨《耀中幼教教学法》发布仪式在京举行
- 灿谷公布2023年四季度和全年未经审计财报
- HC 2024华为全新升级星河AI园区网络,跃升企业数智生产力
- 解密湖南省康宸新材料有限公司全屋整装让您感受到东方的雅奢韵味
- 科华数据与锅圈签署战略合作协议,共同打造智慧社区央厨基础设施
- 《安邸AD》五月刊,探寻班兰十年间非匀速前进
- 自由全球将从华纳兄弟探索公司手中收购FE电动方程式股权
- 麦德龙荣膺 FSSC22000 认证,铸就食品安全卓越典范
- 沙特阿拉伯工业和矿产资源部邀请矿业公司加入第7轮许可回合
- 汤臣倍健发布2024半年报,产品创新升级布局科学营养
- 大家保险积极组织全辖开展"普惠金融推进月"行动
- DEKRA德凯苏州400KW逆变器实验室正式落成
- 2024中国(杭州)户外露营生活展创意开幕
- 软通计算荣膺"2023-2024年度政府框架协议采购首选PC品牌"
- 微众银行即将参展"第二十六届中国国际高新技术成果交易会"
- Penfolds奔富携手品牌代言人段奕宏,演绎 「无界•超越」全新品牌形象大片
- 再鼎医药公布 2024 年第二季度财务业绩和近期公司进展
- ManageEngine卓豪方案丨破解云监控难题:如何突破云的复杂性,实现高效资源利用
- 麦迪森龙年首场古巴产品致敬拍卖已开放网络预投标
- Zdeněk Sobotka 旗下的 SOLEK 正建造最大的太阳能发电厂, 每年产生近 200 GWh 的绿色能源