中科视语提出工业异常检测大模型AnomalyGPT,实现零样本异常检测
工业异常检测是工业生产中不可或缺的一部分,然而现有的工业异常检测方法通常只能为测试样本提供异常分数,需要人工设定阈值以区分正常和异常样本,这限制了这些方法的实际应用场景。此外,现有的大模型在图像理解方面展现了卓越的能力,但是缺乏特定领域知识,而且对图像中局部细节的理解较弱,这导致这些大模型不能直接用于工业异常检测任务。
近日,中科视语和中国科学院自动化研究所的研究团队针对该问题提出了异常检测大模型AnomalyGPT。AnomalyGPT利用大模型的强大语义理解能力,通过精心设计的图像解码器和提示嵌入微调方法,能够让大模型充分理解工业场景图像,判断其中是否含有异常部分并指出异常位置,在少样本和无监督工业场景中取得了业内最好性能,有利于基础大模型的行业落地。
AnomalyGPT为了解决现有大模型缺乏特定领域知识和局部细节理解较弱这两个问题,设计了提示学习器和图像解码器两个模块,对现有的大模型进行训练调整,方法结构如下图所示:
1. 图像解码器:该模块参考多模态大模型的特征对齐思路,通过若干个线性投影层,将图像编码器所提取的由浅至深的中层特征与分别代表正常和异常语义的文本特征对齐。该结构能够提供异常区域分割的注意力图,通过将该注意力图输入到大模型中,能够指导大模型关注图像中异常概率较高的局部区域,为大模型提供视觉细节信息。
2. 提示学习器:该模块包含一个6层的卷积神经网络,用于将图像解码器输出的注意力图转化为大模型能够理解的提示嵌入向量,通过提示嵌入的方式对大模型进行微调,可以为大语言模型提供异常检测所需的领域知识,同时有效避免大模型产生灾难性遗忘问题。
此外,为了对大模型进行训练,研究团队还提出来使用基于泊松图像编辑的异常模拟方法来产生模拟异常数据,如下图所示,相比于传统的剪切拼接方法,泊松图像编辑模拟产生的异常更加自然,这进一步提高了AnomalyGPT方法的性能。
基于上述方法结构,AnomalyGPT研究团队在两个最权威的工业异常检测数据集 MVTec-AD和VisA上进行了实验,与现有少样本异常检测方法相比,AnomalyGPT取得了业内最先进的性能,实验结果如下表所示:
在无监督设置下,AnomalyGPT也取得了业内最高的性能,结果如下表所示:
下图展示了AnomalyGPT在一些实例上的异常检测和定位结果,与现有的大模型相比,AnomalyGPT在图像内容理解和异常检测与定位任务上都具有更好的表现:
AnomalyGPT 论文已经被人工智能顶级会议 AAAI 2024接收,论文预印版已发布于 Arxiv 上,并开源了相关代码和演示页面。
研究团队认为,现有的大模型在通用领域表现卓越,但是在工业、医学等专业领域的表现相对较弱,如何设计相应结构和方法,提高大模型的行业应用能力,是一个值得深入研究的问题。
- 外贸新手探索 WhatsApp拉群营销工具是如何激发我无尽好奇的
- WhatsApp全球拉群,ws协议号一键注册/ws群发策略/ws养号技巧
- tg群发助手,tg营销软件,获客成本低高效有效迅速联系天宇
- 我事业成功的最佳助力Telegram群发软件,品牌安全!Telegram群发云控保障您的推广进行
- 魔方网表,到底比传统excel服务器强在哪里?
- 宁夏构建西部医疗健康行业大模型生态,引领医疗创新与数字化转型
- 灵感闪现 创意绽放 WhatsApp拉群工具引爆你的推广创意想象力
- Instagram营销引流工具 - ins批量养号/ig自动登录/ins群发软件/ig引流群发
- 聚焦前沿技术,共筑智能未来 —— embedded world China上海国际嵌入式展六月即将开幕
- TPS2224ADBG4: Optimizing Power Management Efficiency with Dual Power-Distribution Switch | ChipsX
- 中科视语AI智慧平台助力干熄焦安全生产
- Instagram群发营销工具,ins全功能引流采集私信工具,ig博主推广
- 代写EECS 493、代做Java设计编程
- x增长的秘诀:LINE工具,数字化引擎的无敌之选!
- 通过Line协议号注册器营销工具的巧妙应用,她成功解决了群发受限的问题,实现了业务的群发新境界
- 喜报!铭泰慧谷科技企业孵化器入选河北省“工业诊所”名单,助力企业转型升级长远发展
- 中法绒情 恒久无限——恒源祥携手中国国际工艺创新博览会共促中法交流
- Morgan Stanley包容性风险投资实验室为规模最大、全球化程度最高的一批初创企业举办演示日活动
- COMP30023代做、代写C/C++设计编程
- 代写CSCI 1100、代做Bears, Berries and Tourists
推荐
- B站更新决策机构名单:共有 29 名掌权管理者,包括陈睿、徐逸、李旎、樊欣等人 1 月 15 日消息,据界面新闻,B站上周发布内部 科技
- 创意驱动增长,Adobe护城河够深吗? Adobe通过其Creative Cloud订阅捆绑包具有 科技
- 全力打造中国“创业之都”名片,第十届中国创业者大会将在郑州召开 北京创业科创科技中心主办的第十届中国创业 科技
- 丰田章男称未来依然需要内燃机 已经启动电动机新项目 尽管电动车在全球范围内持续崛起,但丰田章男 科技
- 升级的脉脉,正在以招聘业务铺开商业化版图 长久以来,求职信息流不对称、单向的信息传递 科技
- 疫情期间 这个品牌实现了疯狂扩张 记得第一次喝瑞幸,还是2017年底去北京出差的 科技
- 苹果罕见大降价,华为的压力给到了? 1、苹果官网罕见大降价冲上热搜。原因是苹 科技
- 智慧驱动 共创未来| 东芝硬盘创新数据存储技术 为期三天的第五届中国(昆明)南亚社会公共安 科技
- 老杨第一次再度抓握住一瓶水,他由此产生了新的憧憬 瘫痪十四年后,老杨第一次再度抓握住一瓶水,他 科技
- 如何经营一家好企业,需要具备什么要素特点 我们大多数人刚开始创办一家企业都遇到经营 科技