科技流网
您的位置:科技流网 > 业界

360开源FG-CLIP2:登顶29项全球基准测试,重新定义视觉语言模型

阅读量:5359   添加时间:2025-11-04 08:00   内容来源:中国网   

360开源FG-CLIP2:登顶29项全球基准测试,重新定义视觉语言模型

近期,360集团低调开源的视觉语言对齐模型FG-CLIP2,在全球科技圈掀起热议。这款模型在涵盖长短文本图文检索、目标检测等在内的29项权威公开基准测试中,全面超越了科技巨头Google的SigLIP 2与Meta的MetaCLIP2,标志着中国在AI基础模型领域取得了又一突破性进展。

FG-CLIP 2性能雷达图

中文benchmark综合排名

从“看得见”到“看得清”:攻克AI视觉“细粒度”难题

如果说OpenAI在2021年提出的CLIP模型,为AI配上了一副能“看清世界”的普通眼镜;那么360的FG-CLIP2,则是为AI装备了一台“高精度光学显微镜”,使其能够“洞察入微”。它成功攻克了CLIP模型长期存在的“细粒度识别”痛点。

传统CLIP模型善于理解图像的全局概念,但在区分细微的物体属性、复杂的空间关系以及精准的语言表达时,往往力不从心。FG-CLIP2则实现了质的飞跃:它不仅能辨别出猫的具体品种,还能在遮挡情况下精准判断其状态;面对包含多个物体的复杂场景,其细节识别置信度仍高达96%。这种从“宏观”到“微观”的能力跃迁,是AI真正理解物理世界的关键一步。

FG-CLIP2效果案例

三大根本性创新,构筑技术护城河

在模型核心上,它实现了三大根本创新:第一,层次化对齐架构,让模型能像人眼一样,同时把握宏观场景与微观细节,实现从“看得见”到“看得清”的跨越。第二,动态注意力机制,使模型可以智能聚焦于图像关键区域,以最小算力代价换取精准的细节捕捉能力。第三,双语协同优化策略,从底层解决了中英文理解不平衡的难题,实现了真正的双语原生支持。

卓越的性能离不开强大的底层支撑。FG-CLIP2依托于自研的超大规模高质量数据集FineHARD。该数据集不仅包含详尽的全局描述和千万级的局部区域标注,还创新性地引入了由大模型生成的“难负样本”,极大地锤炼了模型的辨别能力。

在训练方法上,模型采用了革命性的两阶段策略。其关键的第二阶段摒弃了传统CLIP的“整体对整体”的粗放对齐模式,升级为“局部对局部”的精细对齐,这正是其实现细粒度理解的精髓所在。

通过这一系列紧密结合的技术创新,FG-CLIP2成功攻克了长期困扰行业的“细粒度识别”难题,并将其领先能力通过API等形式开放,赋能千行百业的智能化升级。

FG-CLIP2训练策略

告别“差不多”AI:细粒度视觉撬动产业新支点

FG-CLIP2的价值不仅在于实验室指标的领先,更在于其广泛而深远的行业应用潜力,推动AI从“感知”走向“认知”,从“可用”走向“好用”。

在电商领域,它能精准理解“白色蕾丝边、袖口有珍珠装饰的连衣裙”等复杂描述,实现“所想即所得”的精准搜索,彻底革新商品检索与推荐体验,减少退货率,直接提升商业转化。

在具身智能领域,它是机器人的“慧眼”,能精准执行“拿餐桌上的红色水杯”或“把玩具放进绿色收纳箱”等指令,通过精准识别物体属性与空间关系,让机器人在家庭、仓储等复杂场景中的操作成为可能。

此外,其能力同样赋能于AIGC内容生成、内容审核及安防监控等多个关键场景,通过洞察细节,确保生成内容的精准性、审核的可靠性以及安防检索的高效性,为各行各业的智能化升级奠定了坚实的视觉理解基石。

构建AI底层能力:360的AI长期主义

FG-CLIP2的技术突破并非偶然,而是360对AI底层能力的长期坚持。作为国内较早布局人工智能研究的企业,360人工智能研究院已持续深耕多模态领域多年。从21年起,在大模型方向上团队累计在ICML、NeurIPS、ICCV等顶级会议发表论文12篇,并在多项国际AI竞赛中夺冠。

此外,360依托浏览器、搜索、安全等丰富的业务生态,积累了百亿级的图文数据,并结合自研的大规模高质量数据集FineHARD,为训练FG-CLIP2这样的顶尖模型提供了独一无二的“数据燃料”。同时,强大的工程化能力确保了模型不仅在学术上领先,更能在实际业务中高效、稳定地运行,其推理速度达到同类模型的1.5倍。

此次开源FG-CLIP2,是360在AI基础模型领域的一次关键落子,其意义远不止于展示技术实力,更是为中国构建自主可控的AI技术体系,添上一块重要基石。

声明:本网转发此文章,旨在为读者提供更多信息资讯,所涉内容不构成投资、消费建议。文章事实如有疑问,请与有关方核实,文章观点非本网观点,仅供读者参考。

推荐内容
  • 果然就是战未来!锐龙5 9600X新补丁对比测试:14款游戏

    一、前言:新KB5041587补丁到底可以提升多少游戏性能!Zen5可以说是AMD多年来底层架构变化最大的处理器。根据AMD的说法,在制程工艺不变的情况,IPC提升幅度接近20%,游戏帧率也有10%左右的提升。不过等到锐龙9000处理器正式...

  • 140至186万元,红旗金葵花在北京展“国雅”风貌

    继广州车展正式上市后,红旗金葵花国雅的区域上市陆续进行,这次来到了北京。早在今年4月的北京车展上,红旗汽车发布了全新品牌——金葵花,并带来四款“国字号”产品:国礼、国雅、国耀、国悦,其中作为国产顶尖大型豪华轿车的金葵花国雅备受瞩目。随后在1...

  • 花10万块买一台手机值吗?华为Mate XT非凡大师三折叠全

    一、前言:花10万块买一台手机值吗?在这篇评测接近完稿的时候,我瞅了一眼华为官网的预约人数,已经超过了685万人。早先供应链多个渠道透露,华为MateXT非凡大师的备货量大约为100万台(首批)。这也意味着,9月20日10:08分正式开售之...

  • 稳定7100MB/s!雷克沙ARES 8TB SSD评测:机

    一、前言:机械硬盘在电脑中还有位置吗?如今的笔记本几乎全部默认预装SSD,大多数人装机也首选SSD,但对于有着大容量数据、稳健存储需求的用户而言,一块大容量机械硬盘仍是第一选择,毕竟其单位容量的成本远低于SSD。如今的SSD主流容量才1-2...

  • 23小时续航创造历史!华硕灵耀14 Air+酷睿Ultra

    一、前言:能效为王的酷睿Ultra200V系列处理器ARM平台的功耗远低于X86平台,ARM处理器笔记本(比如MacBookAir)的续航远高于X86+Windows笔记本!在我们看来,这些似乎就是理所当然、天经地义的事情,毕竟几十来年一直...

  • 600TB残酷写入测试!忆恒创源PBlaze7 7A40评测

    一、前言:性能全面领先的国产企业级PCIe5.0SSD一年前,我们曾测试过忆恒创源PBlaze779406.4TB,它是当时最强的企业级PCIe5.0SSD,不仅率先实现了10GB/s的顺序写性能,高达14GB/s的顺序读取速度也几乎完全榨...