在人工智能領域競爭日益激烈的當下,當眾多企業仍在聚焦大模型參數規模的比拼時,360公司另辟蹊徑,在AI視覺識別能力上實現了重大突破。其最新推出的FG-CLIP2視覺語言模型,憑借對圖像細節的精準捕捉與深度理解,在全球同類模型中脫穎而出,多項測試成績超越谷歌、meta等國際科技巨頭的同類產品,成為當前全球性能最強的視覺語言模型。
FG-CLIP2模型的核心優勢在于攻克了“細粒度識別”這一技術難題。該模型能夠精準識別圖像中的微小差異和復雜細節,例如區分不同品牌、型號的電子產品,或識別人物面部表情、服飾配飾等細微特征。這一突破為具身智能和商業智能化應用開辟了新的可能性。以家庭服務機器人為例,搭載FG-CLIP2的機器人可以準確理解“拿起茶幾上屏幕有裂痕的手機”這類復雜指令;在安防領域,系統能夠通過“尋找戴黑色鴨舌帽的可疑人員”的描述快速鎖定目標,大幅提升實際應用效率。
這一成果的取得,源于360公司在AI領域的長期積累。作為國內較早布局人工智能的企業,360依托搜索、瀏覽器等核心業務,積累了超過百億級的圖文數據資源。同時,公司自主研發了大規模高質量數據集FineHARD,為模型訓練提供了豐富的素材支持。通過持續深耕AI底層技術,360不僅推動了自身技術能力的提升,更為中國構建自主可控的AI技術體系作出了重要貢獻。
在中文benchmark綜合排名中,FG-CLIP2模型的表現尤為突出。其超越國際競爭對手的成績,標志著中國企業在視覺語言模型領域已達到世界領先水平。這一突破不僅提升了中國AI技術的國際影響力,也為相關行業的智能化轉型提供了強有力的技術支撐。











