蘋果公司正式宣布,將深度參與2025年10月19日至23日在檀香山舉辦的國際計算機視覺大會(ICCV)。作為全球計算機視覺領域的頂級學術會議,ICCV每兩年與歐洲計算機視覺會議(ECCV)交替舉辦,重點探討該領域的前沿技術與關鍵挑戰。
此次參會,蘋果將通過多維度展示其研究成果。公司提交的八篇論文全部被大會收錄,涵蓋文本到視頻對齊評估、三維空間理解、多模態模型擴展規律等核心方向。具體研究包括:提出ETVA方法實現文本與視頻的細粒度對齊評估,探索MM-Spatial模型在三維空間理解中的潛力,以及研究原生多模態模型的擴展規律等。UniVG通用擴散模型、基于多模態提示的開放世界分割技術等成果也將亮相。
在學術交流層面,蘋果機器學習應用研究部經理C. Thomas博士將出席第三屆基于視覺的工業檢測研討會(VISION),并于10月19日發表主題演講。目前演講主題尚未公開,但預計將聚焦工業檢測領域的視覺技術創新。除技術展示外,蘋果研究人員Patricia Vitoria Carrera與Tanya Glozman還將參與"計算機視覺領域女性研討會",并在會后晚宴中擔任導師角色。
八篇入選論文的完整清單顯示,研究內容覆蓋生成模型、評估框架、空間理解等多個方向。其中,穩定擴散模型的隱性優勢研究、可擴展的文本圖像條件化視頻生成方法(STIV)、交互式數字智能體評估框架(UINavBench)等成果,體現了蘋果在計算機視覺與多模態學習領域的系統性布局。











