蘋果公司近日宣布,將派代表參加于2025年10月19日至23日在檀香山舉辦的國際計算機視覺大會(ICCV)。這一全球計算機視覺領域的頂級盛會,每兩年與歐洲計算機視覺會議(ECCV)交替舉行,致力于推動該領域的前沿研究與技術發展。
據悉,蘋果此次參會陣容強大,不僅將提交八篇高質量論文,還將在多個環節中深度參與。這些論文均經過嚴格篩選,成功入選大會的海報展示與口頭報告環節,內容覆蓋計算機視覺領域的多個關鍵方向。
八篇論文的具體研究主題包括:ETVA模型通過細粒度問答實現文本與視頻的精準對齊評估;MM-Spatial項目探索多模態大語言模型對三維空間的理解機制;以及關于原生多模態模型擴展規律的深入研究。研究還揭示了穩定擴散模型在視覺上下文學習中的隱性優勢,提出了STIV可擴展的文本與圖像條件化視頻生成方法,并構建了UINavBench交互式數字智能體綜合評估框架。其他成果還包括基于多模態提示的開放世界分割技術,以及UniVG通用擴散模型在圖像生成與編輯領域的創新應用。
在學術交流方面,蘋果機器學習應用研究部經理C. Thomas博士將作為主旨演講嘉賓出席第三屆基于視覺的工業檢測研討會(VISION)。其演講主題將于近期公布,具體時間定于10月19日。這場演講預計將引發業界對工業視覺檢測技術的深入討論。
除了技術展示與主旨演講,蘋果研究人員Patricia Vitoria Carrera與Tanya Glozman還將參與"計算機視覺領域女性研討會"的導師計劃。她們將在會后晚宴上與年輕學者展開交流,分享研究經驗與職業發展建議。














