蘋果攜手南京大學(xué)及香港科技大學(xué),近期公布了一項(xiàng)令人矚目的技術(shù)成果——Matrix3D AI模型。這款模型憑借其卓越的3D重建技術(shù),為用戶帶來(lái)了前所未有的便捷體驗(yàn)。僅需三張照片,無(wú)論是物體還是環(huán)境,Matrix3D都能迅速生成詳盡的3D模型。
Matrix3D在3D重建領(lǐng)域取得了關(guān)鍵性的技術(shù)革新。傳統(tǒng)的攝影測(cè)量技術(shù)往往需要將圖像分割處理,分別進(jìn)行姿態(tài)估計(jì)、深度預(yù)測(cè)等多個(gè)步驟,這一過(guò)程不僅繁瑣,而且容易導(dǎo)致誤差累積。相比之下,Matrix3D采用了一種創(chuàng)新的整合架構(gòu),將圖像、相機(jī)參數(shù)(諸如角度、焦距)及深度數(shù)據(jù)等信息融合處理。這一設(shè)計(jì)極大簡(jiǎn)化了重建流程,提高了效率,同時(shí)也顯著減少了人為誤差。
在訓(xùn)練策略方面,Matrix3D汲取了Transformer模型的先進(jìn)理念,引入了掩碼學(xué)習(xí)方法。這一方法類似于ChatGPT早期訓(xùn)練中的“填空”策略,通過(guò)在訓(xùn)練數(shù)據(jù)中隨機(jī)隱藏部分信息,促使模型學(xué)會(huì)自我推斷和補(bǔ)全。這種訓(xùn)練模式不僅增強(qiáng)了模型的適應(yīng)能力,還使其在面對(duì)小規(guī)模或不完整數(shù)據(jù)集時(shí),依然能夠準(zhǔn)確捕捉關(guān)鍵特征,實(shí)現(xiàn)高質(zhì)量的3D重建。
Matrix3D的這一系列創(chuàng)新,不僅提升了3D重建的效率與準(zhǔn)確性,更為相關(guān)領(lǐng)域的研究與應(yīng)用開(kāi)辟了新的道路。無(wú)論是文化遺產(chǎn)的數(shù)字化保護(hù),還是虛擬現(xiàn)實(shí)技術(shù)的進(jìn)一步拓展,Matrix3D都展現(xiàn)出了巨大的應(yīng)用潛力。