滾動(dòng)資訊

當(dāng)前位置：首頁(yè) > 資訊 > 手機(jī)快報(bào) > 正文內(nèi)容

蘋果發(fā)布FastVLM視覺語(yǔ)言模型，加速智能穿戴設(shè)備本地化AI進(jìn)程

時(shí)間：2025-05-13 18:54:01 來(lái)源：ITBEAR編輯：快訊團(tuán)隊(duì) 發(fā)表評(píng)論無(wú)障礙通道

蘋果機(jī)器學(xué)習(xí)團(tuán)隊(duì)近日在GitHub平臺(tái)上震撼發(fā)布并開源了一款名為FastVLM的視覺語(yǔ)言模型，這款模型是蘋果自研技術(shù)的又一力作。FastVLM提供了三種不同規(guī)模的版本，分別是0.5B、1.5B和7B，全部基于蘋果特有的MLX框架構(gòu)建，并通過(guò)LLaVA代碼庫(kù)進(jìn)行了深度訓(xùn)練。尤為FastVLM針對(duì)Apple Silicon設(shè)備進(jìn)行了優(yōu)化，旨在提升端側(cè)AI運(yùn)算的效率。

FastVLM的核心組件是一個(gè)創(chuàng)新的混合視覺編碼器，名為FastViTHD。這款編碼器專為處理高分辨率圖像而設(shè)計(jì)，旨在實(shí)現(xiàn)高效的VLM性能。據(jù)官方數(shù)據(jù)顯示，F(xiàn)astViTHD的處理速度相較于同類模型提升了3.2倍，而其體積僅為前者的3.6分之一。這一顯著的性能提升得益于其減少的令牌輸出量和大幅縮短的編碼時(shí)間。

技術(shù)文檔揭示，F(xiàn)astVLM不僅保持了高精度，還實(shí)現(xiàn)了高分辨率圖像處理的近實(shí)時(shí)響應(yīng)，同時(shí)所需的計(jì)算量遠(yuǎn)低于同類模型。特別是最小版本FastVLM-0.5B，其首詞元響應(yīng)速度比LLaVA-OneVision-0.5B模型快了85倍，而視覺編碼器的體積更是縮小了3.4倍。當(dāng)與Qwen2-7B大語(yǔ)言模型搭配使用時(shí)，F(xiàn)astVLM使用單一的圖像編碼器即可超越Cambrian-1-8B等近期的研究成果，首詞元響應(yīng)速度提升了7.9倍。

蘋果技術(shù)團(tuán)隊(duì)表示，F(xiàn)astVLM的開發(fā)是基于對(duì)圖像分辨率、視覺延遲、詞元數(shù)量以及LLM大小的全面效率分析。該模型在延遲、模型大小和準(zhǔn)確性之間找到了最佳的平衡點(diǎn)。這一技術(shù)的潛在應(yīng)用場(chǎng)景指向了蘋果正在積極研發(fā)的智能眼鏡類穿戴設(shè)備。據(jù)多方消息透露，蘋果計(jì)劃在2027年推出與meta Ray-Bans相媲美的AI眼鏡，并可能同期發(fā)布配備攝像頭的設(shè)備。

FastVLM的本地化處理能力為這類設(shè)備提供了有力的支持，使它們能夠在脫離云端的情況下實(shí)現(xiàn)實(shí)時(shí)視覺交互。MLX框架的引入，使得開發(fā)者能夠在Apple設(shè)備上本地訓(xùn)練和運(yùn)行模型，同時(shí)兼容主流的AI開發(fā)語(yǔ)言。FastVLM的推出，無(wú)疑證實(shí)了蘋果正在構(gòu)建一個(gè)完整的端側(cè)AI技術(shù)生態(tài)系統(tǒng)。

舉報(bào) 0 收藏 0 打賞 0評(píng)論 0

更多>同類資訊

全屏API成漏洞，新型網(wǎng)絡(luò)釣魚攻擊悄無(wú)聲息盜信息

06-03

realme真我C71海外亮相：紫光展銳T7250加持，售價(jià)約1105元起

06-03

臺(tái)積電2納米制程投產(chǎn)在即，晶圓代工價(jià)格飆升至21.6萬(wàn)人民幣

06-03

多鄰國(guó)：游戲化學(xué)習(xí)風(fēng)靡，AI驅(qū)動(dòng)能否持續(xù)引領(lǐng)語(yǔ)言教育新風(fēng)潮？

不過(guò)，一位線上英語(yǔ)老師告訴Tech星球，“AI在線上語(yǔ)言學(xué)習(xí)平臺(tái)的應(yīng)用很常見，但大都局限于AI技術(shù)分析用戶的學(xué)習(xí)數(shù)據(jù)，動(dòng)態(tài)調(diào)整學(xué)習(xí)內(nèi)容等方面。” 但對(duì)多鄰國(guó)而言，真正的挑戰(zhàn)或許并非課程深度不足，畢竟其商業(yè)?！?/div>

06-03

華為Pura 80系列官宣在即，影像旗艦新成員售價(jià)或超五千

06-03

伊夫與鮑威爾·喬布斯共話OpenAI神秘硬件：能否引領(lǐng)科技向善？

06-03

谷歌Pixel 10系列手機(jī)8月20日發(fā)布，Pixel Watch 4或?qū)⑼_(tái)亮相

06-03

臺(tái)積電美廠將滿負(fù)荷生產(chǎn)，AI芯片量產(chǎn)在即，蘋果成最大贏家？

06-03

谷歌Gemini Live登iOS美區(qū)，體驗(yàn)AI識(shí)屏識(shí)物新功能

06-03

三星攜手英內(nèi)政部，力推Galaxy手機(jī)多重防盜功能保安全

06-03

蘋果WWDC2025開發(fā)者大會(huì)預(yù)熱：6月10日，新系統(tǒng)命名將有大變革？

6月2日，蘋果官方發(fā)文“定了，6月10日一起開眼”，為即將在6月10日凌晨1點(diǎn)召開的WWDC25開發(fā)者大會(huì)預(yù)熱。據(jù)此前報(bào)道，下一個(gè)蘋果系統(tǒng)將按年份標(biāo)識(shí)，而不是版本號(hào)。知情人士表示，這意味著iOS 19將命名…

06-03

電競(jìng)級(jí)性能只需兩千？一加ACE 5至尊版“電競(jìng)?cè)尽闭鸷硜?lái)襲！

06-03

蘋果寫作工具變身聊天機(jī)器人？提示詞注入法揭秘AI新玩法

06-03

微軟Win11 Beta版再更新，新增快速恢復(fù)等功能體驗(yàn)升級(jí)

06-03

蘋果中國(guó)官網(wǎng)上架M2 iPad Air翻新版，最高直降近兩成！

06-03

點(diǎn)擊查看更多 +

全站最新

油價(jià)又要漲了？6月3日起加滿一箱油或貴3元

驍龍X2 Elite來(lái)襲：18核設(shè)計(jì)，內(nèi)存上限64GB，性能再升級(jí)？

蔚來(lái)“黑科技”救急！車主高速打盹，車輛自主安全?？?/a>

微軟緊急發(fā)布KB5062170補(bǔ)丁，專治Win11系統(tǒng)更新錯(cuò)誤

全屏API成漏洞，新型網(wǎng)絡(luò)釣魚攻擊悄無(wú)聲息盜信息

長(zhǎng)安汽車5月銷量大增，新能源車銷量近十萬(wàn)輛，增長(zhǎng)70%！

熱門內(nèi)容

本欄最新

全屏API成漏洞，新型網(wǎng)絡(luò)釣魚攻擊悄無(wú)聲息盜信息

realme真我C71海外亮相：紫光展銳T7250加持，售價(jià)約1105元起

臺(tái)積電2納米制程投產(chǎn)在即，晶圓代工價(jià)格飆升至21.6萬(wàn)人民幣

多鄰國(guó)：游戲化學(xué)習(xí)風(fēng)靡，AI驅(qū)動(dòng)能否持續(xù)引領(lǐng)語(yǔ)言教育新風(fēng)潮？

華為Pura 80系列官宣在即，影像旗艦新成員售價(jià)或超五千

伊夫與鮑威爾·喬布斯共話OpenAI神秘硬件：能否引領(lǐng)科技向善？

本網(wǎng)站LOGO小熊標(biāo)志受版權(quán)保護(hù)，版權(quán)登記號(hào)：魯作登字-2015-F-025467，未經(jīng)ITBEAR官方許可，嚴(yán)禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無(wú)障礙技術(shù)由太陽(yáng)灣捐增，為閱讀障礙用戶提供內(nèi)容聽讀服務(wù)。如本站內(nèi)容侵犯了您的權(quán)利，請(qǐng)通知我們及時(shí)刪除。
中國(guó)（山東）自由貿(mào)易試驗(yàn)區(qū) 魯ICP備11015305號(hào)-1 商業(yè)合作入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

主站蜘蛛池模板：毕节市| 蒙自县| 姜堰市| 三门县| 个旧市| 丁青县| 中牟县| 水城县| 玉溪市| 青岛市| 苏尼特左旗| 凤阳县| 阳泉市| 双柏县| 兴安县| 精河县| 房山区| 灵山县| 汉中市| 特克斯县| 新乡县| 监利县| 昆山市| 茂名市| 汤原县| 芒康县| 通榆县| 武宁县| 阳春市| 泸州市| 庆云县| 鄂州市| 梓潼县| 秭归县| 资源县| 化德县| 灌云县| 临猗县| 达尔| 温州市| 修文县|

日本精品一区二区三区高清 久久

蘋果發(fā)布FastVLM視覺語(yǔ)言模型，加速智能穿戴設(shè)備本地化AI進(jìn)程

日本精品一区二区三区高清久久