阿里巴巴旗下的夸克AI超級框近期推出了名為“拍照問夸克”的全新功能,該功能借助前沿的視覺理解和思考推理技術(shù),旨在為用戶解答現(xiàn)實(shí)世界中遇到的各種難題。
面對復(fù)雜多變的物理世界,用戶常常難以用文字精準(zhǔn)描繪所見之物,尤其是在面對復(fù)雜圖形、表格或特定物體時(shí)。夸克新推出的“拍照問夸克”功能,則通過高精度圖片識別技術(shù),深入理解用戶需求,快速聯(lián)想并提供精準(zhǔn)答案。
該功能的應(yīng)用場景極為廣泛,用戶在拍照搜索文物時(shí),夸克不僅能識別文物本身,還能自動關(guān)聯(lián)其歷史背景;上傳商品圖片,則能一鍵跳轉(zhuǎn)至淘寶同款商品鏈接。無論是人物、動植物、建筑、風(fēng)景、美食、藝術(shù)品、外文資料還是故障代碼,夸克都能在極短時(shí)間內(nèi)完成識別并提供相關(guān)信息。
“拍照問夸克”不僅限于簡單的識別,它還整合了搜索、掃描、修圖、翻譯、創(chuàng)作等多種功能,為用戶提供了一個(gè)統(tǒng)一的入口。面對復(fù)雜圖像,用戶甚至可以一次性上傳多達(dá)10張圖片,夸克將進(jìn)行深度推理,幫助用戶完成各類復(fù)雜任務(wù)。
夸克目前擁有超過100個(gè)專業(yè)Agent和原子能力,覆蓋了搜索、健康、學(xué)習(xí)、旅游、商品、創(chuàng)作等多個(gè)領(lǐng)域。在旅行中,用戶可以通過“拍照問夸克”獲取文物的詳細(xì)講解和景點(diǎn)攻略;在工作中,它能輔助用戶分析數(shù)據(jù)圖表、優(yōu)化代碼邏輯,并自動生成工作總結(jié)文檔;在健康領(lǐng)域,用戶上傳體檢報(bào)告后,夸克還能提供指標(biāo)異常分析和康復(fù)建議。
“拍照問夸克”在娛樂場景中也表現(xiàn)出色,它支持棋牌指導(dǎo)、截圖找劇、情頭配對等趣味功能,還能一鍵完成高清化、去水印、原文溯源等操作。同時(shí),該功能支持多種語言的提問和翻譯解讀,進(jìn)一步提升了用戶體驗(yàn)。