日本精品一区二区三区高清 久久

ITBear旗下自媒體矩陣:

仿生人臉機(jī)器人視頻背后:首形科技完成新一輪融資

   時間:2025-06-26 15:07:09 來源:Z Potentials編輯:快訊團(tuán)隊 IP:北京 發(fā)表評論無障礙通道

據(jù)ZP獨(dú)家獲悉,首形科技正式宣布完成新一輪融資,由招商局創(chuàng)投、深創(chuàng)投共同領(lǐng)投,五源資本、潯商創(chuàng)投跟投。此前天使輪投資人為德迅投資、奇績創(chuàng)壇、Taihill、智元機(jī)器人。不久前,由其創(chuàng)始人發(fā)布的一段“仿生機(jī)器人睜眼、緩緩微笑”的視頻在社交平臺爆紅。這段喚醒場景被大量轉(zhuǎn)發(fā)、引用,評論區(qū)不乏“感覺已經(jīng)沒有恐怖谷了!”、“感覺她眼睛里有光”這樣的評價。

很難用一個簡單的詞匯去總結(jié)首形帶來了什么,但多數(shù)人從這段視頻中感受到了前所未有的真實(shí)感——精細(xì)的人臉模型、流暢的微表情、真實(shí)合理的情緒互動;以及巨大的市場潛力——當(dāng)機(jī)器人逼真至能夠引發(fā)人的真實(shí)情感波動,那些曾經(jīng)只在科幻小說中才存在的場景似乎已不再遙遠(yuǎn)。

哥大博士胡宇航:喚醒機(jī)器人“自我”的創(chuàng)造者

胡宇航,首形科技創(chuàng)始人,哥倫比亞大學(xué)博士,美國自然科學(xué)基金會人工智能研究所項目成員,長期研究機(jī)器人自我建模、自主認(rèn)知與類人交互系統(tǒng)等方向。不同于傳統(tǒng)機(jī)器人研究者從提供生產(chǎn)力的角度出發(fā),他試圖更進(jìn)一步解答一個更本質(zhì)的問題:機(jī)器人是否能夠像人一樣理解自身、理解他人,并通過自我學(xué)習(xí)走向具身智能。

在博士階段,他于機(jī)器人頂刊Nature Machine Intelligence及Science Robotics連續(xù)發(fā)表兩篇論文,引發(fā)行業(yè)高度關(guān)注:

《Teaching Robots to Build Simulations of Themselves》,Nature Machine Intelligence:提出了一種以自監(jiān)督學(xué)習(xí)和自我建模為核心的方法體系:機(jī)器人可以僅通過觀察自身的視頻,重建自身結(jié)構(gòu)與電機(jī)運(yùn)動規(guī)律,實(shí)現(xiàn)從感知、理解到控制的自我閉環(huán),為機(jī)器人實(shí)現(xiàn)適應(yīng)能力與自主學(xué)習(xí)提供了技術(shù)路徑;

《Human-Robot Facial Coexpression》,Science Robotics:提出面部共情表達(dá)預(yù)測模型,使機(jī)器人能夠提前捕捉人類情緒信號,并同步生成自然、匹配的面部回應(yīng)。這使得機(jī)器人不僅是觀察者或響應(yīng)者,更是一個主動交互的共情個體。

這些成果構(gòu)成了首形科技后續(xù)產(chǎn)品的技術(shù)起點(diǎn)——“為機(jī)器人賦予更具人類感的外觀與行為模式”。配合首形科技最新的技術(shù),在視頻中機(jī)器人的“睜眼一刻”,所有伏筆匯聚一處,勾勒出仿生機(jī)器人覺醒的輪廓。

三大技術(shù)體系:機(jī)器人自主學(xué)習(xí)、情緒基座模型、仿生人臉硬件

視頻中機(jī)器人的真實(shí)感,源于首形的三大技術(shù)體系積累

1.機(jī)器人自主學(xué)習(xí):自監(jiān)督學(xué)習(xí)與自我建模

在首形科技看來,與其一次性“教會”機(jī)器人某個固定技能,不如賦予它“自主學(xué)習(xí)”的能力。這一理念正是創(chuàng)始人胡宇航在哥倫比亞大學(xué)攻讀博士期間的研究核心:自監(jiān)督學(xué)習(xí)與機(jī)器人自我建模。

A.自監(jiān)督學(xué)習(xí),源于機(jī)器人“照鏡子”的能力

機(jī)器人無需依賴昂貴的人工標(biāo)注或遙控操作,而是通過自身傳感器獲取的運(yùn)動數(shù)據(jù),就像人類對著鏡子觀察自己一樣,自動推理出自身結(jié)構(gòu)、關(guān)節(jié)運(yùn)動規(guī)律與控制策略之間的內(nèi)在關(guān)系。這一過程打破了傳統(tǒng)對預(yù)設(shè)模型與環(huán)境依賴的限制,實(shí)現(xiàn)了從感知、建模到控制的閉環(huán)學(xué)習(xí)。

B.自我建模,讓機(jī)器人“理解自己”

自我建模,是指機(jī)器人在不依賴環(huán)境標(biāo)簽或外部干預(yù)的前提下,僅憑自身感知建立對身體結(jié)構(gòu)與動力學(xué)行為的內(nèi)部模型。這背后的關(guān)鍵,是對機(jī)器人系統(tǒng)的“主體建模”與“環(huán)境建模”進(jìn)行解耦:主體建模強(qiáng)調(diào)機(jī)器人對自身身體的認(rèn)知,例如電機(jī)響應(yīng)、欠驅(qū)動結(jié)構(gòu)、柔性變形等;環(huán)境建模則屬于任務(wù)層面的理解,如地形、物體形狀或外力反饋。

通過解耦,機(jī)器人可以在復(fù)雜或未知環(huán)境中,先從“認(rèn)識自己”開始,逐步擴(kuò)展到與外界的交互建模。例如:當(dāng)硬件磨損、外部載荷改變或新工具接入時,它能夠即時重建自身模型,自主適應(yīng)新的狀態(tài),而無需重新訓(xùn)練整個系統(tǒng)。

這一能力讓機(jī)器人具備了“可解釋性強(qiáng)、適應(yīng)性高、獨(dú)立性強(qiáng)”的底層智能,是通往通用機(jī)器人的關(guān)鍵路徑之一。

C.終生學(xué)習(xí),機(jī)器人自主學(xué)習(xí)的未來

自我建模能力的建立,也為機(jī)器人實(shí)現(xiàn)“終身學(xué)習(xí)”奠定了基礎(chǔ):模型一旦學(xué)會“如何學(xué)習(xí)”,即可遷移到新的硬件、場景乃至全身關(guān)節(jié)系統(tǒng),實(shí)現(xiàn)新任務(wù)的持續(xù)學(xué)習(xí),新環(huán)境的適應(yīng)以及自身損壞的修復(fù)。憑借這一技術(shù)范式,首形科技讓“自主學(xué)習(xí)”成為機(jī)器人邁向具身智能的加速器——讓機(jī)器人不僅執(zhí)行任務(wù),更能持續(xù)學(xué)習(xí)、不斷成長。

2. 情緒基座模型(Emotional Foundation Model):打造人機(jī)交互情感引擎

機(jī)器人能否理解和表達(dá)人類情緒?答案,來自首形的另一項重要突破——情緒基座模型。

在當(dāng)下AI技術(shù)發(fā)展中,“基座模型(Foundation Model)”指的是通過大規(guī)模數(shù)據(jù)訓(xùn)練、具備通用能力、可泛化到多種任務(wù)的核心模型框架。它是人工智能走向“具身智能”的關(guān)鍵一步。

目前大多數(shù)人形機(jī)器人公司正致力于構(gòu)建“工具屬性”的基座模型,如通用抓取、操作控制、導(dǎo)航規(guī)劃等任務(wù)模型,試圖通過一次訓(xùn)練,適配各種執(zhí)行動作和物理操作任務(wù)。然而,這一方向面臨一個根本性瓶頸——真實(shí)世界交互數(shù)據(jù)的稀缺性。現(xiàn)實(shí)中的物理交互數(shù)據(jù)昂貴、難以采集,且涉及復(fù)雜的碰撞、動態(tài)反饋與多模態(tài)同步,遠(yuǎn)比在仿真中訓(xùn)練要困難得多。

而情緒類基座模型提供了一個相對更易落地的路徑。人類的情感交互大多依賴于語言、語音、面部表情、眼神接觸等非物理通道,這使得情緒交互數(shù)據(jù)不僅更容易采集、標(biāo)準(zhǔn)化和擴(kuò)展,而且不依賴復(fù)雜的物理世界建模。同時,這些數(shù)據(jù)天然具備連續(xù)性、情境性與泛化能力,是自監(jiān)督學(xué)習(xí)的理想素材。

基于這一判斷,首形科技率先提出并構(gòu)建“情緒基座模型(Emotional Foundation Model)”——一個以大規(guī)模情緒交互數(shù)據(jù)為基礎(chǔ),融合語音、表情、語言、情境與角色設(shè)定的多模態(tài)模型。該模型不僅讓機(jī)器人“聽懂”人類的情緒,更讓其“學(xué)會”在適當(dāng)?shù)臅r機(jī),做出帶有溫度的、自然可信的回應(yīng)。

3. 全自研仿生人臉硬件:跨越“恐怖谷”的超精工藝突破

人類對“臉”的感知極為敏銳,大腦中的梭狀回面孔區(qū)(FFA)以約 200 毫秒/次的頻率快速解碼面部信息,并通過三個層級進(jìn)行處理:基礎(chǔ)結(jié)構(gòu)識別(眼距、鼻高、臉型)、動態(tài)表情提取(微表情與肌肉活動),以及與記憶匹配(熟悉度、情緒聯(lián)想)。

一張仿生機(jī)器人的“臉”,要同時達(dá)到這三個層級的要求,滿足人類對“臉”的判斷認(rèn)定,需要極致的精益求精。首形科技對此進(jìn)行了從底層材料、皮膚工藝、機(jī)械結(jié)構(gòu)到嵌入式軟硬件的全面自主開發(fā)。

首形科技在面部精細(xì)度上的極致追求,讓用戶的大腦不自覺地完成“像真實(shí)的”、“是熟悉的”、“值得信任”的判定,使人類產(chǎn)生與之共情的可能。

商業(yè)價值:仿生機(jī)器人如何基于“情緒價值”帶來廣闊的應(yīng)用價值?

在人工智能全面滲透生活的今天,大語言模型(LLM)正在改變“語言”交互,但真正能觸達(dá)人的,是“情感”交互。相比于語音助手或虛擬對話界面,一個具備自然表情與情緒回應(yīng)的人形機(jī)器人,能在瞬時激發(fā)人類“情感”沖動。人形機(jī)器人之所以在每一次亮相中引爆話題,也是因為它“像人”的特點(diǎn)能喚起了人類的共情。

這種現(xiàn)象被定義為:“類人共情價值”。

人形機(jī)器人能成為一種情感觸發(fā)器,是一種在任何公共空間都能制造“圍觀效應(yīng)”的引力核心。所以,人形機(jī)器人天然具備成為注意力經(jīng)濟(jì)的中心資產(chǎn)的能力——無論是短視頻平臺、展陳場所還是零售門店,乃至未來隨家用/商用人形機(jī)器人普及率提升進(jìn)入千家萬戶,它所能帶來的傳播效率與情緒連接,是普通機(jī)器人、傳統(tǒng)硬件、甚至大模型界面都無法比擬的。

注意力經(jīng)濟(jì)是以爭奪用戶注意力為核心的經(jīng)濟(jì)模型。在這個模型中,類人機(jī)器人通過激發(fā)“類人共情價值”,成為注意力市場中最具傳播力和記憶點(diǎn)的內(nèi)容載體,從而轉(zhuǎn)化為流量、品牌和變現(xiàn)的杠桿。而在信息過載、內(nèi)容同質(zhì)的當(dāng)下,注意力獲取的方式正在逐漸從“堆內(nèi)容”走向“建關(guān)系”:誰能將關(guān)注轉(zhuǎn)化為情感喚起與持續(xù)共情鏈接,誰就掌握了未來的注意力入口乃至未來的商業(yè)價值入口。

在人工智能和人形機(jī)器人高速發(fā)展的今天,首形科技希望成為引領(lǐng)“機(jī)器人情感覺醒時代”的奠基者。

舉報 0 收藏 0 打賞 0評論 0
 
 
更多>同類資訊
全站最新
熱門內(nèi)容
網(wǎng)站首頁  |  關(guān)于我們  |  聯(lián)系方式  |  版權(quán)聲明  |  RSS訂閱  |  開放轉(zhuǎn)載  |  滾動資訊  |  爭議稿件處理  |  English Version
 
主站蜘蛛池模板: 丹江口市| 英山县| 竹溪县| 蓝田县| 大理市| 孟村| 嘉禾县| 永清县| 鹤壁市| 高淳县| 铅山县| 平潭县| 唐山市| 凤阳县| 湖北省| 和静县| 琼海市| 海安县| 嵊泗县| 定日县| 古丈县| 东山县| 喀喇| 渭南市| 高阳县| 万全县| 京山县| 黑山县| 登封市| 卢湾区| 华阴市| 承德市| 德清县| 黔江区| 泰来县| 肃南| 专栏| 藁城市| 济源市| 启东市| 甘南县|