天眼查App顯示,10月10日,廣州小鵬汽車科技有限公司申請(qǐng)的“人形機(jī)器人的姿勢(shì)生成方法、裝置、機(jī)器人、介質(zhì)及產(chǎn)品”專利公布。
摘要顯示,本發(fā)明涉及機(jī)器人技術(shù)領(lǐng)域,方法包括:獲取待輸出的第一語(yǔ)音數(shù)據(jù)、第一特殊動(dòng)作標(biāo)記、高斯噪聲和時(shí)間步;根據(jù)第一語(yǔ)音數(shù)據(jù),確定第一梅爾頻譜和第一深度語(yǔ)義特征,第一深度語(yǔ)義特征為通過(guò)自監(jiān)督語(yǔ)音表示學(xué)習(xí)模型處理的第一語(yǔ)音數(shù)據(jù);將第一梅爾頻譜、第一深度語(yǔ)義特征、第一特殊動(dòng)作標(biāo)記、高斯噪聲和時(shí)間步輸入姿勢(shì)生成模型,根據(jù)姿勢(shì)生成模型的輸出確定第一動(dòng)作數(shù)據(jù),姿勢(shì)生成模型為完成訓(xùn)練的擴(kuò)散模型;在輸出第一語(yǔ)音數(shù)據(jù)時(shí),同步控制人形機(jī)器人生成第一動(dòng)作數(shù)據(jù)所表征的手勢(shì)動(dòng)作。本發(fā)明能夠在分布內(nèi)生成更多樣的動(dòng)作,提升人機(jī)交互的自然度和親近感。


























