日本精品一区二区三区高清 久久

ITBear旗下自媒體矩陣:

Character.AI突破性技術:實時AI角色視頻互動

   時間:2025-07-05 16:21:28 來源:IT之家編輯:快訊團隊 IP:北京 發表評論無障礙通道

7 月 5 日消息,AI 聊天機器人平臺 Character.AI 發布研究論文和視頻演示,展示了名為 TalkingMachines 的自回歸擴散模型,讓 AI 角色互動更加逼真。

該模型尚未部署在 Character.AI 平臺上,根據研究論文和視頻演示,用戶只需要輸入一張圖片和聲音信號,該模型就能實現類似 FaceTime 的通話視覺互動。

該模型基于 Diffusion Transformer(DiT)技術,本質上是一種能夠從隨機噪聲中創建詳細圖像的“藝術家”,并不斷優化圖像直至完美。Character.AI 所做的就是讓這一過程變得極其迅速,達到實時效果。

TalkingMachines 模型采用了流匹配擴散(Flow-Matched Diffusion)、音頻驅動的交叉注意力(Audio-Driven Cross Attention)、稀疏因果注意力(Sparse Causal Attention)和不對稱蒸餾(Asymmetric Distillation)等多種關鍵技術。

其中流匹配擴散技術通過訓練大量動作,包括細微的面部表情和更夸張的手勢,確保 AI 角色動作更加自然。音頻驅動的交叉注意力技術則讓 AI 不僅能聽到單詞,還能理解音頻中的節奏、停頓和語調,并將其轉化為精確的口型、點頭和眨眼。

稀疏因果注意力技術讓 Character.AI 能夠以更高效的方式處理視頻幀,而不對稱蒸餾技術則讓視頻能夠實時生成,營造出類似 FaceTime 通話的效果。

Character.AI 強調,這一研究突破不僅僅是關于面部動畫的,它是朝向實時互動的音頻視覺 AI 角色邁出的一步。該模型支真實感人類、動漫和 3D 虛擬形象等多種風格。

舉報 0 收藏 0 打賞 0評論 0
 
 
更多>同類資訊
全站最新
熱門內容
網站首頁  |  關于我們  |  聯系方式  |  版權聲明  |  RSS訂閱  |  開放轉載  |  滾動資訊  |  爭議稿件處理  |  English Version
 
主站蜘蛛池模板: 富顺县| 五莲县| 迁西县| 大化| 拉孜县| 闽侯县| 渭源县| 八宿县| 鹤岗市| 南昌县| 左云县| 辽阳县| 教育| 谷城县| 赤城县| 广汉市| 崇信县| 平顶山市| 噶尔县| 沽源县| 泽库县| 新闻| 津南区| 莱芜市| 江陵县| 合川市| 开封县| 安阳县| 邳州市| 汶川县| 郸城县| 灵宝市| 泾川县| 含山县| 民县| 什邡市| 韩城市| 广灵县| 略阳县| 乌拉特后旗| 保靖县|