據海外科技媒體《The Information》披露,OpenAI正秘密推進一項音樂生成技術研發項目。這款新型工具突破了傳統AI音樂的創作邊界,支持通過文字描述或音頻片段直接生成完整音樂作品。
內部人士透露,該技術具備強大的音樂適配能力。在影視制作場景中,創作者可通過輸入視頻畫面特征,快速獲得匹配氛圍的原創配樂;音樂制作人則能利用人聲錄音,自動生成吉他、鋼琴等樂器的實時伴奏。這種雙向創作模式將顯著提升音樂制作效率。
項目推進過程中,OpenAI與世界頂級音樂學府茱莉亞音樂學院展開深度合作。該校學生受邀參與音樂數據標注工作,通過解析經典樂譜的結構特征,為模型訓練提供專業級音樂語料。這種產學研結合的模式,確保了生成音樂符合專業審美標準。
值得注意的是,OpenAI此前雖發布過音樂生成模型,但均早于ChatGPT時代。近期公司戰略明顯向音頻領域傾斜,重點開發文本轉語音、語音轉文本等交互技術。此次音樂生成工具的研發,標志著其音頻技術矩陣的進一步完善。
當前生成式音樂市場競爭激烈,谷歌、Suno等科技公司已推出類似產品。OpenAI此次技術突破能否后來居上,關鍵在于其多模態交互能力與專業音樂資源的結合程度。雖然具體發布時間尚未確定,但行業普遍關注其是否會整合進ChatGPT或視頻生成工具Sora中。











