滾動資訊

當(dāng)前位置：首頁 > 資訊 > 人工智能 > 正文內(nèi)容

Salesforce團隊CoDA模型：17億參數(shù)“小個子”挑戰(zhàn)代碼生成大模型

時間：2025-11-05 16:42:21 來源：互聯(lián)網(wǎng)編輯：快訊 IP：北京 發(fā)表評論無障礙通道

在人工智能代碼生成領(lǐng)域，Salesforce AI Research團隊的一項新研究引發(fā)了廣泛關(guān)注。該團隊開發(fā)的CoDA模型以17億參數(shù)的“輕量級”身軀，在代碼生成任務(wù)中展現(xiàn)出與70億參數(shù)大模型相媲美的實力，打破了“參數(shù)規(guī)模決定性能”的傳統(tǒng)認知。

傳統(tǒng)代碼生成模型多采用自回歸架構(gòu)，其工作模式類似于逐字書寫的筆跡——必須按順序生成內(nèi)容，一旦某個環(huán)節(jié)出錯，后續(xù)內(nèi)容可能全盤偏離。這種模式在處理代碼填空、上下文補全等任務(wù)時顯得尤為吃力，就像要求作家必須從第一個字寫到最后一個字，而不能中途修改段落邏輯。

CoDA的創(chuàng)新之處在于引入了擴散模型架構(gòu)。該模型的工作流程類似雕塑創(chuàng)作：從模糊的“噪聲”開始，通過多輪迭代逐步雕琢出清晰的代碼結(jié)構(gòu)。這種非順序生成的方式使模型能夠同時參考前后文信息，就像雕塑家可以從任意角度調(diào)整作品細節(jié)，確保整體邏輯的連貫性。

研究團隊為CoDA設(shè)計了獨特的三階段訓(xùn)練體系。在預(yù)訓(xùn)練階段，模型接觸包含網(wǎng)頁文本、多語言代碼、數(shù)學(xué)公式等在內(nèi)的1800億token數(shù)據(jù)，通過“漸進式掩碼”技術(shù)逐步提升對不完整信息的處理能力——從最初隨機遮擋單個詞匯，到后期遮擋完整段落甚至要求續(xù)寫開頭。

中期訓(xùn)練階段聚焦編程專業(yè)能力。研究團隊精選210億token的專項數(shù)據(jù)，包含學(xué)術(shù)論文、編程教材和優(yōu)質(zhì)代碼庫。此階段強化了三種掩碼策略：保留開頭提示的“不可掩碼前綴”、刪除結(jié)尾部分的“截斷后綴”，以及模擬真實編程場景的“塊狀掩碼”。這些策略使模型更擅長處理函數(shù)補全、邏輯插入等實際任務(wù)。

后訓(xùn)練階段則著重提升模型與人類的交互能力。通過OpenCoder數(shù)據(jù)集的指令微調(diào)，CoDA學(xué)會了理解自然語言需求并生成符合要求的代碼。研究團隊采用小學(xué)習(xí)率策略，確保模型在提升交互能力的同時不丟失編程技能。

技術(shù)實現(xiàn)層面，CoDA采用“分類擴散”方法處理離散代碼token。每個位置的token生成被轉(zhuǎn)化為分類問題，模型通過預(yù)測被掩碼位置的原始內(nèi)容完成代碼構(gòu)建。配合“置信度引導(dǎo)采樣”技術(shù)，模型能根據(jù)預(yù)測可靠性動態(tài)調(diào)整決策速度——對確定內(nèi)容快速生成，對不確定部分謹慎處理，既保證質(zhì)量又提升效率。

在Google TPU v4-1024集群上，研究團隊構(gòu)建了高效的訓(xùn)練系統(tǒng)。該系統(tǒng)支持自動數(shù)據(jù)加載、分布式模型保存和動態(tài)掩碼策略調(diào)整，實現(xiàn)了每秒10億token的處理速度。更值得關(guān)注的是，整個訓(xùn)練流程、代碼和模型權(quán)重均已開源，為社區(qū)提供了完整的復(fù)現(xiàn)指南。

實測數(shù)據(jù)顯示，CoDA在Humaneval和MBPP兩大編程基準(zhǔn)測試中表現(xiàn)突出。在Humaneval測試中，其pass@1分數(shù)達54.3%，意味著能一次性正確解決半數(shù)以上編程問題；MBPP測試中則取得47.2%的成績，顯示出解決實際編程需求的能力。與同規(guī)模自回歸模型相比，CoDA在需要上下文理解的復(fù)雜任務(wù)中優(yōu)勢明顯。

效率方面，CoDA的推理延遲比同類擴散模型低約40%。研究發(fā)現(xiàn)，512步擴散迭代后性能提升趨于飽和，這為實際應(yīng)用提供了優(yōu)化方向——在保持性能的同時可大幅縮短推理時間。

漸進式掩碼策略是CoDA的核心創(chuàng)新之一。該策略通過模擬真實使用場景，緩解了訓(xùn)練與推理的分布差異。例如，“不可掩碼前綴”對應(yīng)根據(jù)需求生成代碼的場景，“截斷后綴”訓(xùn)練處理不完整輸入的能力，“塊狀掩碼”則模擬函數(shù)中間邏輯的填補任務(wù)。這種訓(xùn)練方式顯著提升了模型的泛化能力。

研究團隊完全開源的決策具有深遠影響。除了模型權(quán)重，他們還公開了TPU訓(xùn)練代碼、數(shù)據(jù)處理流程和評估框架。這種透明度降低了領(lǐng)域研究門檻，促進了技術(shù)迭代。配套的評估工具確保了不同模型能在統(tǒng)一標(biāo)準(zhǔn)下比較性能，推動了行業(yè)規(guī)范化發(fā)展。

對于開發(fā)者而言，CoDA的開源特性意味著可直接獲取應(yīng)用資源。通過GitHub的“SalesforceAIResearch/CoDA”項目或HuggingFace平臺的“Salesforce/CoDA-v0-Instruct”模型，開發(fā)者能快速集成代碼生成能力。完整的訓(xùn)練推理代碼更支持定制化開發(fā)。

這項研究證明，通過架構(gòu)創(chuàng)新和訓(xùn)練策略優(yōu)化，輕量級模型同樣能實現(xiàn)高性能。CoDA為AI代碼生成領(lǐng)域提供了新的發(fā)展范式——在資源約束下，通過智能設(shè)計實現(xiàn)效率與效果的平衡。其開源生態(tài)也將持續(xù)推動相關(guān)技術(shù)的進步與應(yīng)用。

更多>同類資訊

進博會見智元機器人：具身智能“全場景滲透”，開啟實用新篇章

11-05

IBM 2025年四季度或裁員，AI浪潮下科技巨頭優(yōu)化結(jié)構(gòu)聚焦核心業(yè)務(wù)

11-05

特斯拉高額薪酬方案“鎖”馬斯克，投資者施壓，其精力分配引爭議

11-05

東芝S300 AI系列監(jiān)控硬盤上市，專為AI負載優(yōu)化性能強勁

11-05

任澤平：固態(tài)電池解決三大痛點，產(chǎn)業(yè)化突破在即，未來已來？

好消息是，中國有望率先攻克這個全球技術(shù)難題：比如中科院物理所用碘離子當(dāng)“特殊膠水”，自動填補電極和電解質(zhì)的縫隙；還有中科院金屬所，為電解質(zhì)做了柔性聚合材料 “骨架”，耐彎折，儲電能力還提升了80%，適配日…

11-05

谷歌“太陽捕手計劃”啟航：太空部署TPU芯片構(gòu)建太陽能驅(qū)動AI計算網(wǎng)

11-05

OpenAI推出IndQA基準(zhǔn)測試：助力AI跨越語言藩籬深度理解印度文化語境

11-05

智己LS9全球首發(fā)預(yù)售，30萬級大六座SUV市場迎來科技豪華新標(biāo)桿

11-05

上汽旗艦智己LS9預(yù)售開啟，以旗艦科技重塑30萬級大六座SUV新體驗

11-05

騰勢N8L震撼登場，29.98萬元起售，以豪華科技開啟家庭美好出行新篇章

11-05

上汽旗艦智己LS9預(yù)售開啟，硬核科技與奢華體驗重塑30萬級大六座SUV新標(biāo)桿

11-05

智己LS9：增程領(lǐng)航+智能賦能，重塑30萬級豪華SUV新格局

11-05

上汽旗艦智己LS9預(yù)售開啟，硬核科技+奢享配置，重塑30萬級大六座SUV格局

11-05

29.98萬起售！騰勢N8L以安全豪華科技，開啟家庭出行全新體驗

11-05

技術(shù)革新引領(lǐng)，場景多元拓展，中國機器人產(chǎn)業(yè)加速邁向高質(zhì)量發(fā)展新征程

近日，中國機器人產(chǎn)業(yè)捷報頻傳：全球首個具身智能機器人真機強化學(xué)習(xí)技術(shù)在工業(yè)生產(chǎn)線正式應(yīng)用，首款全天候人形機器人發(fā)布，前三季度工業(yè)機器人產(chǎn)量超2024年全年產(chǎn)量、出口工業(yè)機器人增長54.9%。從技術(shù)突破到場景拓…

11-05

點擊查看更多 +

全站最新

京東攜手廣汽埃安寧德時代，首輛“國民好車”下線 11.11獨家發(fā)售

大眾旗下酷睿程攜手地平線，在華自主研發(fā)車用SoC賦能智能駕駛

比亞迪夏價格下探至20萬級，動力靈活空間大，能否成MPV市場新寵？

壁掛爐出現(xiàn)耗氣增大、熱水不穩(wěn)？是時候給壁掛爐做清潔保養(yǎng)啦

平均63秒產(chǎn)新車！嵐圖雙工廠火力全開，智慧制造引領(lǐng)綠色轉(zhuǎn)型新速度

上市百日銷量破十萬，比亞迪海獅06憑全能實力引領(lǐng)主流SUV市場新格局

熱門內(nèi)容

本欄最新

智己LS9全球首發(fā)預(yù)售，30萬級大六座SUV市場迎來科技豪華新標(biāo)桿

上汽旗艦智己LS9預(yù)售開啟，以旗艦科技重塑30萬級大六座SUV新體驗

騰勢N8L震撼登場，29.98萬元起售，以豪華科技開啟家庭美好出行新篇章

上汽旗艦智己LS9預(yù)售開啟，硬核科技與奢華體驗重塑30萬級大六座SUV新標(biāo)桿

智己LS9：增程領(lǐng)航+智能賦能，重塑30萬級豪華SUV新格局

上汽旗艦智己LS9預(yù)售開啟，硬核科技+奢享配置，重塑30萬級大六座SUV格局

本網(wǎng)站LOGO小熊標(biāo)志受版權(quán)保護，版權(quán)登記號：魯作登字-2015-F-025467，未經(jīng)ITBEAR官方許可，嚴禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無障礙技術(shù)由太陽灣捐增，為閱讀障礙用戶提供內(nèi)容聽讀服務(wù)。如本站內(nèi)容侵犯了您的權(quán)利，請通知我們及時刪除。
中國（山東）自由貿(mào)易試驗區(qū) 魯ICP備11015305號-1 聯(lián)系入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

日本精品一区二区三区高清 久久

Salesforce團隊CoDA模型：17億參數(shù)“小個子”挑戰(zhàn)代碼生成大模型

日本精品一区二区三区高清久久