滾動資訊

當(dāng)前位置：首頁 > 資訊 > 人工智能 > 正文內(nèi)容

紅帽攜手科技巨頭，llm-d項(xiàng)目開啟AI推理新篇章，破解成本與延遲難題

時(shí)間：2025-05-27 12:23:03 來源：ITBEAR編輯：快訊團(tuán)隊(duì) 發(fā)表評論無障礙通道

紅帽公司，全球開源技術(shù)的領(lǐng)航者，近期宣布了一項(xiàng)名為llm-d的革命性開源項(xiàng)目，該項(xiàng)目專注于解決生成式人工智能在大規(guī)模推理應(yīng)用中的迫切需求。該項(xiàng)目匯聚了包括CoreWeave、谷歌云、IBM研究院和NVIDIA在內(nèi)的多家行業(yè)領(lǐng)軍企業(yè)作為初始貢獻(xiàn)者，致力于通過尖端技術(shù)，使大語言模型推理云服務(wù)能夠滿足最為嚴(yán)苛的生產(chǎn)服務(wù)級標(biāo)準(zhǔn)。

隨著推理技術(shù)在人工智能領(lǐng)域戰(zhàn)略地位的日益凸顯，根據(jù)Gartner的最新預(yù)測，到2028年，超過80%的數(shù)據(jù)中心工作負(fù)載加速器將專門用于推理而非訓(xùn)練。這一趨勢反映出推理模型復(fù)雜性和規(guī)模的持續(xù)擴(kuò)大，但同時(shí)也帶來了資源需求急劇增加的問題，限制了集中式推理的可行性。高昂的成本和較長的延遲成為了制約AI創(chuàng)新發(fā)展的關(guān)鍵障礙。

面對這一挑戰(zhàn)，紅帽及其合作伙伴通過llm-d項(xiàng)目成功地將先進(jìn)的推理能力融入現(xiàn)有的企業(yè)IT基礎(chǔ)設(shè)施中。這一統(tǒng)一平臺不僅能夠幫助IT團(tuán)隊(duì)在滿足關(guān)鍵業(yè)務(wù)工作負(fù)載需求的同時(shí)部署創(chuàng)新技術(shù)，以最大化效率，還能顯著降低高性能AI加速器的總體擁有成本。llm-d項(xiàng)目的核心價(jià)值在于打破了傳統(tǒng)推理部署的局限，為企業(yè)提供了更為靈活、高效且經(jīng)濟(jì)的AI推理解決方案。

llm-d項(xiàng)目得到了由生成式AI模型提供商、AI加速器先驅(qū)和主要AI云平臺組成的強(qiáng)大聯(lián)盟的支持。除了四家初始貢獻(xiàn)者外，AMD、思科、Hugging Face、英特爾、Lambda和Mistral AI等重要企業(yè)也紛紛加入，展現(xiàn)了業(yè)界在構(gòu)建大規(guī)模語言模型服務(wù)未來方面的深度合作意愿。

行業(yè)領(lǐng)袖對llm-d項(xiàng)目給予了積極響應(yīng)。谷歌云AI與計(jì)算基礎(chǔ)設(shè)施部門的副總裁兼總經(jīng)理Mark Lohmeyer表示：“在企業(yè)大規(guī)模部署AI并為用戶創(chuàng)造價(jià)值的過程中，高效的AI推理至關(guān)重要。在我們進(jìn)入推理新時(shí)代之際，谷歌云很榮幸能夠作為llm-d項(xiàng)目的初始貢獻(xiàn)者，繼續(xù)秉承我們的開源貢獻(xiàn)傳統(tǒng)。”

NVIDIA工程AI框架的副總裁Ujval Kapasi也指出：“l(fā)lm-d項(xiàng)目是對開源AI生態(tài)系統(tǒng)的重要補(bǔ)充，體現(xiàn)了NVIDIA對合作推動生成式AI創(chuàng)新的承諾。可擴(kuò)展、高性能的推理是下一波生成式AI和代理式AI的關(guān)鍵。我們正與紅帽和其他支持合作伙伴合作，利用NVIDIA Dynamo創(chuàng)新如NIXL等，加速llm-d項(xiàng)目的發(fā)展?！?/p>

llm-d項(xiàng)目的啟動標(biāo)志著AI推理領(lǐng)域邁入了一個(gè)全新的發(fā)展階段。通過開源模式匯聚產(chǎn)業(yè)智慧，該項(xiàng)目不僅有望解決當(dāng)前大規(guī)模推理面臨的成本和性能挑戰(zhàn)，還將為整個(gè)AI生態(tài)系統(tǒng)的可持續(xù)發(fā)展奠定堅(jiān)實(shí)基礎(chǔ)。隨著更多企業(yè)和開發(fā)者的加入，llm-d項(xiàng)目有望成為推動AI推理技術(shù)標(biāo)準(zhǔn)化和普及化的重要力量。

舉報(bào) 0 收藏 0 打賞 0評論 0

更多>同類資訊

WAVES 2025：共探中國創(chuàng)投新紀(jì)元，AI時(shí)代創(chuàng)業(yè)者集結(jié)杭州

06-11

AI未來展望：2026新知涌現(xiàn)，2027機(jī)器人時(shí)代，2030智能無限可能！

06-11

馬斯克xAI公司新一輪融資估值或破2000億美元？

06-11

火山引擎豆包大模型日調(diào)用量激增，市占率領(lǐng)跑國內(nèi)大模型市場！

在近期舉辦的“火山引擎FORCE原動力大會”活動中，火山引擎的領(lǐng)軍人物譚待公布了一項(xiàng)震撼業(yè)界的統(tǒng)計(jì)數(shù)字：至2025年5月末，豆包大模型的日均tokens調(diào)用量激增至16.4萬億，這一數(shù)字與其初次亮相時(shí)相比，竟膨脹了137倍之多。譚待強(qiáng)調(diào)，豆包大模型自面世以來，經(jīng)歷了不斷的

06-11

騰訊音樂全資并購喜馬拉雅，AI技術(shù)引領(lǐng)音頻產(chǎn)業(yè)新變革？

06-11

Ilya Sutskever回母校論AI：未來潛力無限，人類將如何應(yīng)對變革？

06-11

AI賦能低技能出租車司機(jī)：效率提升，技能差距縮小？

06-11

韻達(dá)技術(shù)下沉戰(zhàn)略顯威力，末端降本增效引領(lǐng)行業(yè)新風(fēng)潮

韻達(dá)控股近年來持續(xù)加碼自動化技術(shù)投入，通過全鏈條數(shù)字化改造，在分揀效率、精準(zhǔn)度提升與成本控制層面實(shí)現(xiàn)雙重突破，為行業(yè)的智能化轉(zhuǎn)型提供樣本參考。從無人車的城市高效配送，到無人機(jī)的偏遠(yuǎn)地區(qū)覆蓋，再到無人驛站的智…

06-11

OpenAI推出o3-pro并大幅降價(jià)，攜手谷歌云滿足計(jì)算需求

The unprecedented partnership with Google highlighted how the massivecomputing demands for training an…

06-11

老鳳祥跨界AI！搭載字節(jié)豆包大模型的智能眼鏡七月來襲

06-11

iOS26新特性大起底，安卓用戶：這些我好像在哪見過？

06-11

Meta豪擲140億美元投資Scale AI，力邀CEO掌舵新AI實(shí)驗(yàn)室

TMTPOST -- Meta Platforms, Inc. is going to strike a deal for one of itsmost aggressive bets on artific…

06-11

谷歌AI工具影響新聞出版商：流量下滑，未來何去何從？

06-11

火山引擎豆包大模型日均tokens調(diào)用量激增137倍，市場份額領(lǐng)跑

新榜訊6月11日，在火山引擎FORCE原動力大會現(xiàn)場，火山引擎總裁譚待透露，截至今年5月底，火山引擎豆包大模型tokens日均調(diào)用量高達(dá)16.4萬億，較發(fā)布時(shí)增長至137倍。據(jù)IDC市場數(shù)據(jù)顯示，火山引擎占據(jù)…

06-11

喜馬拉雅并購案背后：共識下的抉擇，應(yīng)對行業(yè)變革的新起點(diǎn)

內(nèi)容行業(yè)正經(jīng)歷三重深刻轉(zhuǎn)變：注意力碎片化：多設(shè)備、多場景切換已成常態(tài)，內(nèi)容的觸達(dá)與匹配越來越依賴AI來實(shí)現(xiàn)跨平臺、跨時(shí)間的精準(zhǔn)分發(fā)；創(chuàng)作范式遷移：AIGC重構(gòu)內(nèi)容生產(chǎn)方式，效率突飛猛進(jìn)，但真正引發(fā)共鳴的，依…

06-11

點(diǎn)擊查看更多 +

全站最新

車企齊承諾60天賬期，反內(nèi)卷能否見效？細(xì)節(jié)執(zhí)行成關(guān)鍵

長城汽車5月銷量穩(wěn)健增長，歐拉品牌成隱憂，出海戰(zhàn)略顯成效

2025年購車攻略：電車油車誰更劃算？內(nèi)行人深度剖析，答案揭曉！

李書福：汽車產(chǎn)能過剩，車企該慢下來思考了！

360全景影像真的那么神？老司機(jī)揭秘為何不建議加裝！

工信部重拳出擊，汽車內(nèi)卷亂象能否終結(jié)？

熱門內(nèi)容

本欄最新

WAVES 2025：共探中國創(chuàng)投新紀(jì)元，AI時(shí)代創(chuàng)業(yè)者集結(jié)杭州

韻達(dá)技術(shù)下沉戰(zhàn)略顯威力，末端降本增效引領(lǐng)行業(yè)新風(fēng)潮

谷歌AI工具影響新聞出版商：流量下滑，未來何去何從？

北電數(shù)智：以算力數(shù)據(jù)雙引擎，樹立城市級AI底座新標(biāo)桿

貝陪科技：AI玩具新玩家，用“可豆陪陪”探索智能陪伴新路徑

豆包大模型1.6版亮相，高考模擬考分亮眼，統(tǒng)一定價(jià)每百萬Token僅0.8元

本網(wǎng)站LOGO小熊標(biāo)志受版權(quán)保護(hù)，版權(quán)登記號：魯作登字-2015-F-025467，未經(jīng)ITBEAR官方許可，嚴(yán)禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無障礙技術(shù)由太陽灣捐增，為閱讀障礙用戶提供內(nèi)容聽讀服務(wù)。如本站內(nèi)容侵犯了您的權(quán)利，請通知我們及時(shí)刪除。
中國（山東）自由貿(mào)易試驗(yàn)區(qū) 魯ICP備11015305號-1 商業(yè)合作入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

日本精品一区二区三区高清 久久

紅帽攜手科技巨頭，llm-d項(xiàng)目開啟AI推理新篇章，破解成本與延遲難題

日本精品一区二区三区高清久久

紅帽攜手科技巨頭，llm-d項(xiàng)目開啟AI推理新篇章，破解成本與延遲難題