日本精品一区二区三区高清 久久

ITBear旗下自媒體矩陣:

Qwen 3發布,心言集團算法工程師詳談開源模型生態新機遇

   時間:2025-05-06 12:02:35 來源:ITBEAR編輯:快訊團隊 發表評論無障礙通道

近日,阿里巴巴推出了其最新的大模型Qwen 3,標志著中國開源生態中DeepSeek與Qwen這對“雙子星”組合的正式崛起,逐漸取代了以往以Llama為主、Mistral為輔的開源格局。隨著Qwen 3的發布,Founder Park邀請了多家AI創業公司的代表,就開源與閉源的選擇、模型微調、能力瓶頸及創業中的陷阱等話題進行了深入探討。其中,心言集團的開源布道師及高級算法工程師“左右”分享了公司在開源生態下的實踐經驗和技術見解。

“左右”指出,從心言集團的業務角度出發,絕大多數(可能超過90%)的模型需求都需經過本地化微調后部署使用。對于特定任務,如數據構造、數據蒸餾或需要利用GPT、豆包、Qwen等特定大模型的能力時,則會直接調用其API。本地部署的模型主要基于Qwen,根據業務入口的不同,選用不同規模的版本,如7B、32B和72B等。針對具身智能業務,考慮到用戶隱私和多模態處理需求,會采用更小規模的多模態模型,如0.5B和1.5B。

選擇Qwen模型的原因包括其生態系統的成熟度和穩定性、技術能力與業務的契合度、模型系列的完整性以及開源的持續性和可信賴度。Qwen在中文支持上表現出色,且預訓練數據中包含了泛心理和情感陪伴相關內容,這使得基于Qwen的微調模型更易滿足心言集團的業務需求。同時,Qwen提供了從0.5B到72B的完整尺寸系列,降低了在不同模型間進行微調和測試的成本。

在具身智能和線上互聯網業務方面,心言集團面臨了不同的挑戰。具身智能業務中,主要挑戰在于推理成本和生態適配。由于隱私需求,模型需本地部署,但端側推理卡成本高且推理速度可能不足。若采用國產算力芯片降低成本,則面臨生態不完善的問題,適配周期長且成本高。線上互聯網業務中,主要挑戰在于模型能力和推理成本/延遲。情感陪伴業務對情感細粒度理解要求高,需要模型準確捕捉用戶復雜的情感狀態,同時,隨著用戶量和AI使用量的快速增長,推理成本壓力大。

“左右”表示,盡管大多數模型廠商在預訓練或后訓練階段不會特別關注情感、情緒化的泛心理應用場景數據,但心言集團仍堅持進行后訓練,以提升模型在這一領域的表現。他們對基礎模型的要求主要是通用能力,而非特定領域能力。如果基礎模型的通用能力足夠好,后訓練時就能更容易地將其擬合到所需方向。同時,他們也意識到,針對特定領域進行后訓練可能會損害模型的其他通用能力,因此需在可接受范圍內控制這種損害。

對于當前開源模型的發展,“左右”表示期待開源模型能盡可能追平閉源頂尖模型,并希望它們能釋放更多的技術細節。他認為,DeepSeek在MoE、原生多模態、代碼等方面探索較前沿,而Qwen和Llama更注重社區和通用性,技術選型上相對穩健。這種差異化定位在開源社區中是正常的。

在談及大模型創業中的陷阱時,“左右”指出,模型與產品的適配度以及對AI在產品中角色的理解是關鍵問題。他認為,AI更多是后端能力,是處理信息的工具,而不是直接交付結果的前端界面。很多開發者追求簡單的“端到端”解決方案,認為大模型能簡化一切,但在很多領域,尤其是情感領域,原本需要復雜處理的環節依然需要,甚至可以借助AI做得更精細。直接用AI替代這些環節,可能導致產品缺乏深度和個性化。

“左右”強調,正確的模式應該是“X+AI”,而不是“AI+X”。核心是挖掘和理解用戶需求(X),然后思考如何用AI更好地解決這個需求。他提出,用戶留存是一個重要的觀察指標,很多AI產品留存差,往往意味著產品沒有抓住用戶的真實痛點,個性化做得不夠好。因此,心言集團將繼續聚焦泛心理發展的AI化與具身化,以開源為舟,以創新為帆,不斷探索情感計算領域的未知。

舉報 0 收藏 0 打賞 0評論 0
 
 
更多>同類資訊
全站最新
熱門內容
網站首頁  |  關于我們  |  聯系方式  |  版權聲明  |  RSS訂閱  |  開放轉載  |  滾動資訊  |  爭議稿件處理  |  English Version
 
主站蜘蛛池模板: 长治市| 眉山市| 汕头市| 华蓥市| 无锡市| 岳阳县| 霍邱县| 马公市| 闽侯县| 大邑县| 河源市| 武功县| 台南县| 固原市| 延津县| 霍山县| 四会市| 鄯善县| 且末县| 莱西市| 青川县| 沧源| 达尔| 常山县| 肃南| 汶川县| 青阳县| 营口市| 安远县| 尉氏县| 牙克石市| 梁平县| 双桥区| 合肥市| 曲水县| 林口县| 随州市| 嘉义市| 东丰县| 隆回县| 金寨县|