在AI領域的一次重大突破中,字節跳動的智能體平臺“扣子”憑借其新發布的Agent功能,成功吸引了業界的廣泛關注。自4月18日扣子Agent上線以來,各大AI交流群內邀請碼的爭搶異常激烈,用戶們爭相獲取這五個一組的寶貴邀請碼,往往在放出后的幾秒內就被一搶而空。
即便對于擁有強大算力的字節跳動而言,用戶的熱情也遠遠超出了預期。在扣子Agent上線的短短幾天內,服務器因訪問量過大而多次出現滿載情況,算力消耗遠超字節的初步預估。
此次字節新推出的扣子Agent,憑借其優化的產品思路和價格優勢,成功填補了Manus留下的高端市場空白。Manus雖然在業界引起了轟動,但其高昂的價格讓不少用戶望而卻步。而扣子Agent的推出,正好滿足了這部分用戶的需求。
在扣子Agent的多款新功能和產品中,“扣子空間”無疑是最受用戶歡迎的。這款Agent已經具備了規劃、使用工具和記憶等關鍵自主能力。用戶可以用它來撰寫游戲攻略、市場調研報告,甚至還能結合字節提供的多種MCP實現更復雜的需求,如利用高德地圖MCP+Agent編寫旅游指南,或利用飛書多維表格進行數據統計分析。
在實際體驗中,扣子的Agent更像是OpenAI發布的DeepResearch和Manus的結合體。以“字節一年To B的AI戰略”為例,讓扣子Agent幫忙收集信息并生成分析報告。Agent將任務拆解成多個步驟,并在用戶的指導下逐步完成,最終輸出了一份長達10個小節的報告。雖然內容較為簡略,但已經基本覆蓋了各個維度的信息。
在產品設計上,字節整體的設計思路與DeepResearch相近。兩者都將Agent的思考過程和收集內容放置在界面右側,使用戶能夠清晰地看到AI的每一步操作??圩拥腁gent還延續了字節一貫的產品設計思路,進一步提升了用戶的交互體驗。
為了滿足用戶對生成效率和質量的不同需求,扣子的智能體在界面中創新地設置了“探索模式”和“規劃模式”兩種模式。前者思考速度快,適合處理簡單任務;后者則能根據用戶需求將任務拆分成詳細步驟,并在生成規劃后允許用戶根據需求進行修改。
然而,以智能體的三個關鍵能力指標——規劃、工具調用和記憶來衡量,字節的Agent表現尚無法與DeepResearch和Manus相提并論。在工具調用方面,目前字節平臺可直接調用的MCP種類有限,仍需進一步擴充。而在記憶問題上,也有用戶反映,在進行了十幾輪上下文對話后,Agent會出現“失憶”情況,無法記住之前的交流內容。
這主要是由于扣子Agent的底層模型決定。目前,扣子Agent使用的是豆包最新發布的深度思考模型Doubao-1.5-thinking-pro。與采用自研模型的OpenAI和調用Claude 3.7等模型的Manus相比,扣子Agent在文本理解思考能力、代碼輸出等方面稍遜一籌。
為了提升Agent的使用體驗,字節在多模態能力上下了不少功夫。上周,字節發布了專門為Agent設計的GUI(圖形交互界面)模型,這使得扣子Agent在視覺理解和圖片生成能力上表現更加突出。在實際體驗中,扣子Agent生成的報告不僅詳細分好了對應的節點,而且在UI設計上體驗極佳,提供了圖文并茂的調研報告。
雖然扣子Agent目前的表現還無法與Manus相媲美,但在自主Agent市場幾乎空白的當下,扣子Agent的表現已經足夠驚艷。它做到了火山引擎一直強調的“成本低、易落地”,先將具備自主執行能力的Agent推向市場,讓人們能夠體驗并給出反饋。
扣子的誕生,不僅是大廠在智能體路線上的一次重要嘗試,更是對之前智能體發展思路的一次“糾偏”。從OpenAI發布GPT商店開始,大廠們紛紛跟進智能體的發展。然而,大廠們最初對智能體的定位仍然是做開發者生態的平臺,即智能體商店。他們希望通過吸納開發者來打造應用生態,再借助各種功能的智能體吸引用戶,從而成為流量生態的入口。
然而,隨著AutoGLM等能夠實現自主操作的Agent的出現,大廠們開始意識到之前的思路需要調整。字節此次搶著將還不夠完善的扣子Agent推出,正是為了搶占時間窗口。雖然扣子Agent目前只是一個“60分及格”的產品,但它的出現已經足夠讓人眼前一亮。