人工智能企業(yè)Anthropic近日宣布推出新一代推理模型Claude Haiku 4.5,這款更緊湊、成本更低的模型在編程性能和響應(yīng)速度上實現(xiàn)突破性提升。據(jù)測試數(shù)據(jù)顯示,該模型在軟件編程能力評估中達到與Claude Sonnet 4及OpenAI GPT-5相當?shù)乃剑评硭俣忍嵘^兩倍,運營成本降低至前代產(chǎn)品的三分之一。
在基準測試中,Claude Haiku 4.5展現(xiàn)出超越中型模型Claude Sonnet 4的實力。其核心優(yōu)勢在于混合推理架構(gòu),用戶既可選擇快速響應(yīng)模式,也能切換至深度思考的"擴展思維模式"。當處理復(fù)雜問題時,模型會自動判斷是否需要生成簡化的思考摘要,這種動態(tài)調(diào)整機制有效解決了長思考流程的展示難題。
訓練數(shù)據(jù)層面,研發(fā)團隊整合了截至2025年2月的互聯(lián)網(wǎng)公開數(shù)據(jù)、第三方非公開數(shù)據(jù)集、專業(yè)標注數(shù)據(jù)及用戶貢獻數(shù)據(jù)。通過多輪數(shù)據(jù)清洗和分類過濾,配合人類反饋強化學習(RLHF)技術(shù),模型在保持高效的同時確保了輸出質(zhì)量。值得注意的是,該模型首次實現(xiàn)了多模型協(xié)同作業(yè),開發(fā)者可同時調(diào)用Claude Sonnet 4.5制定解決方案,Claude Haiku 4.5執(zhí)行具體任務(wù)。
安全性能評估顯示,Claude Haiku 4.5在單輪交互場景中的有害信息攔截率與前代旗艦?zāi)P统制健C鎸γ舾性掝}請求時,模型會優(yōu)先輸出法律警示和倫理聲明,再提供理論層面的技術(shù)路徑。在自主代理安全測試中,該模型在25個參評模型中取得多項最佳成績,有效防范了數(shù)據(jù)泄露、惡意代碼執(zhí)行等風險。
商業(yè)應(yīng)用方面,Claude Haiku 4.5已向免費用戶開放,開發(fā)者可通過API接口調(diào)用,輸入輸出token的定價分別為每百萬次1美元和5美元。企業(yè)用戶反饋顯示,基于該模型的瀏覽器插件Claude for Chrome響應(yīng)速度提升顯著,在代碼調(diào)試、數(shù)據(jù)分析等場景中表現(xiàn)突出。
據(jù)公司首席產(chǎn)品官透露,Anthropic正在研發(fā)下一代Opus系列更新版本,預(yù)計將于年底至明年初發(fā)布。當前估值達1830億美元的這家AI企業(yè),已為超過30萬家企業(yè)提供服務(wù),本月年收入運行率接近70億美元。在谷歌、OpenAI等競爭對手加速迭代的背景下,Anthropic通過交叉開發(fā)策略保持競爭力,在訓練Claude Sonnet 4.5期間即啟動了Haiku 4.5的研發(fā)工作。












