在AI算力領域,一家由90后清華學子創立的初創企業——北京行云集成電路有限公司(行云集成電路),近日宣布推出其全新一體機產品“褐蟻”。這款產品在價格與性能上均實現了突破,僅需最高15萬元,即可運行滿血版的DeepSeek R1/V3大模型,對話速度更是達到了每秒20個token。
行云集成電路的創始人兼CEO季宇,在接受采訪時透露,“褐蟻”一體機已經成功適配了阿里最新發布的Qwen3系列開源大模型,包括其頂配版本Qwen3-235B-A22B。季宇本人是清華大學物理系本科畢業生,并在該校獲得了計算機體系結構方向的博士學位,曾以“華為天才少年”的身份,在海思負責昇騰芯片編譯器的研發工作。
“褐蟻”一體機提供了三款不同配置,以滿足不同用戶的需求。其中,性價比最高的“超大杯”版本HY90,搭載了雙路AMD EPYC 9355服務器、24條48G 6400M頻率的內存以及NV 5090D計算卡,支持FP8和INT4兩種數據精度。在FP8精度下,其運行滿血版DeepSeek的對話速度可達每秒21個token,而在INT4精度下則能達到每秒28個token,最高支持128K的上下文,售價為14.9萬元。行云集成電路還將推出“大杯”HY70和“中杯”HY50兩個版本。
季宇團隊表示,通過對推理引擎的獨家優化,行云集成電路成功提升了推理效率,使得“褐蟻”成為國內首款在10萬元價位提供滿血FP8精度模型、每秒20個以上token速率的一體機產品。該一體機還可配置各類調用大模型API的應用,為用戶提供了極大的靈活性。
行云集成電路成立于2023年8月,其核心團隊匯聚了來自清華大學及全球頂尖芯片公司的精英人才,致力于研發下一代針對大模型推理場景的高效能GPU芯片。公司的創始人除了季宇外,還包括CTO余洪敏。季宇在華為期間曾負責多個昇騰編譯器項目,并在AI編譯器領域和處理器微架構領域取得了諸多突破性成果。
在融資方面,行云集成電路于2024年11月宣布完成了總額數億元的天使輪及天使+輪融資,投資方涵蓋了智譜AI、仁愛集團、中科創星、奇績創壇、水木清華校友基金、嘉御資本、春華資本、同創偉業、峰瑞資本等多家知名機構。
隨著AI技術的快速發展,多家芯片、服務器、云計算、運營商等領域的公司都推出了DeepSeek一體機產品,市場競爭異常激烈。然而,能夠運行滿血版DeepSeek-V3/R1模型的企業并不多,行云集成電路憑借其“褐蟻”一體機,在國產GPU芯片領域占據了一席之地。
盡管一體機在市場上備受追捧,但一位行業人士指出,一體機核心解決的是部署易用性問題,相比復雜的云計算解決方案,一體機具有項目落地周期快、私有化安全性高、價格更具性價比等優勢。然而,一體機也存在持續維護、升級以及大規模數據調度等難題,且綜合使用成本較高,難以復用。
對此,季宇表示,目前一體機依然能夠運行超大杯的MoE模型和30b當量的dense模型,后續模型迭代問題并不大。相比其他一體機產品,行云集成電路的“褐蟻”在顯存、KTransformers等層面擁有更多的技術研發能力,為用戶提供了更好的使用體驗。
據透露,行云集成電路下一步將自研GPU卡,以進一步降低價格并提高tps體驗。同時,公司還將實施由30臺“褐蟻”一體機組成的“蟻群”方案,發揮分布式系統優化能力,支持500-1000的有效并發數,價格有望降至300萬-400萬元,低于英偉達HGX H200集群的整體硬件成本。
隨著AI技術的不斷進步和應用場景的不斷拓展,國內AI算力行業正迎來前所未有的發展機遇。行云集成電路作為該領域的佼佼者,將憑借其強大的技術實力和創新能力,為用戶提供更加高效、便捷、低成本的AI算力解決方案。