近日,北京行云集成電路有限公司(簡稱“行云集成電路”)在AI領域引發了廣泛關注。這家由清華90后創立的公司,宣布推出了一款名為“褐蟻”的全新一體機產品,旨在以最高15萬元的價格,提供滿血版DeepSeek R1/V3大模型的運行能力,同時實現了20token/s的對話速度。
行云集成電路的創始人兼CEO季宇,在接受采訪時透露,“褐蟻”一體機已經成功支持了阿里最新發布的Qwen3系列開源大模型,包括其頂配版Qwen3-235B-A22B。季宇本人是清華大學物理系本科及計算機體系結構方向博士,并曾榮獲“華為天才少年”稱號,擁有豐富的AI芯片研發經驗。
“褐蟻”一體機提供了三款不同配置,其中最高性價比的“超大杯”版本HY90,搭載了雙路AMD EPYC 9355服務器、24條48G 6400M內存和NV 5090D計算卡。在FP8數據精度下,它能夠以21token/s的速度運行滿血版DS,而在INT4精度下則能達到28token/s,并支持最高128K的上下文處理,售價僅為14.9萬元。行云集成電路還計劃推出“大杯”HY70和“中杯”HY50兩個配置版本。
季宇團隊通過獨家優化推理引擎,顯著提升了推理效率,使得“褐蟻”成為國內首個在10萬元價位提供滿血FP8精度模型、速率超過20tps的一體機產品。該產品還支持配置各類調用大模型API的應用,為用戶提供了極大的便利。
行云集成電路成立于2023年8月,其核心團隊匯集了來自清華大學及全球頂尖芯片公司的精英。公司致力于研發下一代針對大模型推理場景的高效能GPU芯片,以推動AI技術的進一步發展。除了季宇外,公司CTO余洪敏也是核心團隊的重要成員。
季宇在華為期間曾負責多個昇騰編譯器項目,并在AI編譯器領域和處理器微架構領域取得了諸多突破性成果。他的加入無疑為行云集成電路注入了強大的技術實力。2024年11月,行云集成電路宣布完成了總額數億元的天使輪及天使+輪融資,吸引了多家知名投資機構的參與。
隨著AI技術的快速發展,一體機產品在市場上逐漸嶄露頭角。相比復雜的云計算解決方案,一體機具有部署簡單、項目落地周期快、私有化安全性高、價格更具性價比等優勢。然而,一體機也面臨著持續維護、升級以及大規模數據調度等挑戰。隨著大模型的快速演進,一體機的硬件和技術能力也需要不斷更新和升級。
盡管面臨諸多挑戰,季宇對“褐蟻”一體機的未來充滿信心。他表示,該產品目前仍能支持超大杯的MoE模型和30b當量的dense模型,后續模型迭代并不會對其造成太大影響。相比其他一體機產品,“褐蟻”在顯存、KTransformers等層面擁有更多的技術研發能力。
展望未來,行云集成電路計劃自研GPU卡,以進一步降低成本并提高tps體驗。同時,公司還將實施由30臺“褐蟻”一體機組成的“蟻群”方案,以發揮分布式系統優化能力,支持500-1000的有效并發數,并將價格降至300萬-400萬元之間,低于英偉達HGX H200集群的整體硬件成本。
隨著國內AI算力行業的快速發展,越來越多的人投身于一體機、AI Infra以及GPU服務器等算力“賣水人”的工作。然而,隨著推理模型技術的迅猛進步,大規模算力投入也引發了諸多質疑。未來,國內AI算力行業是否會經歷大浪淘沙,最終僅剩下大廠及頭部的幾家企業,還是會有更多人繼續“卷”性價比,這仍然是一個值得觀察的問題。