6月18日至20日,2025中國國際金融展在上海世博展覽館盛大召開,本次展會以“開放創新,科技賦能,共創金融新未來”為主題,展示中國金融改革創新的豐碩成果、科技塑造未來金融生態的實踐案例。

河南昆侖技術有限公司(以下簡稱:昆侖技術)作為領先的國產化算力提供者,本次連續三年參會,攜自主創新、AI使能、綠色低碳三大核心能力重磅亮相,在展示金融基礎設施領域最新成果的同時,通過一系列創新解決方案助力金融機構實現業務突破與可持續增長。
自主創新 全景算力布局
人工智能正在深刻改變著我們的世界。國產化通用計算加速進入企業核心生產系統,AI生態持續完善,對軟硬協同提出更高要求。
昆侖技術成立于2022年10月,核心團隊來自鯤鵬+昇騰,擁有超過20年的技術積累和市場經驗。

昆侖技術致力于成為領先的國產化算力提供者,圍繞計算產業根技術融合創新,推出KunLunPoD、KunLun G5680 V2、KunLun G2280/G2200等一系列產品,覆蓋從推理到訓練、從單卡到模組、從風冷到液冷全方位需求。同時提供DeepSeek一體機部署方案,多規格配置,全場景智能引領。昆侖技術不僅為金融機構提供了安全可靠的技術底座,還幫助客戶降低運營成本,提升資源利用效率。
AI使能 加速金融智能化落地
在AI技術快速發展的背景下,金融行業面臨著集群并行效率低、生態切換復雜、應用落地難等挑戰。昆侖技術的KunLun AI Space大模型加速引擎正是為解決這些問題而生。

KunLun AI Space致力于幫助客戶解決東西方生態遷移過程中的各類問題,助力AI+行業應用快速落地:
第一階段“點亮”,利用集群跨越生態裂谷,部署工具提升環境部署效率,解決AI芯片和OS生態碎片化問題;
第二階段“跑起來”,通過模型/算子使能加速庫,解決大模型技術路線切換的生態問題,當前已在200+項目中幫助客戶解決500+模型問題;
第三階段“用得好”,通過一站式應用使能平臺、推理加速引擎等工具包,使模型上市周期縮短50%,應用開發周期縮短90%以上。
截至目前,KunLun AI Space大模型加速引擎已累計助力160+客戶完成AI 生態遷移,涵蓋運營商、互聯網、金融、政企等8大行業50多業務場景,使資產算力真正成為好用算力。
昇騰300I Duo+自研算子
國產化全棧方案彎道超車
為進一步完善國產化DeepSeek推理方案,昆侖技術針對昇騰300I Duo推理卡重構軟件技術底座:
Marlin算子替代:自主研發基于昇騰300I Duo推理卡深度優化的INT4*BP16反量化矩陣乘算子,大幅減小顯存占用與NPU帶寬壓力,充分激發昇騰300I Duo推理卡的澎湃算力;
注意力計算引擎適配:集成昇騰NPU原生加速庫,利用npu_fusion_attention算子,實現KV Cache復用率和上下文窗口的大幅提升,顯著提升長序列任務的計算密度與推理效率;
顯存分配與卸載策略優化:針對昇騰300I Duo推理卡更細致的顯存分配與卸載策略;
昆侖技術在大模型推理領域的突破,不僅顯著降低了推理成本,更通過創新技術方案提升了AI算力的可及性與效率,推動AI技術在更多行業和場景中的深度應用。
未來,隨著技術的持續迭代和生態系統的完善,昆侖技術將推出更多創新解決方案,推動全球AI產業向更高效、更普惠的方向發展。
綠色低碳 打造可持續發展新標桿
隨著“雙碳”目標的提出,金融機構對綠色節能的需求日益迫切。昆侖技術推出的KunLunPoD整機柜液冷服務器,憑借其高能效、綠色節能和極簡運維等特點,成為金融行業數字化轉型中的重要選擇。

KunLunPoD整機柜液冷服務器,采用創新的三總線盲插設計,實現100%全液冷,可使數據中心的局部能效達成pPUE小于1.06的極高水平。該產品面向高性能計算中心和一體化大數據中心場景,支持云、計算、存儲、網絡、能源的原生一體化部署,顯著提升資源利用率,降低能耗,助力金融機構實現低碳運營,為行業的可持續發展樹立了新標桿。

同期,昆侖技術與愛數深度合作,整合雙方在算力和數據領域的創新優勢,推出面向金融業務場景創新的Data+AI 產品解決方案,實現非結構化數據管理與全域數據保護,不斷推動金融行業大模型的私有化落地,跨越安全、幻覺、成本等多重鴻溝,為金融機構提供更加安全、經濟、高效的智能化解決方案。

昆侖技術與科藍軟件聯合打造的AI原生手機銀行解決方案首發登場。該方案得益于昆侖技術的高效算力分配與智能體間極速通信,從需求洞察到方案呈現,再到交易執行,極大提升服務效率與用戶滿意度。
金融行業是數字化轉型的重要領域,也是AI技術應用的前沿陣地。昆侖技術將始終堅持以客戶為中心,以AI先行、軟件使能、伙伴協同戰略,縱向做深構筑競爭力,橫向擴展軟硬協同,持續為客戶和伙伴創造價值,助力行業數字化轉型。