在人工智能領域追求透明與開放的浪潮中,瑞士科研界正以實際行動推動行業變革。由蘇黎世聯邦理工學院(ETH Zurich)、瑞士聯邦理工學院洛桑分校(EPFL)及瑞士國家超級計算中心(CSCS)聯合研發的Apertus語言模型近日正式亮相,其"全透明"發布模式引發全球關注。
這款以拉丁語"開放"為名的模型,打破了當前主流語言模型的封閉生態。與GPT系列、Llama或Claude等美國科技巨頭的產品不同,Apertus團隊選擇將模型權重、架構設計、訓練代碼、數據構成及訓練日志等核心要素全部公開。這種前所未有的開放程度,使得全球科研人員能夠直接審查模型運作機制,而非僅通過接口調用獲取結果。
研發團隊強調,完全透明的發布策略旨在構建開放協作的科研生態。通過共享從底層算法到訓練細節的全鏈條信息,開發者不僅可以驗證模型性能,更能基于原始架構進行定制化改進。這種模式特別有利于資源有限的研究機構,使其無需重復投入即可參與前沿技術探索。
作為歐洲首個實現"全要素開源"的大型語言模型,Apertus的發布被視為對AI技術民主化的重要實踐。其技術文檔顯示,模型訓練過程嚴格遵循可復現原則,所有參數配置與數據預處理步驟均詳細記錄,為后續研究提供了標準化參考框架。
業內專家指出,瑞士科研機構的這次嘗試可能重塑AI開發范式。當技術細節不再被少數企業壟斷,全球創新力量將得以更高效地匯聚,這或許能加速突破當前語言模型在可解釋性、倫理約束等方面的技術瓶頸。