近期,科技界傳來一則令人矚目的消息:OpenAI計劃在今夏初推出一款自GPT-2之后的全新“開源”語言模型,這一消息引起了業(yè)界的廣泛關注。隨著細節(jié)的逐步披露,人們對這款新模型的期待值也在不斷提升。
據知情人士向TechCrunch透露,OpenAI研究副總裁Aidan Clark正親自掛帥,領導這款開源模型的開發(fā)工作。目前,該模型仍處于研發(fā)的初級階段,但OpenAI已明確表示,希望其能在推理能力上超越現有的同類開源模型。為此,OpenAI計劃采用一種高度寬松的許可協議,幾乎不對模型的使用或商業(yè)化設置任何限制,這無疑是對此前一些開源模型因限制過多而飽受詬病的一種有力回應。
據悉,這款開源模型將遵循“輸入文本,輸出文本”的基本模式,同時可能賦予開發(fā)者極大的靈活性。開發(fā)者可以根據需要,自由選擇開啟或關閉模型的“推理”功能。雖然開啟推理功能能夠提升模型的準確性,但相應地也會增加處理延遲。這一設計思路,與近期由Anthropic等公司發(fā)布的推理模型有著異曲同工之妙。
OpenAI的這一舉措,無疑是對當前開源語言模型領域的一次重大革新。在過去,一些開源模型如Llama和谷歌的Gemma等,因種種限制而引發(fā)了社區(qū)的不滿。OpenAI此次推出的開源模型,不僅旨在避開這些爭議,更希望通過更加開放和靈活的使用方式,推動語言模型技術的進一步發(fā)展。
OpenAI還透露了一個令人振奮的消息:如果這款開源模型發(fā)布后反響熱烈,他們可能會繼續(xù)推出更多模型,包括更小型的版本。這無疑將為開發(fā)者提供更加多樣化的選擇,滿足不同場景下的應用需求。