滾動資訊

當前位置：首頁 > 資訊 > 人工智能 > 正文內容

OpenAI推出RFT技術：o4-mini模型定制進入新階段

時間：2025-05-09 14:03:03 來源：ITBEAR編輯：快訊團隊 發表評論無障礙通道

近期，科技領域迎來了一項重大進展。OpenAI公司宣布，在其最新推出的o4-mini推理模型上，成功融入了強化微調技術（RFT），這一創新為定制化基礎模型以適應多樣化任務提供了強有力的支持。

RFT技術將強化學習原理巧妙應用于語言模型的微調階段，這意味著開發者們不再完全依賴于標注數據。相反，他們可以通過設計特定任務的評分函數來評估模型的輸出。這些評分函數基于自定義標準，如準確性、格式或語氣，為模型的表現打分。模型則通過優化獎勵信號，逐步學習并生成符合預期的行為。

RFT特別適用于那些難以設定標準答案的復雜任務。例如，在醫療領域，措辭的優化往往至關重要。開發者可以利用程序評估醫療解釋的清晰度和完整性，從而指導模型不斷改進。這種方法為處理各種復雜、領域特定的任務提供了全新的視角和解決方案。

o4-mini是OpenAI于今年4月發布的一款緊湊型推理模型，它支持文本和圖像輸入，尤其擅長結構化推理和鏈式思維提示。通過結合RFT技術，o4-mini為開發者提供了一個既輕便又強大的基礎模型，非常適合處理高風險、領域特定的推理任務。其高計算效率和快速響應的特點，也使得它在實時應用場景中表現出色。

多家早期采用者已經展示了RFT在o4-mini上的巨大潛力。例如，Accordance AI利用RFT開發的稅務分析模型，準確率提升了39%；Ambience Healthcare通過優化醫療編碼，ICD-10分配性能提高了12個百分點；法律AI初創公司Harvey在法律文檔引文提取方面，F1分數提升了20%；Runloop在改進Stripe API代碼生成方面，性能也提升了12%。調度助手Milo和內容審核工具SafetyKit也取得了顯著的進步。

要使用RFT技術，開發者需要完成四個步驟：首先，設計符合需求的評分函數；其次，準備高質量的數據集；然后，通過OpenAI API啟動訓練任務；最后，持續評估和優化模型表現。這一流程為開發者提供了清晰的指導和路徑。

目前，RFT技術向認證組織開放。訓練費用為每小時100美元，如果使用GPT-4o等模型作為評分工具，還將額外按標準推理費率計費。為了鼓勵更多組織參與研究和應用，OpenAI還推出了激勵措施：同意共享數據集用于研究的組織可以享受50%的訓練費用折扣。

隨著RFT技術的不斷推廣和應用，我們有理由相信，它將在更多領域發揮巨大的作用，推動人工智能技術的進一步發展和創新。

舉報 0 收藏 0 打賞 0評論 0

更多>同類資訊

蘋果AI戰略陷困境，Siri升級難產背后的猶豫與分歧

05-19

蘋果或允許歐盟用戶更換默認語音助手，Siri不再是唯一選擇？

05-19

鄭緯民院士：國產芯片生態構建，類CUDA系統成關鍵？

05-18

搜狐科技論壇聚焦AI：張朝陽呼吁人類面對科技驚喜需保持清醒

05-18

AI浪潮下，張朝陽：若晚生30年我也會投身AI與人形機器人領域

05-18

羅永浩AI創業新動向：或將攜手百度，共同探索AI領域？

5月18日晚間消息，新浪科技從知情人士處獲悉，羅永浩的AI創業項目或與百度展開合作。近日，羅永浩現身百度辦公區的消息也引發了小范圍討論。據了解，羅永浩自2022年創立細紅線科技有限公司，原計劃聚焦AR領域，…

05-18

羅永浩AI創業新動向：或與百度攜手共進？

05-18

羅永浩現身百度杭州？疑似攜手AI領域展開新合作

多位網友在網上曬圖稱，羅永浩昨日現身百度。圖片顯示，羅永浩身穿黑色衣服，走在工作人員身后，背景有百度的logo，發帖人定位是百度（杭州）分公司。若羅永浩和百度合作，AI可能是合作點之一。近期羅永浩的西紅…

05-18

中小學AI教育新規：禁用AI代寫作業，強化教師角色

新榜訊近日，《中小學人工智能通識教育指南（2025 年版）》與《中小學生成式人工智能使用指南（2025 年版）》已正式發布。據悉，其中明確禁止學生直接將人工智能生成內容復制用作作業或考試答案，且小學階段學生…

05-18

AI無外界干預也能“結社”，自發形成獨特規范和習俗？

05-18

鄭緯民院士：國產大模型訓練亟需“類CUDA”系統，生態構建成關鍵

05-18

搜狐科技論壇聚焦科技前沿，張朝陽：科學世界比AI更廣闊

05-18

張朝陽論AI未來：直覺之辯與晚年商業優化傾向

05-18

張朝陽論AI發展：科技狂歡下，人類清醒何處尋？

05-18

中國GPU市場競爭激烈，英偉達獨占7成，華為昇騰緊追其后！

05-18

點擊查看更多 +

全站最新

Ampcera攜手Xponential，共探硫固態電池新篇章，助力電動汽車續航升級

AMG新車3.0T+48V輕混爆發367馬力，500N·m扭矩，兄弟，這車你喜歡嗎？

混動菲亞特500預生產啟動，年產量預計達10萬輛，設計細節曝光

AMD服務器市場收入占比逼近四成，多產品線齊頭并進顯強勢

OPPO K13 Turbo曝光：機甲風后蓋+主動散熱風扇，性能怪獸來襲？

AMD服務器市場收入近四成，桌面與移動市場同步高歌猛進

熱門內容

本欄最新

蘋果或允許歐盟用戶更換默認語音助手，Siri不再是唯一選擇？

鄭緯民院士：國產芯片生態構建，類CUDA系統成關鍵？

搜狐科技論壇聚焦AI：張朝陽呼吁人類面對科技驚喜需保持清醒

AI浪潮下，張朝陽：若晚生30年我也會投身AI與人形機器人領域

羅永浩現身百度杭州？疑似攜手AI領域展開新合作

鄭緯民院士：國產大模型訓練亟需“類CUDA”系統，生態構建成關鍵

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區魯ICP備11015305號-1 商業合作入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

日本精品一区二区三区高清 久久

OpenAI推出RFT技術：o4-mini模型定制進入新階段

日本精品一区二区三区高清久久