滾動資訊

當前位置：首頁 > 資訊 > 人工智能 > 正文內容

OpenAI推出GPT Image 1.5，奧爾特曼曬圖“玩梗” 圖像生成再升級

時間：2025-12-17 12:05:47 來源：互聯網編輯：快訊 IP：北京 發表評論無障礙通道

OpenAI近日正式推出全新圖像生成模型GPT Image 1.5，同步在ChatGPT平臺上線獨立圖像創作功能模塊。這款被定位為"旗艦級"的視覺生成工具，在圖像保真度與語義理解能力方面實現突破性進展，標志著多模態交互技術邁入新階段。

新模型最顯著的技術突破體現在對復雜指令的精準響應能力。測試數據顯示，無論是從零生成圖像還是基于現有照片進行二次創作，系統均能在保持主體特征完整性的前提下，準確執行用戶提出的構圖調整、元素替換等操作。特別是在服裝試穿、風格遷移等應用場景中，生成的圖像細節呈現度較前代提升40%以上，有效解決了傳統AI繪圖常見的"形變失真"問題。

針對長期困擾AI繪畫領域的文本渲染難題，研發團隊開發了專用語義解析引擎。該技術通過分層渲染機制，使生成的文字內容與背景圖像自然融合，在字體結構、陰影效果等維度達到專業設計水準。內部測試顯示，在包含多語言文本的復雜場景中，文字識別準確率提升至98.7%。

產品功能層面，ChatGPT完成重大界面革新。網頁端與移動應用同步新增"Images"獨立入口，內置20余種預設濾鏡及創作模板。用戶可通過拖拽操作實現元素級編輯，支持實時預覽調整效果。編輯工具箱包含智能摳圖、色彩校正等12項專業功能，操作邏輯貼近主流圖像處理軟件，顯著降低用戶學習成本。

項目研發團隊構成彰顯OpenAI的技術戰略布局。由Gabriel Goh領銜的核心團隊匯集了來自計算機視覺、自然語言處理等領域的頂尖專家，其中Sora視頻生成模型負責人Bill Peebles與DALL-E創始人Aditya Ramesh的深度參與，暗示新模型可能融合了動態場景模擬技術。多模態架構組負責人Prafulla Dhariwal透露，系統采用創新性的跨模態注意力機制，使圖像生成過程具備初步的時空推理能力。

為應對生成式AI引發的倫理爭議，項目特別組建跨學科安全審查團隊。該部門由二十余位法律專家、社會學家組成，開發了包含敏感內容識別、版權溯源等功能的智能過濾系統。據技術白皮書披露，模型訓練數據均經過三重脫敏處理，輸出內容將自動標注數字水印，便于追蹤傳播路徑。

商業應用層面，新功能采取分層開放策略。基礎圖像生成能力面向全體用戶免費開放，高級編輯功能與高分辨率輸出服務納入訂閱體系。API接口同步升級，支持第三方開發者調用模型核心能力，開發者社區已涌現出智能海報生成、虛擬試妝等創新應用案例。

盡管技術評測獲得廣泛認可，部分早期用戶指出模型在時間邏輯處理上存在瑕疵。例如生成的日歷圖像出現日期錯位現象，需借助其他工具修正。對此研發團隊回應稱，已收集相關案例用于優化訓練數據集，將在后續版本中重點改進時空關系理解模塊。

更多>同類資訊

9.18萬起售的歐拉5：以技術普惠與全球化布局重塑A級電動車價值新標桿

12-17

30萬級燃油SUV怎么選？途昂Pro與探險者，誰才是你的出行“理想型”？

12-17

vivo S50Pro mini驚艷登場：小屏旗艦配置強，影像續航皆出色3699元起售

影像方面，vivo S50Pro mini擁有行業唯一的實況模式，還有3倍黃金長焦Live功能。該機還搭載了自研原像引擎和大模型畫質增強技術，遠攝畫面更加清晰，細節表現更為出色，堪稱高能望遠神器，讓用戶隨手…

12-17

vivo新機S50上市即優惠，12GB+256GB僅2699元，配置強勁性價比高

搭配12GB LPDDR5X高速內存和256GB UFS4.1高速儲存所組成的“性能鐵三角”，在應對王者和原神等主流手游時，它不僅能夠渲染出色彩豐富且運行流暢的游戲畫面，而且，游戲時它還可以保持高幀率運行，散…

12-17

OpenAI發布GPT Image 1.5模型，奧爾特曼秀圖，多領域團隊助力技術升級

IT之家 12 月 17 日消息，OpenAI 昨日（12 月 16 日）發布博文，推出“全新旗艦 ChatGPT 圖像生成模型”GPTImage 1.5，并罕見公開了該項目背后的龐大研發團隊名單，并同步在…

12-17

全球機械硬盤價格止跌回升，多重因素驅動或開啟持續漲價周期

報告顯示，受中國信創產業采購策略調整及美國AI基礎設施擴張的雙重影響，2025 年第四季度 HDD 合約價格環比上漲約4%，創過去八個季度最大漲幅。另一方面，美國AI基礎設施快速擴張推高了相關成本。當來自…

12-17

vivo新機S50上市即“放價”，6500mAh大電池+IP69防水，僅2699元起

搭配12GB LPDDR5X高速內存和256GB UFS4.1高速儲存所組成的“性能鐵三角”，在應對王者和原神等主流手游時，它不僅能夠渲染出色彩豐富且運行流暢的游戲畫面，而且，游戲時它還可以保持高幀率運行，散…

12-17

2025年編程語言展望：Python與Java，誰將引領技術新潮流？

Java，作為另一種廣泛使用的編程語言，以其跨平臺能力和強大的性能而著稱。Python作為一種解釋型語言，其代碼在運行時逐行解釋執行，這可能導致性能上的不足。開發者在選擇編程語言時，應考慮項目需求、個人技能和…

12-17

企商在線王新鉦當選全國工商聯人工智能委員助力AI產業融合發展

近日，全國工商聯人工智能委員會2025年度工作會議期間，企商在線董事長兼總經理王新鉦憑借在推動人工智能應用與數字新基建產業發展領域的卓越貢獻，當選為新晉委員。全國工商聯人工智能委員會匯聚了國內人工智能領域的…

12-17

Apple Music牽手ChatGPT：自然語言指令助力，輕松創建專屬音樂歌單

12-17

?Nvidia加碼開源AI生態：收購SchedMD 推Nemotron 3及自動駕駛新模型

12-17

2026年國內車市微增長新能源汽車銷量或破2000萬大關

12-17

七豐精工：從“小螺絲”起步邁向高端緊固連接“大舞臺”

12-17

歐拉5上市！9.18萬起售，智能科技加持，純電續航最高達580km

12-17

勝通能源3連板或迎新主！七騰機器人擬16.86億入主，85后創始人掌舵

12-17

點擊查看更多 +

全站最新

起亞第二代Seltos來襲：尺寸升級動力多樣科技配置豐富將登場

20萬級燃油SUV對決：豐田RAV4榮放與大眾途觀L誰更值得入手？

長城歐拉5 SUV上市！9.18萬起售，配置豐富滿足多元需求

長城歐拉5上市：以“求真”破局，為汽車行業立起“知情權”新標桿

北京現代羿歐EO：中國研發生產，2026年進軍澳大利亞家用電動車市場

塵封四十載名號重生！法拉利849 Testarossa攜科技復古風震撼登場

熱門內容

本欄最新

9.18萬起售的歐拉5：以技術普惠與全球化布局重塑A級電動車價值新標桿

30萬級燃油SUV怎么選？途昂Pro與探險者，誰才是你的出行“理想型”？

2026年國內車市微增長新能源汽車銷量或破2000萬大關

歐拉5上市！9.18萬起售，智能科技加持，純電續航最高達580km

歐拉5純電SUV煥新登場，9.18萬起售，高顏值高配置實力圈粉

歐拉5上市：激光雷達加持，智能配置拉滿，緊湊型純電SUV新選擇來了

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區魯ICP備11015305號-1 聯系入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

日本精品一区二区三区高清 久久

OpenAI推出GPT Image 1.5，奧爾特曼曬圖“玩梗” 圖像生成再升級

日本精品一区二区三区高清久久