谷歌近期在生成式AI領域邁出了重要一步,通過Gemini API平臺正式推出了其最新的文本生成圖像模型——Imagen4。這一創新成果不僅標志著AIGC技術的一次重大飛躍,也為開發者們帶來了全新的高質量視覺內容創作工具,據谷歌官方博客及社區用戶的積極反饋顯示。
為了滿足不同需求,Imagen4提供了兩種規格:標準版Imagen4和高級版Imagen4Ultra,分別定價為每張圖像0.04美元和0.06美元。目前,這兩款模型已在Gemini API及Google AI Studio上線,并提供付費預覽服務,同時開放了一定數量的免費試用名額供開發者體驗。
與前代模型Imagen3相比,Imagen4在文本到圖像的渲染質量上實現了顯著提升,能夠生成高達2K分辨率的圖像,并支持從寫實到抽象等多種藝術風格的創作。尤為其“快速模式”將生成速度提高了10倍,極大地滿足了高效創作的需求。而Imagen4Ultra則專為需要高精度提示對齊的場景設計,如廣告設計和出版物制作等,提供了更為精細的控制能力。
谷歌還采取了一項重要措施,即為所有通過Imagen4生成的圖像嵌入SynthID數字水印。這一舉措不僅確保了生成內容的可追溯性,還有助于打擊虛假信息的傳播,維護信息的真實性和可信度。
開發者們現在可以通過Google AI Studio免費試用Imagen4,或者選擇在Gemini API中集成該模型,以便快速構建出具有創新性的應用。自Imagen4發布以來,社區內的反響極為熱烈,眾多開發者將其譽為“文本生成圖像領域的新標桿”,并對其在創作效率和質量上的提升給予了高度評價。