谷歌推出了其最新版本的文本生成圖像模型 Imagen 4,并推出了高端版本 Imagen 4 Ultra。與前代產(chǎn)品 Imagen 3 相比,此次更新旨在顯著提升文本渲染效果。目前,這兩個(gè)版本已上線(xiàn) Gemini API 的付費(fèi)預(yù)覽版,并在 Google AI Studio 提供有限的免費(fèi)測(cè)試。
谷歌將 Imagen 4 定位為“適用于大多數(shù)任務(wù)”的通用模型,每張圖像為定價(jià) 0.04 美元(IT之家注:現(xiàn)匯率約合 0.29 元人民幣)。而 Imagen 4 Ultra 則被設(shè)計(jì)為能夠更精準(zhǔn)地遵循文本提示詞的高端版本,其價(jià)格較普通版高出 50%,每張圖像收費(fèi) 0.06 美元(現(xiàn)匯率約合 0.43 元人民幣)。谷歌聲稱(chēng),與 Dall-E 和 Midjourney 等其他圖像生成器相比,Imagen 4 Ultra 的輸出結(jié)果更為“出色(strong)”。
在展示環(huán)節(jié)中,谷歌展示了 Imagen 4 Ultra 生成的一系列圖像,包括一幅三格漫畫(huà),內(nèi)容是一艘小型宇宙飛船被一只巨大的藍(lán)色太空蜥蜴攻擊,漫畫(huà)中還配有“嘎吱”等音效,甚至出現(xiàn)了令人費(fèi)解的“哈迪”字樣。該圖像完全按照文本提示詞生成,效果尚可,類(lèi)似于 3D 應(yīng)用程序中的卡通渲染效果。
Imagen 4 Ultra
另一個(gè)文本提示詞是“京都復(fù)古旅行明信片的正面:櫻花樹(shù)下的標(biāo)志性寶塔,遠(yuǎn)處的雪山,晴朗的藍(lán)天,鮮艷的色彩”。Imagen 4 Ultra 按照提示生成了圖像,雖然風(fēng)格較為普通,但細(xì)節(jié)上基本符合要求。此外,還有展示登山情侶在巖石上揮手的圖像,以及一幅“前衛(wèi)”風(fēng)格的時(shí)尚攝影圖像。這些圖像質(zhì)量確實(shí)不錯(cuò),也精準(zhǔn)地符合了文本提示詞,但整體仍然顯得高度機(jī)械化。
盡管 Imagen 4 在性能上較前代有所提升,但其表現(xiàn)并未讓人眼前一亮,尤其是在與市場(chǎng)領(lǐng)導(dǎo)者 Dall-E 3 和 Midjourney 7 相比時(shí)。此外,在最初的熱情過(guò)后,公眾對(duì) AI 藝術(shù)的興趣似乎正在消退,其主要應(yīng)用場(chǎng)景似乎變成了社交媒體上的垃圾廣告。