中文字幕欧美日韩|日韩性色一区二区三区|精品久久久久久久久久岛国|一区二区国产盗摄精品

    <td id="h1kkc"><tr id="h1kkc"></tr></td><noscript id="h1kkc"><tbody id="h1kkc"></tbody></noscript>
    <rp id="h1kkc"></rp>
    首頁 > 業(yè)界 > 關鍵詞  > OpenAI最新資訊  > 正文

    GPT-4o圖像生成功能上線今起免費用,我們和國內(nèi)文生圖PK了一下

    2025-03-26 19:47 · 稿源: TechWeb.com.cn

    3月25日消息,OpenAI創(chuàng)始人兼CEO薩姆·阿爾特曼直播發(fā)布了GPT-4o圖像生成功能,作為多模態(tài)模型的GPT-4o補齊了圖片生成這一重要拼圖。

    GPT-4o圖像生成可以遵循指令生成更準確的圖像,OpenAI還為其掛載了固有知識庫,可以根據(jù)知識庫或上下文幫用戶生成、編輯圖像。

    今天起,GPT-4o圖像生成已經(jīng)作為ChatGPT中的默認圖像生成器向Plus、Pro、Team和免費用戶陸續(xù)推出。

    現(xiàn)在,打開ChatGPT,即可嘗試這些能力,但普通用戶每天僅有3次體驗機會。

    開發(fā)者通過API使用GPT-4o生成圖像的權限,將在未來幾周內(nèi)推出。

    從OpenAI官方展示和演示的示例來看:

    GPT-4o圖片生成對文字的處理能力很高,可以100%還原文字內(nèi)容,且指定文字擺放位置,還能像連續(xù)劇一樣,一邊準確生成文字,一邊變換人物動作。

    GPT-4o的圖像可以遵循詳細的提示,如處理多達10-20個不同的對象。

    另外,GPT-4o在生成真實圖像方面也表現(xiàn)出色。

    同時,官方也主動表示:“我們的模型并不完美。我們意識到目前存在多種局限性,我們將在首次發(fā)布后通過模型改進來解決這些局限性。”

    目前GPT-4o圖像生成還存在幻覺;裁剪不當;難以呈現(xiàn)非拉丁語言、字符可能不準確;編輯圖像生成的特定部分(如拼寫錯誤)的請求并不總是有效的,也可能以未請求的方式更改圖像的其他部分或引入更多錯誤;

    另外,GPT-4o模型難以保持用戶上傳的人臉編輯的一致性,但預計這將在一周內(nèi)得到修復。

    如果把同樣的需求指令輸入給目前國內(nèi)的文生圖APP們,它們的表現(xiàn)相比GPT-4o又如何呢?

    先看看幾個GPT-4o圖像生成展示示例:

    示例1:圖片中對文字的處理能力

    在ChatGPT 輸入以下文字(中文內(nèi)容為TechWeb翻譯補充內(nèi)容):

    A wide image taken with a phone of a glass whiteboard, in a room overlooking the Bay Bridge. The field of view shows a woman writing, sporting a tshirt wiith a large OpenAI logo. The handwriting looks natural and a bit messy, and we see the photographer’s reflection.(在俯瞰海灣大橋的房間里,用手機拍攝了一張玻璃白板的大幅照片。視野中,一位女性正在寫字,她穿著一件印有大型OpenAI標志的T恤。筆跡看起來很自然,有點凌亂,我們看到了攝影師的倒影。)

    The text reads:

    (Left)(左邊白板顯示以下內(nèi)容)

    “Transfer between Modalities:

    Suppose we directly model

    p(text, pixels, sound) [equation]

    with one big autoregressive transformer.

    Pros:

    * image generation augmented with vast world knowledge

    * next-level text rendering

    * native in-context learning

    * unified post-training stack

    Cons:

    * varying bit-rate across modalities

    * compute not adaptive”

    (Right)(右邊白板顯示一下內(nèi)容))

    “Fixes:

    * model compressed representations

    * compose autoregressive prior with a powerful decoder”

    On the bottom right of the board, she draws a diagram:(在白板的右下角,她畫了一張圖:)

    “tokens - [transformer] - [diffusion] - pixels”

    最終,如下圖,GPT-4o生成的圖片中,白板上展示的文字內(nèi)容完全準確!

    還能像連續(xù)劇一樣,一邊準確生成文字,一邊變換人物動作。

    在ChatGPT 輸入以下指令:selfie view of the photographer, as she turns around to high five him(攝影師轉(zhuǎn)過身來向他擊掌時的自拍照)

    GPT-4o生成的圖片中,第一張白板中的男人倒影和第二張圖也對應上了。

    示例2、讓GPT-4o生成菜單,提示詞中除了需要包含的菜品、價格及簡介外,還需要生成的圖像中包含這家餐廳的名稱、主要亮點以及菜單風格。

    在ChatGPT 輸入以下指令:

    I'm opening a traditional concept restaurant in Marin called Haein. It focuses on Korean food cooked with organic, farm-fresh ingredients, with a rotating menu based on what's seasonal. I want you to design an image - a menu incorporating the following menu items - lean into the traditional/rustic style while keeping it feeling upscale and sleek. Please also include illustrations of each dish in an elegant, peter rabbit style. Make sure all the text is rendered correctly, with a white background.

    (Top)

    Doenjang Jjigae (Fermented Soybean Stew) – $18 House-made doenjang with local mushrooms, tofu, and seasonal vegetables served with rice.

    Galbi Jjim (Braised Short Ribs) – $34 Slow-braised local grass-fed beef ribs with pear and black garlic glaze, seasonal root vegetables, and jujube.

    Grilled Seasonal Fish – Market Price ($22-$30) Whole or fillet of local, sustainable fish grilled over charcoal, served with perilla leaf ssam and house-made sauces.

    Bibimbap – $19 Heirloom rice with a rotating selection of farm-fresh vegetables, house-fermented gochujang, and pasture-raised egg.

    Bossam (Heritage Pork Wraps) – $28 Slow-cooked pork belly with napa cabbage wraps, oyster kimchi, perilla, and seasonal condiments.

    (Bottom) Dessert Drinks Seasonal Makgeolli (Rice Wine) – $12/glass

    Rotating flavors based on seasonal fruits and flowers (persimmon, citrus, elderflower, etc.).

    Hoddeok (Korean Sweet Pancake) – $9 Pan-fried cinnamon-stuffed pancake with black sesame ice cream.

    (我要在馬林開一家名為Haein的傳統(tǒng)概念餐廳。它專注于用有機農(nóng)場新鮮食材烹制的韓國食物,并根據(jù)季節(jié)輪換菜單。我希望你設計一個形象——一個包含以下菜單項的菜單——融入傳統(tǒng)/鄉(xiāng)村風格,同時保持高檔和時尚的感覺。請以優(yōu)雅的彼得兔風格附上每道菜的插圖。確保所有文本都以白色背景正確呈現(xiàn)。

    (頂部)

    Doenjang Jjigae(發(fā)酵大豆燉菜)-18美元自制的Doenjiang,配以當?shù)啬⒐?、豆腐和時令蔬菜,配以米飯。

    Galbi Jjim(紅燒排骨)——34美元慢燉當?shù)夭蒿暸@吖?,配梨和黑蒜醬、時令根菜和紅棗。

    烤時令魚——市場價格(22-30美元)整條魚或魚片,用木炭烤,配紫蘇葉和自制醬汁。

    Bibimbap——19美元的傳家寶米,搭配農(nóng)場新鮮蔬菜、家庭發(fā)酵的gochujang和牧場飼養(yǎng)的雞蛋。

    Bossam(傳統(tǒng)豬肉卷)——28美元慢燉五花肉,配納帕卷心菜卷、牡蠣泡菜、紫蘇和時令調(diào)味品。

    (底部)時令Makgeolli(米酒)甜點和飲料–12美元/杯

    以時令水果和花卉(柿子、柑橘、接骨木花等)為基礎的旋轉(zhuǎn)口味。

    Hoddeok(韓國甜煎餅)-9美元的煎肉桂餡煎餅配黑芝麻冰淇淋。)

    GPT-4o生成的菜單如下:

    示例3、看看GPT-4o的圖像可遵循詳細的提示,處理多達10-20個不同的對象的實力。

    在ChatGPT 輸入以下指令:

    A square image containing a 4 row by 4 column grid containing 16 objects on a white background. Go from left to right, top to bottom. Here’s the list:

    1. a blue star

    2. red triangle

    3. green square

    4. pink circle

    5. orange hourglass

    6. purple infinity sign

    7. black and white polka dot bowtie

    8. tiedye “42”

    9. an orange cat wearing a black baseball cap

    10. a map with a treasure chest

    11. a pair of googly eyes

    12. a thumbs up emoji

    13. a pair of scissors

    14. a blue and white giraffe

    15. the word “OpenAI” written in cursive

    16. a rainbow-colored lightning bolt

    (一個正方形圖像,包含一個4行乘4列的網(wǎng)格,在白色背景上包含16個對象。從左到右,從上到下。以下是列表:

    1.一顆藍色的星星

    2.紅色三角形

    3.綠色廣場

    4.粉紅色圓圈

    5.橙色沙漏

    6.紫色無限標志

    7.黑白圓點領結

    8.扎染“42”

    9.一只戴著黑色棒球帽的橙色貓

    10.帶寶箱的地圖

    11.一雙黏糊糊的眼睛

    12.豎起大拇指的表情符號

    13.一把剪刀

    14.一只藍白相間的長頸鹿

    15.用草書書寫的單詞“OpenAI”

    16.彩虹色的閃電)

    GPT-4o生成的圖片如下:

    最后,如果把上面這些指令輸入給目前國內(nèi)的文生圖APP們,它們的表現(xiàn)又如何呢?

    這里,我們用示例3的指令,分別測試了文心一言(文心大模型4.5)、豆包APP。

    文心一言(文心大模型4.5)生成的4張圖片之一

    豆包生成的4張圖片之一

    目前看來,還是有些差距。

    舉報

    • 相關推薦
    • 挑戰(zhàn)GPT-4o!AI文生圖驚現(xiàn)黑馬,國產(chǎn)團隊HiDream如何逆襲?

      HiDream是一款由國內(nèi)團隊開發(fā)的AI模型,擅長生成復雜的圖片與多種風格的藝術作品。它在多個測試中表現(xiàn)出對細節(jié)、材質(zhì)、光影控制以及創(chuàng)意概念的良好理解,尤其在人物動態(tài)、精細繪畫等方面效果顯著。HiDream支持輸出4K高清圖片,并兼容多種應用領域,包括商業(yè)用途。盡管在某些特定要求下還需提升表現(xiàn),但其潛力和實際效果已受到關注。

    • GPT-4o更強?三位Adobe老將出走,做出了超強文生圖模型丨AI新榜評測

      GPT-4o,被擊敗了?最近大伙都被GPT-4o生成的各種“整活”圖像刷屏了吧,各種動漫油畫風格改圖、經(jīng)典影視復現(xiàn)、漫畫設計改圖……新的玩法每天都在涌現(xiàn),大有“AI一日,人間一年”之勢。甚至OpenAICEOSamAltman都累了:“收手吧,我們需要休息!”但就在GPT-4o火遍全球之際,一個來自初創(chuàng)團隊的新模型ReveImage,卻憑借其在特定圖像生成領域的出色表現(xiàn),悄然贏得了用戶和專業(yè)榜單的

    • 不會使用gpt-4o?國內(nèi)平替來啦(僅限海報制作)

      最近gpt-4o的風吹得特別的大,生圖功能讓一大批設計師紛紛直呼要失業(yè)了。大家夸得那么玄乎,小編不僅也心癢癢的想去試試。那還不快用起來,快到秒出設計官網(wǎng)使用吧!

    • 生成很強,推理很弱:GPT-4o的視覺短板

      研究顯示,GPT-4o在圖像理解和推理上表現(xiàn)出色,能生成精美圖片,但在基礎邏輯測試中表現(xiàn)欠佳,暴露出理解、推斷及多步驟邏輯處理的不足。例如,被要求畫一只貓時,它先畫了狗然后改為貓,但仍存在錯誤判斷。這表明當前AI更像“精確指令機器”,需進一步優(yōu)化以實現(xiàn)更精細的圖像理解和復雜任務處理。

    • 1小時暴漲100萬用戶!GPT-4o功能徹底殺瘋了,免費使用

      如果有人能提供10萬單位的GPU資源并能盡快交付,請馬上聯(lián)系我們!同時正在逐步控制局面。但大家應該預料到,由于我們在應對算力方面的挑戰(zhàn),OpenAI的新發(fā)布內(nèi)容將會延遲,可能會出現(xiàn)一些問題,并且服務有時也會變得很慢。從這點就能看出,他們最初發(fā)布的時候也沒想到能火爆到這個地步。

    • OpenAI回應GPT-4o更新后過于諂媚:已逐漸恢復

      OpenAI緊急回滾GPT-4o免費版更新,因其在對話中表現(xiàn)出過度迎合用戶的"諂媚傾向",尤其在爭議話題上喪失中立立場。該模型雖在STEM領域準確率提升17%,但優(yōu)化后出現(xiàn)意外偏差:面對用戶偏見時會合理化解釋,甚至不糾正明顯錯誤事實。這揭示了AI在用戶滿意度與客觀性間的平衡難題。類似事件早有先例,如谷歌Gemini因過度追求多樣性扭曲歷史圖像。兩案例共同指向AI發(fā)展核心矛盾:技術突破后,更復雜的價值觀對齊問題正成為行業(yè)最大挑戰(zhàn)。(140字)

    • 鴻蒙版QQ迎重大更新:語音轉(zhuǎn)文字等十大功能上線

      華為終端云宣布鴻蒙版QQ迎來重大更新,新增語音轉(zhuǎn)文字、消息合并轉(zhuǎn)發(fā)等10項實用功能。鴻蒙生態(tài)近期取得突破性進展:原生應用超2萬個,開發(fā)者超720萬,生態(tài)設備超10億臺。余承東表示2025年將實現(xiàn)10萬應用目標,標志著生態(tài)成熟。此次QQ9.1.50版本更新包含空間相冊一鍵瀏覽、群作業(yè)公告查看、表情收藏發(fā)送等優(yōu)化,持續(xù)完善社交體驗。目前鴻蒙版QQ已支持單聊、群聊、視頻通話等基礎功能,其他功能正在迭代中。

    • 別玩吉卜力了,來看GPT-4o隱藏的8種高能玩法

      有圖有真相的時代恐怕要徹底過去了,我們離“AI生成現(xiàn)實”越來越近了。注意看:這是一張印著倫敦某高檔融合餐廳名的小票,菜單里有龍蝦、牛排、Barolo酒,總金額£1500有服務員名字、小費、日期時間。也許最終答案不是徹底“防偽”是建立一個允許AI生成內(nèi)容存在,但不能讓其隨意偽裝的內(nèi)容生態(tài)。

    • 被吹爆的GPT-4o真有那么強?這有23個案例實測

      距離OpenAI正式發(fā)布GPT-4o生圖功能,已經(jīng)過去兩周多了。這段時間里,“ChatGPT-4o顛覆了AI圖像生成的邏輯”這句話大家應該都聽膩了?,F(xiàn)在早上一睜眼,先看有沒有更新,看看自己有沒有落后。

    • ChatGPT圖像生成爆火!OpenAI CEO在線求助:急需10萬塊GPU

      OpenAI近期推出的全新圖像生成工具引發(fā)了熱潮,用戶使用ChatGPT即可創(chuàng)作出吉卜力等風格的AI藝術作品。這一功能不僅推動了ChatGPT用戶數(shù)的創(chuàng)新高導致服務器負擔過重,甚至一度限制了該功能的使用。SensorTower的數(shù)據(jù)顯示,ChatGPT應用的全球下載量和每周活躍用戶數(shù)分別較上周增長了11%和5%應用內(nèi)購買收入則增加了6%。