中文字幕欧美日韩|日韩性色一区二区三区|精品久久久久久久久久岛国|一区二区国产盗摄精品

    <td id="h1kkc"><tr id="h1kkc"></tr></td><noscript id="h1kkc"><tbody id="h1kkc"></tbody></noscript>
    <rp id="h1kkc"></rp>
    首頁 > 業(yè)界 > 關(guān)鍵詞  > OpenAI最新資訊  > 正文

    OpenAI推理模型o3發(fā)布:AGI能力暴漲 接近人類水平

    2024-12-21 09:01 · 稿源: 快科技

    **OpenAI 推出升級版先進(jìn)推理模型 o3,邁向通用人工智能**

    在連續(xù) 12 天的圣誕發(fā)布活動中,OpenAI 隆重推出了其迄今最強(qiáng)大的推理模型:o3。o3 在多個基準(zhǔn)測試中表現(xiàn)出色,接近通用人工智能 (AGI) 的能力。

    o3 有兩個版本:完整版 o3 和精簡版 o3-mini。與之前的 o1 模型相比,o3 在軟件工程測試中準(zhǔn)確率提高了 47%,在數(shù)學(xué)測評中提高了 15%,在生物化學(xué)測試中提高了 13%。

    值得注意的是,o3 在 AGI 相關(guān)測試中的最佳成績達(dá)到了 87.5,超過了人類水平的 85。這表明 o3 在類人智能方面取得了重大突破。

    OpenAI 計劃于明年初發(fā)布 o3 系列模型。首席執(zhí)行官 Altman 表示,在正式發(fā)布之前,他們希望建立一個聯(lián)邦政府的測試框架,以指導(dǎo)和監(jiān)控此類模型的潛在風(fēng)險。

    從本周五開始,安全研究人員可以注冊訪問 o3 和 o3-mini 的預(yù)覽版。

    **OpenAI 12 天技術(shù)直播活動要點**

    • 發(fā)布滿血版推理模型 o1 和 ChatGPT Pro(每月訂閱費 200 美元)。
    • 推出強(qiáng)化微調(diào)研究項目,支持使用高質(zhì)量任務(wù)定制模型。
    • 正式發(fā)布 AI 視頻生成模型 Sora Turbo,最高支持 1080p 20 秒視頻。
    • 發(fā)布升級版 Canvas 創(chuàng)作助手,向全量用戶開放。
    • 與蘋果合作發(fā)布 iOS 18.2,整合 ChatGPT 和其他 AI 功能。
    • 全量上線 4o 視頻通話。
    • 推出 Projects In ChatGPT,整合 ChatGPT 功能,簡化項目管理。
    • ChatGPT 搜索功能升級,新增地圖集成和實時搜索。
    • 開放滿血版 o1 模型 API,支持 WebRTC,定價大幅降低。
    • ChatGPT 入駐手機(jī),可通過免費號碼撥打,每月免費通話 15 分鐘。
    • 支持原生應(yīng)用程序自動化協(xié)作。
    • 推出下一代推理模型 o3,包括完整版和精簡版。

    舉報

    • 相關(guān)推薦
    • 國產(chǎn)六大推理模型激戰(zhàn)OpenAI

      2025年春節(jié)前夕,DeepSeek-R1模型發(fā)布,標(biāo)志著中國AI進(jìn)入推理模型新時代。文章梳理了國產(chǎn)大模型發(fā)展歷程:從2022年ChatGPT引發(fā)國內(nèi)追趕OpenAI熱潮,到2023年"百模大戰(zhàn)",再到2024年"AI六小虎"格局形成。重點分析了六大國產(chǎn)推理模型(DeepSeek、百度、阿里、科大訊飛、字節(jié)、騰訊)的技術(shù)特點與市場表現(xiàn),指出國產(chǎn)模型在性能上已接近GPT-4水平。特別強(qiáng)調(diào)科大訊飛星火X1憑借全國產(chǎn)化技術(shù)路線獲得政企青睞,以及DeepSeek-R1以560萬美元超低成本實現(xiàn)高性能的突破。文章還探討了英偉達(dá)芯片斷供危機(jī)下,國產(chǎn)全棧技術(shù)路徑的重要性,認(rèn)為自主可控將成為對抗國際不確定性的關(guān)鍵。最后指出,隨著推理模型成為競爭焦點,國產(chǎn)大模型正從技術(shù)追隨轉(zhuǎn)向自主創(chuàng)新階段。

    • 首次實現(xiàn)圖像思考 OpenAI重磅發(fā)布o3/o4-mini:史上最強(qiáng)、最智能模型

      快科技4月17日消息,今日,OpenAI新款A(yù)I模型o3、o4-mini重磅發(fā)布,這是OpenAI迄今最強(qiáng)、最智能的模型。據(jù)了解,OpenAI o3/o4-mini首次具備真正的視覺推理能力,看圖識圖已經(jīng)是小菜一碟了,現(xiàn)在還會看圖思考。OpenAI o3/o4-mini能同時處理文本、圖像和音頻,并且能作為Agent智能體自動調(diào)用網(wǎng)絡(luò)搜索、圖像生成、代碼解析等工具以及深度思考模式。通過強(qiáng)化學(xué)習(xí),OpenAI訓(xùn)練了o3/o4-mini如何?

    • OpenAI發(fā)布o3o4 mini模型,實現(xiàn)“看圖說話”,糊圖也行!

      從 GPT-5 開始,推理模型和非推理模型很有可能會整合在一起……

    • o3模型基準(zhǔn)測試分?jǐn)?shù)僅為10%,遠(yuǎn)低于OpenAI宣傳的25%

      OpenAI的新AI模型o3在第一方和第三方基準(zhǔn)測試中存在差異,引發(fā)公眾對其透明度和測試實踐的質(zhì)疑。去年12月,o3首次亮相時聲稱能解答超過25%的FrontierMath問題,但實際正確率僅為2%。內(nèi)部測試發(fā)現(xiàn),o3能達(dá)到超過25%的準(zhǔn)確率,但其使用的計算資源比上周OpenAI推出的模型多得多。Epoch AI發(fā)布的獨立基準(zhǔn)測試結(jié)果顯示,o3的得分約為10%,遠(yuǎn)低于OpenAI宣稱的25%。盡管如此,這并不意味著OpenAI的說法有誤,可能是因為OpenAI使用了更強(qiáng)大的內(nèi)部架構(gòu)進(jìn)行評估,并采用了更多計算資源。此外,Epoch指出其測試設(shè)置可能與OpenAI不同,并且在評估中使用了更新版本的FrontierMath。

    • o3全網(wǎng)震撼實測:AGI真來了?最強(qiáng)氛圍編程秒殺人類,卻被曝捏造事實

      昨夜o3的發(fā)布,讓人不盡感慨:打了這么久嘴炮的OpenAI,這回終于實實在在拿出了點真東西。史上首次,模型能夠用圖像思考,視覺推理達(dá)到巔峰。許多網(wǎng)友實測后,大感驚艷。o3能不斷縮放圖像,完成解題、識圖,編程任務(wù)實測驚人。還有一大特點,就是速度快!只用2分55秒,它就解決了一道Project Euler問題,速度秒殺任何人類。甚至可以認(rèn)為,o3是一個快速版的Deep Search,但不需

    • OpenAI深夜上線o3滿血版和o4 mini - 依舊領(lǐng)先。

      晚上1點,OpenAI的直播如約而至。其實在預(yù)告的時候,幾乎已經(jīng)等于明示了。沒有廢話,今天發(fā)布的就是o3和o4-mini。但是奧特曼這個老騙子,之前明明說o3不打算單獨發(fā)布要融到GPT-5里面一起發(fā),結(jié)果今天又發(fā)了。。。ChatGPT Plus、Pro和Team用戶從今天開始將在模型選擇器中看到o3、o4-mini和o4-mini-high,取代o1、o3-mini和o3-mini-high。我的已經(jīng)變了,但是我最想要的o3pro,還要幾周才能提供

    • 不要思考過程,推理模型能力能夠更強(qiáng)

      UC伯克利和艾倫實驗室的最新研究表明,推理模型無需依賴冗長的思考過程也能有效工作。研究人員提出的"無思考(NoThinking)"方法通過簡單提示直接生成解決方案,跳過了傳統(tǒng)推理模型中的顯性思考步驟。實驗證明,在低資源(低token數(shù)量、少模型參數(shù))或低延遲情況下,NoThinking方法的表現(xiàn)優(yōu)于傳統(tǒng)思考方式,能減少token使用量并提高推理速度。該方法在數(shù)學(xué)問題解決、編程和形式定理證明等任務(wù)中表現(xiàn)優(yōu)異,尤其在資源受限時優(yōu)勢更明顯。研究還發(fā)現(xiàn),結(jié)合并行計算擴(kuò)展后,NoThinking能進(jìn)一步提升性能,在保持準(zhǔn)確性的同時顯著降低延遲和計算成本。這一發(fā)現(xiàn)挑戰(zhàn)了"推理模型必須依賴詳細(xì)思考過程"的傳統(tǒng)認(rèn)知。

    • AI日報:字節(jié)發(fā)布豆包1.5深度思考模型;微信首個AI助手 “元寶” 上線;OpenAI發(fā)布o4-mini、滿血版o3

      歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點內(nèi)容,聚焦開發(fā)者,助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點擊了解:https://top.aibase.com/1、OpenAI發(fā)布兩款多模態(tài)推理模型o4-mini、滿血版o3OpenAI在技術(shù)直播中推出了其最新的多模態(tài)模型o4-mini和滿血版o3,這兩款模型具備同時處理文本、圖像和音頻的能力,并能調(diào)用外部工?

    • 媲美OpenAI-o3,剛剛開源模型DeepCoder,訓(xùn)練方法、數(shù)據(jù)集大公開

      今天凌晨4點,著名大模型訓(xùn)練平臺TogetherAI和智能體平臺Agentica,聯(lián)合開源了新模型DeepCoder-14B-Preview。該模型只有140億參數(shù),但在知名代碼測試平臺LiveCodeBench的測試分為60.6%,高于OpenAI的o1模型,略低于o3-mini。TogetherAI剛獲得3.05億美元的B輪融資,其估值也從去年的12.5億美元翻倍至33億美元。

    • 奧特曼:ChatGPT不是AGIOpenAI最強(qiáng)開源模型直擊DeepSeek

      【新智元導(dǎo)讀】代碼截圖泄露,滿血版o3、o4-mini鎖定下周!更勁爆的是,一款據(jù)稱是OpenAI的神秘模型一夜爆紅,每日處理高達(dá)260億token,是Claude用量4倍。奧特曼在TED放話:將推超強(qiáng)開源模型,直面DeepSeek挑戰(zhàn)。持續(xù)的創(chuàng)新、豐富的資源和智能AI將會無縫融入日常生活,未來一代人將會覺得當(dāng)前人們又辛苦又落后。