中文字幕欧美日韩|日韩性色一区二区三区|精品久久久久久久久久岛国|一区二区国产盗摄精品

<td id="h1kkc"><tr id="h1kkc"></tr></td><noscript id="h1kkc"><tbody id="h1kkc"></tbody></noscript>

<rp id="h1kkc"></rp>

國產(chǎn)六大推理模型激戰(zhàn)OpenAI？

2025-04-25 08:49 · 稿源：光子星球公眾號

聲明:本文來自微信公眾號“guangzi0088”（ID:TMTweb），作者:郝鑫，編輯:王潘，，授權(quán)站長之家轉(zhuǎn)載發(fā)布。

“DeepSeek-R1如同當年蘇聯(lián)搶發(fā)的第一顆衛(wèi)星，成為AI開啟新時代的斯普特尼克時刻。”

2025年春節(jié)前，DeepSeek比除夕那天的煙花先一步在世界上空綻放。

離年夜飯僅剩幾個小時，國內(nèi)某家云服務器的工程師突然被拉入工作群，接到緊急任務，要求其快速調(diào)優(yōu)芯片，以適配最新的DeepSeek-R1模型。該工程師告訴我們，“從接入到完成，整個過程不到一周”。

大年初二，一家從事Agent To B業(yè)務的廠商負責人電話被打爆，客戶的要求簡單粗暴:第一時間驗證模型真實性能，盡快把部署提上日程。

節(jié)前大模型，節(jié)后只有DeepSeek。DeepSeek-R1就像一道分水嶺，重新書寫了中國大模型的敘事邏輯。

以2022年11月，OpenAI發(fā)布基于GPT-3.5的ChatGPT應用為起點，國內(nèi)自此走上了追趕OpenAI的道路。2023年，大模型如雨后春筍般冒出頭，無大模型不AI，各廠商你追我趕，百模大戰(zhàn)初見端倪。

你方唱罷我登場，2024年的主人公變成了“AI六小虎”，AI創(chuàng)業(yè)成為新的故事腳本。僅一年的時間，智譜累計完成40億元人民幣融資，月之暗面融資總額超13億美元。在資本拋出橄欖枝后，他們站到了聚光燈下，一躍成為明星獨角獸公司。

新的轉(zhuǎn)折點發(fā)生在DeepSeek-R1爆火后，曾有一段時間內(nèi)行業(yè)陷入了“一半火焰，一半海水”的境地，即一邊積極擁抱學習R1，一邊陷入了深深的自省。

徘徊是短暫的，隨著百度、阿里、字節(jié)、騰訊、科大訊飛等廠商紛紛發(fā)布最新的推理模型，2025年的AI敘事主題呼之欲出:“六大推理模型迎戰(zhàn)OpenAI”。

推理模型的當打之年

回看OpenAI的模型發(fā)布時間線，在基礎模型方向，可以分為GPT系列和o系列，2024年OpenAI所發(fā)布的o1是一個里程碑式的轉(zhuǎn)向。

（光子星球制圖）

GPT系列是OpenAI最早構(gòu)建的模型體系，聚焦自然語言處理、對話系統(tǒng)與文本生成，強調(diào)語言流暢性與上下文理解能力。o系列是OpenAI于2023年新設立的模型家族，核心聚焦“結(jié)構(gòu)化推理”能力，強調(diào)模型的邏輯、分析、工具調(diào)用能力，是對GPT系列“語言偏重”路線的補充與擴展。

未來GPT系列或?qū)⒅饾u退出歷史舞臺。OpenAI在更新日志中宣布，自2025年4月30日起，GPT4將在ChatGPT中退役，將完全被GPT4o取代。

如果只是OpenAI自身技術(shù)選擇，o系列和DeepSeek-R1并不會帶來如此強大的影響。以底層模型架構(gòu)舉例，有公司選擇傳統(tǒng)的Transformer架構(gòu)，也有公司選擇自研架構(gòu)。

o系列崛起有一個大背景，即大模型范式的改變，從傳統(tǒng)預訓練階段模型參數(shù)的Scaling Law，轉(zhuǎn)移到強化學習推理計算帶來新Scaling Law。這一點在OpenAI的o3開發(fā)過程中得到了驗證，OpenAI觀察到大規(guī)模強化學習表現(xiàn)出與GPT系列預訓練中觀察到的趨勢相同，計算量越大，性能越好。

簡而言之，就是讓AI自己規(guī)劃、學習、反饋和完成任務，這與如今大熱的Agent所需具備的能力一致。

有技術(shù)人員告訴光子星球，o1以后所發(fā)布的“Deep Research”Agent，完全基于模型從頭訓練，且未公開思維鏈推理過程?！斑@意味著底座模型能力直接決定了Agent的落地效果”，想要在大模型第二程變得有競爭力，推理模型幾乎成為了必選。

站在公司和技術(shù)一號位角度，第一時間跟進o1和DeepSeek-R1是一種判斷和眼光，但同時也代表著重投入與高風險。

我們了解到國內(nèi)的很多公司，名義上有自研大模型，但實則是“套殼”。o系列站在GPT的肩膀上誕生，這導致地基不牢的公司只能望而卻步。另一方面，融資和商業(yè)化變現(xiàn)的壓力，又淘汰了一批公司。

（光子星球制圖）

于是，我們發(fā)現(xiàn)去年星光暗淡的大廠們，成為了反應最快，跟進最及時的代表。

以DeepSeek-R1（2025年1月20日發(fā)布）為時間基準線，當月科大訊飛就發(fā)布了深度推理大模型——訊飛星火X1;3月，百度發(fā)布文心大模型X1，阿里發(fā)布通義千問Qwen-QwQ-32B推理模型，騰訊發(fā)布混元T1深度思考模型;4月，字節(jié)豆包1.5深度思考模型上線，同時訊飛星火X1迎來升級，發(fā)布“快思考、慢思考統(tǒng)一模型”。

上述廠商有一些共同之處，跟上了每一次的模型能力升級進度，在轉(zhuǎn)向推理方向前，其基礎模型能力基本都達到了GPT-4的水平。以此作為參照，這可能是邁入大模型第二階段的基本條件。

六大推理模型混戰(zhàn)o3

o3目前是OpenAI最強大的推理模型。網(wǎng)上流傳的一張大模型IQ圖顯示，人類平均IQ為100，o3智商達到了驚人的136。

測試數(shù)據(jù)顯示，o3在多項基準測試中超越了o1的性能，特別在分析圖像、圖表和圖形等視覺任務中表現(xiàn)尤為出色。

在外部專家的評估中，o3在困難的現(xiàn)實任務中比o1犯的重大錯誤減少20%，在編程、商業(yè)、咨詢和創(chuàng)意構(gòu)思等領(lǐng)域都有不錯的表現(xiàn)。

需要承認的是，OpenAI存貨確實有兩把刷子，繼o1之后，o3又成為了新的大模型性能攀登高峰。但國內(nèi)各大模型廠商的跟進速度并不慢，若以DeepSeek-R1為參考標準，百度、阿里、科大訊飛、字節(jié)、騰訊后面所發(fā)布的推理模型水平相差不大，部分在一些測試指標上甚至有超越。

截至目前，國產(chǎn)六大推理模型各有千秋。

DeepSeek-R1的意義不言而喻，完整的技術(shù)報告和開源部署，給予了行業(yè)推理大模型訓練思路。打開了OpenAI閉源的“黑匣子”，成功復刻出了性能相差無幾的o1。R1突出的特點是“花小錢辦大事”，高效且追求極致性價比。在非常有限的算力、數(shù)據(jù)等資源投入的情況下，訓練成本卻僅為560萬美元，遠低于美國AI公司的數(shù)千萬美元乃至數(shù)億美元投入。

一位知情人士告訴我們，DeepSeek-R1和一些國產(chǎn)推理大模型不構(gòu)成直接競爭對手。在B端業(yè)務中，目前阿里開源的千問系列模型占比更重?！叭叽绾腿Ｐ?，就像一個全家桶，可以供客戶選擇。32B的模型大小，跑起來成本也不是很高”。

百度在這波中從生態(tài)層面接入了DeepSeek，這給了用戶更多選擇權(quán)，開源和免費的策略或?qū)⒛芪嘤脩?。文心大模型X1采用“思維鏈-行動鏈”協(xié)同訓練，在復雜任務中自動拆解為二十多個推理步驟，同時可以調(diào)用十幾種的工具鏈，以此來增強Agent的能力。

有參與過與百度合作的人士告訴光子星球，在金融、醫(yī)療、政務等一些垂類領(lǐng)域，百度會“牽線搭橋”，把一些相關(guān)業(yè)務的公司攢到一個局?！鞍俣忍峁┗A模型，我們提供另一方所需的技術(shù)，最后直接跟百度核算”。通過這種方式，百度正不斷縮小To B大模型市場與科大訊飛之間的差距。

科大訊飛的星火X1，是當前業(yè)界唯一基于全國產(chǎn)算力訓練的深度推理大模型。

正是基于全棧國產(chǎn)、自主可控的優(yōu)勢，科大訊飛的星火大模型倍受央國企和政府客戶的青睞，保持行業(yè)端領(lǐng)先。4月21日，星火X1升級提升了通用能力，也同步增強了面向行業(yè)的解決方案能力。在重點行業(yè)，如教育、醫(yī)療、司法等領(lǐng)域的測試中，都獲得了超過OpenAI和DeepSeek的分數(shù)，這些能力無疑會在今年大模型訂單中有所體現(xiàn)。

星火X1一個模型同時支持兩種思考模式，提升了模型處理不同復雜度任務的能力，滿血版星火X1僅需4張卡（華為910B）即可部署。與華為的深度合作，以及不斷迭代的底座大模型能力和強大的行業(yè)大模型落地體系，已經(jīng)成為科大訊飛在一眾大廠圍剿中突出重圍的三大利器。

國內(nèi)閉源大模型中，豆包模型被評價為“有一定價格競爭力”。一位做AI玩具的廠商告訴我們，他的產(chǎn)品接入了多家大模型，在用戶使用過程中，優(yōu)先使用各家的免費Token額度，“一旦超過后，優(yōu)先切換豆包，價格能控制在比較低的成本”。

去年，豆包參與主導了價格戰(zhàn)，豆包大模型價格降至0.0008元/千Tokens，豆包視覺理解模型定價0.003元/千Tokens，均低于當時行業(yè)平均水平。此外，豆包大模型是技術(shù)落地AI應用產(chǎn)品值得借鑒的案例，端到端的實時語音技術(shù)、多模態(tài)、Agent技術(shù)都能在第一時間介入豆包應用端，這也是支撐其快速迭代更新的原因之一。

騰訊混元入場較晚。有員工曾向我們表示，混元團隊成員大部分以前是搜索推薦廣告出身，跟通義、字節(jié)或許有一定差距，“趕鴨子上架，好像也沒什么明確方向，東一下西一下”，“一群外行人指導內(nèi)行人”。加之人員的流逝，導致了混元曾一度處于停滯狀態(tài)。

借著DeepSeek崛起的東風，元寶已經(jīng)悄然實現(xiàn)了逆襲。至少從數(shù)據(jù)層面看，已經(jīng)取得階段性成果。一位內(nèi)部人士告訴我們，2025年春節(jié)以來的這幾個月，騰訊傾注了整個集團資源對元寶進行推廣，無論線下活動資源，還是微信導流或者預算投入，對于元寶都是重點傾斜，通過這種大力出奇跡的方式，逆轉(zhuǎn)了此前完全被動的局面。

從目前各公司的市場反饋來看，云端多模調(diào)用已經(jīng)逐漸被認可，各家模型并存，用戶按需調(diào)取才是未來。在現(xiàn)實情況中，客戶最終是否選用一款大模型，模型性能只是一項衡量標準，背后可能還涉及數(shù)據(jù)、生態(tài)等多方面的考量。

大模型將全面國產(chǎn)化?

自DeepSeek-R1開始，國產(chǎn)推理大模型成為了各榜單的?？?，AI開源社區(qū)的用戶以真實的下載量和Star數(shù)來支持中國AI的發(fā)展。

即便如此，當前大模型仍面臨著或多或少的“卡脖子”的問題。

近期，有消息稱，英偉達已通過非正式渠道通知其AIC合作伙伴（如七彩虹、影馳、同德等），暫停GeForce RTX5090D的銷售和出貨。這一舉措被認為是英偉達在應對國際環(huán)境變化的預防性措施。

盡管英偉達尚未發(fā)布正式公告，但業(yè)內(nèi)普遍認為，RTX5090D的供應已進入“暫停狀態(tài)”，這僅僅才只是開始。

若從源頭上被限制，英偉達必將遭遇更加巨額的損失，而美國之外國家的大模型發(fā)展將遭遇不確定性，追趕OpenAI的步伐也將受到一定的阻礙。

在此背景下，全國產(chǎn)化技術(shù)路徑將越來越成為大家的備選項。這其中，科大訊飛做了較為充分的準備。據(jù)了解，科大訊飛與合作伙伴聯(lián)合通過四大核心技術(shù)優(yōu)化，實現(xiàn)MoE模型集群推理性能翻倍提升。

根據(jù)最新測試集評測結(jié)果，星火X1在通用任務效果評測中全面對標OpenAI o1和DeepSeek R1，在數(shù)學、知識問答等方面表現(xiàn)突出，這表明在技術(shù)自主可控的道路上，中國AI已具備與國際頂尖模型同臺競技的實力。

去年風光無限的AI六小虎，如今早已各奔東西，境遇迥然。被DeepSeek擊碎“AGI理想”“學術(shù)天才創(chuàng)業(yè)”和“明星AI產(chǎn)品”的月之暗面，回歸到低調(diào)的技術(shù)研發(fā)中;將底層技術(shù)和產(chǎn)品解綁后的MiniMax，加大了對技術(shù)的投入，方向同樣為Agent和推理模型;六小虎中的智譜終于盼來了即將IPO的好消息，不過其整體營收、估值以及能否順利實現(xiàn)IPO，仍充滿變數(shù)。

去年，Kimi、海螺AI等AI應用的出圈，短暫地迎來了AI公司的高光時刻。但今年，推理模型已經(jīng)成為了國內(nèi)各大廠商角逐的重要方向，AI六小虎的方向與大廠高度重合，而決定他們能否生存下去的“口糧”則握在大廠們的手上。

如今，隨著六大推理大模型的全面崛起，以及國際環(huán)境的不確定性加劇，全棧國產(chǎn)化大模型有望將成為一種新的主流。

從半導體、工業(yè)軟件與信創(chuàng)再到今天的AI芯片，歷史的經(jīng)驗告訴我們，想要擺脫被制約的現(xiàn)狀就得實現(xiàn)獨立自主，將命運牢牢掌握在自己手中。或許在不久的將來，越來越多的國產(chǎn)大模型將走上全棧國產(chǎn)化對抗OpenAI們的道路。

（舉報）

相關(guān)推薦

關(guān)鍵詞：

薦不要思考過程，推理模型能力能夠更強

UC伯克利和艾倫實驗室的最新研究表明，推理模型無需依賴冗長的思考過程也能有效工作。研究人員提出的"無思考(NoThinking)"方法通過簡單提示直接生成解決方案，跳過了傳統(tǒng)推理模型中的顯性思考步驟。實驗證明，在低資源(低token數(shù)量、少模型參數(shù))或低延遲情況下，NoThinking方法的表現(xiàn)優(yōu)于傳統(tǒng)思考方式，能減少token使用量并提高推理速度。該方法在數(shù)學問題解決、編程和形式定理證明等任務中表現(xiàn)優(yōu)異，尤其在資源受限時優(yōu)勢更明顯。研究還發(fā)現(xiàn)，結(jié)合并行計算擴展后，NoThinking能進一步提升性能，在保持準確性的同時顯著降低延遲和計算成本。這一發(fā)現(xiàn)挑戰(zhàn)了"推理模型必須依賴詳細思考過程"的傳統(tǒng)認知。

?推理模型 ?無思考方法 ?解決方案
為編程而生？OpenAI 發(fā)布 GPT -4.1 系列模型

OpenAI 表示，GPT-4.1 是為開發(fā)者量身定制的……

?openai ?gpt-4.1 ?gpt-4.1mini
新增自主決策推理模型！理想汽車OTA 7.2開啟推送

快科技4月3日消息，我們從理想汽車官方獲悉，OTA7.2版本車機系統(tǒng)正式開啟推送，預計一周內(nèi)完成，升級耗時約50分鐘。本次更新新增自主決策推理模型，該模型基于車載場景數(shù)據(jù)及通用推理模型數(shù)據(jù)打造，可根據(jù)問題內(nèi)容自主決策是否深度思考，面對車控指令等簡單問題時，能夠保障響應速度。智能座艙方面，新增全能兒童鎖功能，支持一鍵鎖定副駕老板鍵、后排座椅物理按?

?理想汽車 ?OTA更新 ?智能座艙
薦微信，OpenAI和Kimi想一起去了：大模型的盡頭依然還是社交平臺

AI圈最近彌漫著一股微妙的氣息。人們似乎不再熱議大語言模型的最新突破、以及AI應用的無限可能時，一些代表著未來的AI巨頭，卻似乎正將目光投向互聯(lián)網(wǎng)那熟悉得不能再熟悉的角落——社交網(wǎng)絡與社區(qū)。近期的傳聞和動作頗具代表性，在大洋彼岸，手握ChatGPT和Sora等王牌的OpenAI，據(jù)稱正內(nèi)部測試類X的社交功能，其CEO Sam Altman甚至在私下征求反饋；而在國內(nèi)，憑借長文本能力

?AI社交網(wǎng)絡 ?語言模型 ?OpenAI動態(tài)
薦剛剛，OpenAI發(fā)布GPT-image-1模型，更強吉卜力版本來啦

OpenAI發(fā)布全新圖像生成模型GPT-image-1，通過API向全球開發(fā)者開放。該模型支持精細控制圖像敏感度、生成效率、背景、輸出格式等參數(shù)，并集成吉卜力模式。Adobe、Figma等企業(yè)已將其應用于產(chǎn)品中。API支持批量生成、蒙版編輯、透明度調(diào)整等高級功能，圖像生成成本從0.02-0.19美元/張不等。CEO Sam Altman表示該模型與ChatGPT版本差異顯著，開發(fā)者可通過API實現(xiàn)更多創(chuàng)意場景。新模型在?

?OpenAI ?GPT-image-1 ?圖像生成
o3模型基準測試分數(shù)僅為10%，遠低于OpenAI宣傳的25%

OpenAI的新AI模型o3在第一方和第三方基準測試中存在差異，引發(fā)公眾對其透明度和測試實踐的質(zhì)疑。去年12月，o3首次亮相時聲稱能解答超過25%的FrontierMath問題，但實際正確率僅為2%。內(nèi)部測試發(fā)現(xiàn)，o3能達到超過25%的準確率，但其使用的計算資源比上周OpenAI推出的模型多得多。Epoch AI發(fā)布的獨立基準測試結(jié)果顯示，o3的得分約為10%，遠低于OpenAI宣稱的25%。盡管如此，這并不意味著OpenAI的說法有誤，可能是因為OpenAI使用了更強大的內(nèi)部架構(gòu)進行評估，并采用了更多計算資源。此外，Epoch指出其測試設置可能與OpenAI不同，并且在評估中使用了更新版本的FrontierMath。

?openai ?ChatGPT ?o3模型
OpenAI 也要搞 SNS 了？外媒：原型已出！

憑借 ChatGPT 的吉卜力風格圖像轉(zhuǎn)換功能而獲得巨大人氣的 OpenAI，也要進軍 SNS 市場了……

?OpenAI ?社交媒體 ?社交媒體平臺
“吉卜力被廉價對待，不可原諒” ，OpenAI 會被起訴嗎？

日本業(yè)界對 ChatGPT 的“侵權(quán)行為”態(tài)度不一，而吉卜力工作室卻一直保持沉默，雙方產(chǎn)生版權(quán)糾紛的可能性幾何？

?ChatGPT ?吉卜力工作室 ?版權(quán)糾紛
OpenAI發(fā)布o3、o4 mini模型，實現(xiàn)“看圖說話”，糊圖也行！

從 GPT-5 開始，推理模型和非推理模型很有可能會整合在一起……

?openai ?chatgpt ?ai模型
首次實現(xiàn)圖像思考 OpenAI重磅發(fā)布o3/o4-mini：史上最強、最智能模型

快科技4月17日消息，今日，OpenAI新款AI模型o3、o4-mini重磅發(fā)布，這是OpenAI迄今最強、最智能的模型。據(jù)了解，OpenAI o3/o4-mini首次具備真正的視覺推理能力，看圖識圖已經(jīng)是小菜一碟了，現(xiàn)在還會看圖思考。OpenAI o3/o4-mini能同時處理文本、圖像和音頻，并且能作為Agent智能體自動調(diào)用網(wǎng)絡搜索、圖像生成、代碼解析等工具以及深度思考模式。通過強化學習，OpenAI訓練了o3/o4-mini如何?

?OpenAI ?AI模型 ?視覺推理

熱文

3 天
7天

站長商機

廣告

商務合作侵權(quán)投訴廣告服務版權(quán)聲明招聘

?CopyRight 2002-2020 CHINAZ.COM

<input id="qgqso"></input>

<li id="qgqso"><th id="qgqso"></th></li>

<del id="qgqso"></del>