中文字幕欧美日韩|日韩性色一区二区三区|精品久久久久久久久久岛国|一区二区国产盗摄精品

<td id="h1kkc"><tr id="h1kkc"></tr></td><noscript id="h1kkc"><tbody id="h1kkc"></tbody></noscript>

<rp id="h1kkc"></rp>

<samp id="kaec8"></samp>

<abbr id="kaec8"><optgroup id="kaec8"></optgroup></abbr>

<center id="kaec8"></center>

Refuel AI 推出專為數(shù)據(jù)標(biāo)注和清洗設(shè)計的開源語言模型 RefuelLLM-2

2024-05-13 15:36 · 稿源：站長之家

站長之家（ChinaZ.com）5月13日消息:Refuel AI 最近宣布推出兩個新版本的大型語言模型（LLM），RefuelLLM-2和 RefuelLLM-2-small，這兩個模型專為數(shù)據(jù)標(biāo)注、清洗和豐富任務(wù)而設(shè)計，旨在提高處理大規(guī)模數(shù)據(jù)集的效率。

RefuelLLM-2的主要特點包括:

自動化數(shù)據(jù)標(biāo)注:能夠自動識別和標(biāo)記數(shù)據(jù)中的關(guān)鍵信息，如分類數(shù)據(jù)和解析特定屬性。
數(shù)據(jù)清洗:自動檢測并修正數(shù)據(jù)中的錯誤或不一致性，例如拼寫錯誤和格式問題。
數(shù)據(jù)豐富:根據(jù)現(xiàn)有數(shù)據(jù)自動補充缺失信息或提供額外上下文，增加數(shù)據(jù)的價值和可用性。
高準(zhǔn)確率:在約30項數(shù)據(jù)標(biāo)注任務(wù)的基準(zhǔn)測試中，RefuelLLM-2以83.82%的準(zhǔn)確率優(yōu)于所有其他最先進的大型語言模型，包括 GPT-4-Turbo 和 Claude-3-Opus。

兩款模型的比較:

RefuelLLM-2:基于 Mixtral-8x7B 模型，支持高達32K的最大輸入上下文長度，適合處理長文本輸入。
RefuelLLM-2-small:基于 Llama3-8B 模型，提供一個成本更低、運行更快的選項，同時保持高性能，支持高達8K的輸入上下文長度。

訓(xùn)練細(xì)節(jié):

兩款模型都在超過2750個數(shù)據(jù)集上進行訓(xùn)練，涵蓋分類、閱讀理解、結(jié)構(gòu)化屬性提取和實體解析等任務(wù)。
訓(xùn)練方法:包括兩個階段，第一階段專注于指令調(diào)整訓(xùn)練，第二階段則加入更長上下文的輸入，以提高模型在復(fù)雜數(shù)據(jù)處理任務(wù)中的表現(xiàn)。

性能提升:

兩階段訓(xùn)練方法使得 RefuelLLM-2在基本數(shù)據(jù)處理任務(wù)中表現(xiàn)出色，并能有效處理長上下文輸入。

質(zhì)量評估:

在長上下文數(shù)據(jù)集和非公開數(shù)據(jù)集的評估中，RefuelLLM-2和 RefuelLLM-2-small 均展現(xiàn)出良好的性能和泛化能力。
在置信度分?jǐn)?shù)質(zhì)量方面，RefuelLLM-2和 RefuelLLM-2-small 顯示出比其他模型更好的置信度分?jǐn)?shù)校準(zhǔn)。

Refuel AI 的這一創(chuàng)新為數(shù)據(jù)標(biāo)注和清洗領(lǐng)域帶來了新的解決方案，有助于自動化和優(yōu)化大規(guī)模數(shù)據(jù)處理流程。

playground:https://labs.refuel.ai/playground

模型下載:https://huggingface.co/refuelai/Llama-3-Refueled

（舉報）

相關(guān)推薦

關(guān)鍵詞：

RefuelLLM-2

時空壺接入大語言模型，跨語言溝通已成翻譯的藝術(shù)

在當(dāng)今全球化浪潮中，跨語言溝通的需求如潮水般洶涌。從商務(wù)領(lǐng)域的跨國談判，到文化交流中的思想碰撞，高效、精準(zhǔn)的語言翻譯成為關(guān)鍵橋梁。隨著技術(shù)的不斷發(fā)展與迭代，時空壺有望持續(xù)引領(lǐng)行業(yè)變革，推動全球交流合作邁向新的高度，真正實現(xiàn)跨越語言障礙，讓世界溝通無阻。

?跨語言溝通 ?AI ?翻譯設(shè)備
提升大模型自動修Bug能力豆包正式開源首個多語言類SWE數(shù)據(jù)集

今日，字節(jié)跳動豆包大模型團隊宣布，正式開源首個多語言類SWE數(shù)據(jù)集Multi-SWE-bench，可用于評估和提升大模型自動修Bug”能力。在SWE-bench基礎(chǔ)上，Multi-SWE-bench首次覆蓋Python之外的7種主流編程語言，是真正面向全棧工程”的評測基準(zhǔn)。相比于以往聚焦Python的單語言任務(wù)，Multi-SWE-bench更貼近現(xiàn)實中的多語言開發(fā)場景，也更能反映當(dāng)前模型在自動化軟件工程”方向上的實際能力邊界。

?字節(jié)跳動 ?多語言數(shù)據(jù)集 ?大模型自動修復(fù)
Llama 4大模型跌落神壇：作弊刷榜、代碼能力極差、和DeepSeek比就是偽開源

被寄予厚望的美國Meta公司的最新開源大模型Llama4發(fā)布不到2天時間，口碑急轉(zhuǎn)直下，被質(zhì)疑為刷榜作弊實際效果差、開源條件多部署門檻高是偽開源等。大模型評測平臺LMArena親自下場發(fā)文，打臉Meta提供給平臺的Llama4是“特供版”。Meta若繼續(xù)在商業(yè)控制與技術(shù)開放之間搖擺，恐將在AI競賽中進一步失去開發(fā)者支持。

?Meta ?Llama ?4
英偉達將首次在美制造 AI 超算、及 Blackwell 芯片

站長之家(ChinaZ.com) 4月15日消息:隨著 AI 行業(yè)的蓬勃發(fā)展，英偉達位于美國的人工智能芯片和超級計算機工廠將創(chuàng)造數(shù)千個就業(yè)機會?？萍季揞^英偉達（NVIDIA）宣布，其 AI 超級計算機將完全在美國本土生產(chǎn)。在全球貿(mào)易戰(zhàn)的背景下，英偉達這一舉動是為了減少對海外市場的依賴，并促進美國國內(nèi)的生產(chǎn)。英偉達確認(rèn)，他們已開始在臺積電位于美國亞利桑那州鳳凰城的工廠生產(chǎn)?

?NVIDIA ?臺積電 ?人工智能
薦AI日報：智譜開源32B/9B系列GLM模型并啟用Z.ai域名；OpenAI發(fā)布GPT-4.1系列模型；阿里魔搭上線MCP廣場

歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南，每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點內(nèi)容，聚焦開發(fā)者，助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點擊了解:https://top.aibase.com/1、智譜AI啟用全新域名Z.ai 并開源32B/9B 系列 GLM 模型智譜技術(shù)團隊近期宣布開源32B和9B系列的GLM模型，并推出全新交互體驗平臺Z.ai。這些模型遵循MIT許可協(xié)議，支持商業(yè)用途，提升了

?人工智能 ?開源模型 ?GLM模型
薦AI日報：小米首個推理大模型開源Xiaomi MiMo；快手上線AI筆記工具“喵記多”；騰訊拆分AI團隊

本文匯總了AI領(lǐng)域最新動態(tài)：1)小米開源70億參數(shù)大模型Xiaomi MiMo，在數(shù)學(xué)推理和代碼競賽中超越OpenAI和阿里模型；2)快手推出AI筆記工具"喵記多"，簡化筆記管理；3)Luma AI發(fā)布電影級鏡頭控制API，降低視頻生成門檻；4)騰訊重組AI團隊，加大語言模型研發(fā)投入；5)Anthropic為Claude引入新語音"Glassy"；6)谷歌NotebookLM新增50+語言音頻概述功能；7)xAI將發(fā)布Grok3.5模型；8)Meta推出獨立AI助手應(yīng)用挑戰(zhàn)ChatGPT；9)OpenAI緊急修復(fù)GPT-4o"諂媚"問題；10)Mac本地AI助手Simular升級隱私保護；11)CameraBench項目幫助AI理解鏡頭運動；12)谷歌推出個性化語言學(xué)習(xí)AI工具。

?人工智能 ?Xiaomi ?MiMo
字節(jié)AI加速文生圖技術(shù)新突破，GOOG/微美全息引領(lǐng)開源大模型釋放科技勢能

字節(jié)跳動發(fā)布豆包1.5深度思考模型，升級文生圖能力。該模型在專業(yè)領(lǐng)域和通用任務(wù)中表現(xiàn)突出，采用MoE架構(gòu)，總參數(shù)量200B，激活參數(shù)20B，推理成本優(yōu)勢顯著。同時，其圖像生成模型Seedream 3.0性能追平GPT-4o等頂尖模型。全球AI產(chǎn)業(yè)加速發(fā)展，開源模型降低技術(shù)門檻，推動商業(yè)化落地。微美全息等企業(yè)構(gòu)建開放AI生態(tài)，DeepSeek等公司通過開源策略促進技術(shù)普惠。行業(yè)迎來"開源AI+"新階段，企業(yè)需把握機遇應(yīng)對挑戰(zhàn)。

?字節(jié)跳動 ?豆包1.5 ?文生圖模型
DeepSeek領(lǐng)航大模型普惠化浪潮，xAI/微美全息加速開源AI布局打造新格局

DeepSeek 作為當(dāng)前最受關(guān)注的大模型之一，憑借其技術(shù)創(chuàng)新正在加速 AI 普惠化進程。根據(jù)機構(gòu)新報告顯示，DeepSeek已經(jīng)成為全球增長最快的AI工具，其每月新增網(wǎng)站訪問量已經(jīng)超過OpenAI的ChatGPT。DeepSeek市場份額全球第三目前，DeepSeek市場份額6.58%，僅次于ChatGPT和Canva。DeepSeek是繼ChatGPT之后的又一現(xiàn)象級AI產(chǎn)品，它的市場份額從2.34%快速增長至6.58%，展現(xiàn)出強勁的增長態(tài)勢。全球著名?

?DeepSeek ?AI工具 ?技術(shù)創(chuàng)新
蘋果要 all in 智能眼鏡？Vision Pro 2 也已準(zhǔn)備就緒

蘋果已著手開發(fā)輕便且低價的 AR 智能眼鏡，同時也在開發(fā)第二代頭顯設(shè)備 Vision Pro。

?蘋果AR眼鏡 ?VisionPro ?AR眼鏡
中國智力持續(xù)發(fā)力，智象未來開源模型再獲國際認(rèn)可

國內(nèi)AI企業(yè)智象未來研發(fā)的開源圖像生成模型HiDream-I1近日取得重要突破：該模型憑借17B參數(shù)規(guī)模，在圖像真實感、細(xì)節(jié)處理及指令響應(yīng)能力上超越行業(yè)標(biāo)桿，多項評測指標(biāo)超過GPT-4o與Flux1.1。繼登頂AI基準(zhǔn)測試平臺Artificial Analysis、獲Hugging Face收錄后，該模型正式被谷歌技術(shù)生態(tài)體系收錄，成為首個登頂該平臺榜首的中國自研開源模型。其24小時內(nèi)登頂?shù)募o(jì)錄，被視為中國AI技術(shù)全球競爭力的重要里程碑。谷歌的收錄將推動HiDream-I1觸達全球開發(fā)者，助力開源生態(tài)共建進入新發(fā)展階段。

?人工智能 ?開源模型 ?圖像生成

熱文

3 天
7天

站長商機

廣告

商務(wù)合作侵權(quán)投訴廣告服務(wù) 版權(quán)聲明招聘

?CopyRight 2002-2020 CHINAZ.COM