中文字幕欧美日韩|日韩性色一区二区三区|精品久久久久久久久久岛国|一区二区国产盗摄精品

    <td id="h1kkc"><tr id="h1kkc"></tr></td><noscript id="h1kkc"><tbody id="h1kkc"></tbody></noscript>
    <rp id="h1kkc"></rp>
    首頁 > 業(yè)界 > 關(guān)鍵詞  > RefuelLLM-2最新資訊  > 正文

    Refuel AI 推出專為數(shù)據(jù)標(biāo)注和清洗設(shè)計的開源語言模型 RefuelLLM-2

    2024-05-13 15:36 · 稿源:站長之家

    站長之家(ChinaZ.com)5月13日 消息:Refuel AI 最近宣布推出兩個新版本的大型語言模型(LLM),RefuelLLM-2和 RefuelLLM-2-small,這兩個模型專為數(shù)據(jù)標(biāo)注、清洗和豐富任務(wù)而設(shè)計,旨在提高處理大規(guī)模數(shù)據(jù)集的效率。

    image.png

    RefuelLLM-2的主要特點包括:

    1. 自動化數(shù)據(jù)標(biāo)注:能夠自動識別和標(biāo)記數(shù)據(jù)中的關(guān)鍵信息,如分類數(shù)據(jù)和解析特定屬性。

    2. 數(shù)據(jù)清洗:自動檢測并修正數(shù)據(jù)中的錯誤或不一致性,例如拼寫錯誤和格式問題。

    3. 數(shù)據(jù)豐富:根據(jù)現(xiàn)有數(shù)據(jù)自動補充缺失信息或提供額外上下文,增加數(shù)據(jù)的價值和可用性。

    4. 高準(zhǔn)確率:在約30項數(shù)據(jù)標(biāo)注任務(wù)的基準(zhǔn)測試中,RefuelLLM-2以83.82%的準(zhǔn)確率優(yōu)于所有其他最先進的大型語言模型,包括 GPT-4-Turbo 和 Claude-3-Opus。

    兩款模型的比較:

    • RefuelLLM-2:基于 Mixtral-8x7B 模型,支持高達32K的最大輸入上下文長度,適合處理長文本輸入。

    • RefuelLLM-2-small:基于 Llama3-8B 模型,提供一個成本更低、運行更快的選項,同時保持高性能,支持高達8K的輸入上下文長度。

    訓(xùn)練細(xì)節(jié):

    • 兩款模型都在超過2750個數(shù)據(jù)集上進行訓(xùn)練,涵蓋分類、閱讀理解、結(jié)構(gòu)化屬性提取和實體解析等任務(wù)。

    • 訓(xùn)練方法:包括兩個階段,第一階段專注于指令調(diào)整訓(xùn)練,第二階段則加入更長上下文的輸入,以提高模型在復(fù)雜數(shù)據(jù)處理任務(wù)中的表現(xiàn)。

    性能提升:

    • 兩階段訓(xùn)練方法使得 RefuelLLM-2在基本數(shù)據(jù)處理任務(wù)中表現(xiàn)出色,并能有效處理長上下文輸入。

    質(zhì)量評估:

    • 在長上下文數(shù)據(jù)集和非公開數(shù)據(jù)集的評估中,RefuelLLM-2和 RefuelLLM-2-small 均展現(xiàn)出良好的性能和泛化能力。

    • 在置信度分?jǐn)?shù)質(zhì)量方面,RefuelLLM-2和 RefuelLLM-2-small 顯示出比其他模型更好的置信度分?jǐn)?shù)校準(zhǔn)。

    Refuel AI 的這一創(chuàng)新為數(shù)據(jù)標(biāo)注和清洗領(lǐng)域帶來了新的解決方案,有助于自動化和優(yōu)化大規(guī)模數(shù)據(jù)處理流程。

    playground:https://labs.refuel.ai/playground

    模型下載:https://huggingface.co/refuelai/Llama-3-Refueled

    舉報

    • 相關(guān)推薦
    • 時空壺接入大語言模型,跨語言溝通已成翻譯的藝術(shù)

      在當(dāng)今全球化浪潮中,跨語言溝通的需求如潮水般洶涌。從商務(wù)領(lǐng)域的跨國談判,到文化交流中的思想碰撞,高效、精準(zhǔn)的語言翻譯成為關(guān)鍵橋梁。隨著技術(shù)的不斷發(fā)展與迭代,時空壺有望持續(xù)引領(lǐng)行業(yè)變革,推動全球交流合作邁向新的高度,真正實現(xiàn)跨越語言障礙,讓世界溝通無阻。

    • 提升大模型自動修Bug能力 豆包正式開源首個多語言類SWE數(shù)據(jù)

      今日,字節(jié)跳動豆包大模型團隊宣布,正式開源首個多語言類SWE數(shù)據(jù)集Multi-SWE-bench,可用于評估和提升大模型自動修Bug”能力。在SWE-bench基礎(chǔ)上,Multi-SWE-bench首次覆蓋Python之外的7種主流編程語言,是真正面向全棧工程”的評測基準(zhǔn)。相比于以往聚焦Python的單語言任務(wù),Multi-SWE-bench更貼近現(xiàn)實中的多語言開發(fā)場景,也更能反映當(dāng)前模型在自動化軟件工程”方向上的實際能力邊界。

    • Llama 4大模型跌落神壇:作弊刷榜、代碼能力極差、和DeepSeek比就是偽開源

      被寄予厚望的美國Meta公司的最新開源大模型Llama4發(fā)布不到2天時間,口碑急轉(zhuǎn)直下,被質(zhì)疑為刷榜作弊實際效果差、開源條件多部署門檻高是偽開源等。大模型評測平臺LMArena親自下場發(fā)文,打臉Meta提供給平臺的Llama4是“特供版”。Meta若繼續(xù)在商業(yè)控制與技術(shù)開放之間搖擺,恐將在AI競賽中進一步失去開發(fā)者支持。

    • 英偉達將首次在美制造 AI 超算、及 Blackwell 芯片

      站長之家(ChinaZ.com) 4月15日 消息:隨著 AI 行業(yè)的蓬勃發(fā)展,英偉達位于美國的人工智能芯片和超 級計算機工廠將創(chuàng)造數(shù)千個就業(yè)機會??萍季揞^英偉達(NVIDIA)宣布,其 AI 超 級計算機將完全在美國本土生產(chǎn)。在全球貿(mào)易戰(zhàn)的背景下,英偉達這一舉動是為了減少對海外市場的依賴,并促進美國國內(nèi)的生產(chǎn)。英偉達確認(rèn),他們已開始在臺積電位于美國亞利桑那州鳳凰城的工廠生產(chǎn)?

    • AI日報:智譜開源32B/9B系列GLM模型并啟用Z.ai域名;OpenAI發(fā)布GPT-4.1系列模型;阿里魔搭上線MCP廣場

      歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點內(nèi)容,聚焦開發(fā)者,助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點擊了解:https://top.aibase.com/1、智譜AI啟用全新域名Z.ai 并開源32B/9B 系列 GLM 模型智譜技術(shù)團隊近期宣布開源32B和9B系列的GLM模型,并推出全新交互體驗平臺Z.ai。這些模型遵循MIT許可協(xié)議,支持商業(yè)用途,提升了

    • AI日報:小米首個推理大模型開源Xiaomi MiMo;快手上線AI筆記工具“喵記多”;騰訊拆分AI團隊

      本文匯總了AI領(lǐng)域最新動態(tài):1)小米開源70億參數(shù)大模型Xiaomi MiMo,在數(shù)學(xué)推理和代碼競賽中超越OpenAI和阿里模型;2)快手推出AI筆記工具"喵記多",簡化筆記管理;3)Luma AI發(fā)布電影級鏡頭控制API,降低視頻生成門檻;4)騰訊重組AI團隊,加大語言模型研發(fā)投入;5)Anthropic為Claude引入新語音"Glassy";6)谷歌NotebookLM新增50+語言音頻概述功能;7)xAI將發(fā)布Grok3.5模型;8)Meta推出獨立AI助手應(yīng)用挑戰(zhàn)ChatGPT;9)OpenAI緊急修復(fù)GPT-4o"諂媚"問題;10)Mac本地AI助手Simular升級隱私保護;11)CameraBench項目幫助AI理解鏡頭運動;12)谷歌推出個性化語言學(xué)習(xí)AI工具。

    • 字節(jié)AI加速文生圖技術(shù)新突破,GOOG/微美全息引領(lǐng)開源大模型釋放科技勢能

      字節(jié)跳動發(fā)布豆包1.5深度思考模型,升級文生圖能力。該模型在專業(yè)領(lǐng)域和通用任務(wù)中表現(xiàn)突出,采用MoE架構(gòu),總參數(shù)量200B,激活參數(shù)20B,推理成本優(yōu)勢顯著。同時,其圖像生成模型Seedream 3.0性能追平GPT-4o等頂尖模型。全球AI產(chǎn)業(yè)加速發(fā)展,開源模型降低技術(shù)門檻,推動商業(yè)化落地。微美全息等企業(yè)構(gòu)建開放AI生態(tài),DeepSeek等公司通過開源策略促進技術(shù)普惠。行業(yè)迎來"開源AI+"新階段,企業(yè)需把握機遇應(yīng)對挑戰(zhàn)。

    • DeepSeek領(lǐng)航大模型普惠化浪潮,xAI/微美全息加速開源AI布局打造新格局

      DeepSeek 作為當(dāng)前最受關(guān)注的大模型之一,憑借其技術(shù)創(chuàng)新正在加速 AI 普惠化進程。根據(jù)機構(gòu)新報告顯示,DeepSeek已經(jīng)成為全球增長最快的AI工具,其每月新增網(wǎng)站訪問量已經(jīng)超過OpenAI的ChatGPT。DeepSeek市場份額全球第三目前,DeepSeek市場份額6.58%,僅次于ChatGPT和Canva。DeepSeek是繼ChatGPT之后的又一現(xiàn)象級AI產(chǎn)品,它的市場份額從2.34%快速增長至6.58%,展現(xiàn)出強勁的增長態(tài)勢。全球著名?

    • 蘋果要 all in 智能眼鏡?Vision Pro 2 也已準(zhǔn)備就緒

      蘋果已著手開發(fā)輕便且低價的 AR 智能眼鏡,同時也在開發(fā)第二代頭顯設(shè)備 Vision Pro。

    • 中國智力持續(xù)發(fā)力,智象未來開源模型再獲國際認(rèn)可

      國內(nèi)AI企業(yè)智象未來研發(fā)的開源圖像生成模型HiDream-I1近日取得重要突破:該模型憑借17B參數(shù)規(guī)模,在圖像真實感、細(xì)節(jié)處理及指令響應(yīng)能力上超越行業(yè)標(biāo)桿,多項評測指標(biāo)超過GPT-4o與Flux1.1。繼登頂AI基準(zhǔn)測試平臺Artificial Analysis、獲Hugging Face收錄后,該模型正式被谷歌技術(shù)生態(tài)體系收錄,成為首個登頂該平臺榜首的中國自研開源模型。其24小時內(nèi)登頂?shù)募o(jì)錄,被視為中國AI技術(shù)全球競爭力的重要里程碑。谷歌的收錄將推動HiDream-I1觸達全球開發(fā)者,助力開源生態(tài)共建進入新發(fā)展階段。