中文字幕欧美日韩|日韩性色一区二区三区|精品久久久久久久久久岛国|一区二区国产盗摄精品

    <td id="h1kkc"><tr id="h1kkc"></tr></td><noscript id="h1kkc"><tbody id="h1kkc"></tbody></noscript>
    <rp id="h1kkc"></rp>
    首頁 > 業(yè)界 > 關(guān)鍵詞  > SIMA最新資訊  > 正文

    谷歌推出通用AI代理SIMA:3D游戲世界的全能AI玩家

    2024-03-22 08:47 · 稿源:站長之家

    劃重點:

    ?? 無需源代碼或API,SIMA通過文本和圖像提示執(zhí)行操作

    ?? 與多個游戲工作室合作,SIMA在多款3D游戲中展現(xiàn)卓越性能

    ?? 由多種大模型組成的SIMA,模仿人類感知、思考、規(guī)劃和執(zhí)行

    正文:

    近日,谷歌DeepMind的研究團(tuán)隊宣布推出一款面向3D虛擬環(huán)境的通用AI代理——SIMA。這一創(chuàng)新成果標(biāo)志著AI技術(shù)在游戲領(lǐng)域的應(yīng)用邁出了重要一步。SIMA的獨特之處在于,它能夠無需游戲的源代碼或定制API,僅依賴于用戶提供的圖像和簡單文本指令,就能像人類玩家一樣在游戲世界中自由行動。

    image.png

    SIMA的研發(fā)過程中,DeepMind與八家游戲工作室緊密合作,將其在《無人深空》、《模擬山羊3》、《Teardown》、《挖礦模擬器》等多款知名3D游戲中進(jìn)行了廣泛測試。測試結(jié)果顯示,SIMA能夠執(zhí)行超過600種基本操作,包括挖礦、駕駛飛船、制作裝備等,且每項操作的完成時間平均不超過10秒。

    SIMA的架構(gòu)設(shè)計靈感來源于人類的身體構(gòu)造,由多種大模型組合而成。其中,視覺感知模型相當(dāng)于AI的“眼睛”,負(fù)責(zé)處理圖像觀察并提取關(guān)鍵信息;大語言模型則是“大腦”,解析和理解自然語言指令;建模規(guī)劃模型扮演“思維”的角色,通過強化學(xué)習(xí)規(guī)劃最佳行動策略;最后,控制和執(zhí)行模型作為“四肢”,將動作序列轉(zhuǎn)化為實際的游戲控制指令。

    image.png

    在數(shù)據(jù)收集和預(yù)處理方面,SIMA采用了先進(jìn)的技術(shù)手段。研究人員從商業(yè)游戲中收集了大量數(shù)據(jù),并通過數(shù)據(jù)清洗、轉(zhuǎn)換和標(biāo)準(zhǔn)化等步驟,確保了數(shù)據(jù)的質(zhì)量和一致性。這些工作為SIMA的學(xué)習(xí)和執(zhí)行提供了堅實的基礎(chǔ)。

    谷歌DeepMind的研究人員表示,他們將繼續(xù)迭代和提升SIMA的通用代理能力,期望未來SIMA能在現(xiàn)實生活中為用戶提供更多幫助。

    技術(shù)報告:https://storage.googleapis.com/deepmind-media/DeepMind.com/Blog/sima-generalist-ai-agent-for-3d-virtual-environments/Scaling%20Instructable%20Agents%20Across%20Many%20Simulated%20Worlds.pdf

    舉報

    • 相關(guān)推薦
    • 日銷破千元!AI生成的3D梗圖掛件,被我們賣爆了

      先說結(jié)論:我們花15天做的AI3D掛件,在線下賣爆了,單日營收破千元!故事的開始,是因為我們發(fā)現(xiàn)把AI3D打印手辦做成一門小生意的可行性越來越高,這也激發(fā)了我們的“搞錢基因”。再加上前不久新榜在上海舉辦了「新榜內(nèi)容節(jié)」,一拍即合,我們于是做了一批模型去大會現(xiàn)場擺攤試水!最后結(jié)果還不錯,單日最高收入突破1000元,是我們“創(chuàng)業(yè)史”上的一個高光表現(xiàn)。歡迎大家

    • AI日報: OpenAI推出gpt-image-1圖像生成API;納米AI發(fā)布MCP萬能工具箱;中國占AI專利60%

      【AI日報】欄目聚焦人工智能領(lǐng)域最新動態(tài):1) OpenAI推出ChatGPT圖像生成API,開發(fā)者可輕松集成AI繪圖功能,已生成超7億張圖片;2) 谷歌Gemini月活用戶突破3.5億,但仍落后于ChatGPT的6億用戶;3) OpenAI預(yù)測2029年收入將達(dá)1250億美元,AI代理業(yè)務(wù)成主要增長點;4) Ostris發(fā)布8B參數(shù)擴(kuò)散模型Flex.2-preview,優(yōu)化ComfyUI工作流;5) 英偉達(dá)推出多模態(tài)LLM模型Describe Anything,支持指定區(qū)域生成詳細(xì)描?

    • 聽腦 AI:重新定義語音處理效率的全能助手

      聽腦AI是一款專注于語音/視頻轉(zhuǎn)文本的智能助手,具備三大核心功能:1)實時語音轉(zhuǎn)寫,支持會議、課堂等多場景錄音轉(zhuǎn)文字,自動區(qū)分發(fā)言人;2)音視頻解析,可提取本地文件或平臺鏈接內(nèi)容生成可編輯文檔;3)AI問答輔助,能基于語音內(nèi)容生成摘要、PPT大綱等二次創(chuàng)作。其優(yōu)勢在于毫秒級響應(yīng)、125種語言互譯、智能降噪,適用于商務(wù)會議、教育學(xué)習(xí)、內(nèi)容創(chuàng)作等場景,顯著提升工作效率。支持多端同步與加密存儲,提供20分鐘免費試用體驗。

    • 能理解海豚聲音!谷歌開發(fā)AI模型DolphinGemma

      快科技4月15日消息,谷歌公布了一款名為DolphinGemma”的大型語言模型,旨在幫助科學(xué)家理解海豚的聲音,并生成類似海豚的聲音序列。研究人員預(yù)計在未來幾個月內(nèi)測試DolphinGemma及其配套的Cetacean Hearing Augmentation Telemetry(CHAT)發(fā)聲系統(tǒng),以探索是否能夠翻譯并模仿海豚的聲音,進(jìn)而實現(xiàn)與海豚的某種對話”。海豚是地球上最聰明且最善于溝通的動物之一,其社交互動極其復(fù)雜?

    • AI日報:百度文心4.5 Turbo將于4月25日發(fā)布;谷歌推新智能體開放協(xié)議A2A;視頻號整治不當(dāng)使用AI工具直播行為

      歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點內(nèi)容,聚焦開發(fā)者,助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點擊了解:https://top.aibase.com/1、百度官宣:文心大模型4.5Turbo將于4月25日發(fā)布百度宣布將在4月25日的Create大會上發(fā)布文心大模型4.5Turbo,盡管具體細(xì)節(jié)尚未披露,但業(yè)界對此充滿期待。雖然試用期間無需綁定信用卡,但實際使用需購買托管計劃。

    • UniToken:多模態(tài)AI的“全能選手”,一次編碼搞定圖文理解與圖像生成

      復(fù)旦大學(xué)與美團(tuán)研究者提出UniToken框架,首次在統(tǒng)一模型中實現(xiàn)圖文理解與生成任務(wù)的"雙優(yōu)表現(xiàn)"。該方案融合連續(xù)和離散視覺編碼,有效解決了傳統(tǒng)多模態(tài)建模中的"任務(wù)干擾"和"表示割裂"問題。通過三階段訓(xùn)練策略(視覺語義對齊、多任務(wù)聯(lián)合訓(xùn)練、指令強化微調(diào)),UniToken在多個基準(zhǔn)測試中性能超越專用模型。其創(chuàng)新性體現(xiàn)在:1)統(tǒng)一的雙邊視覺編碼

    • ?上海毅速推出第三代模具3D打印專機(jī)E3系列,引領(lǐng)模具制造技術(shù)革新

      導(dǎo)讀:近年來,金屬3D打印技術(shù)在模具制造領(lǐng)域得到了廣泛的應(yīng)用,模具行業(yè)正在迎來一場前所未有的技術(shù)變革,隨著應(yīng)用的逐漸深入,模具專用的金屬3D打印機(jī)應(yīng)運而生。2025 年 4 月 15 日,上海毅速激光科技有限公司(以下簡稱“毅速”)正式發(fā)布了其第三代模具3D打印專機(jī)系列——E3- 420 和E3-520。這一新品的推出,標(biāo)志著模具制造行業(yè)向增材制造邁出了重要一步。毅速E3- 420 ?

    • AI日報:騰訊混元3D生成模型2.5版本發(fā)布;海螺推出圖像人物參考功能;百度上線移動端超級智能體心響App

      本文介紹了多款A(yù)I領(lǐng)域的新產(chǎn)品和技術(shù)進(jìn)展:1)Kortix-AI推出開源通用AI智能體平臺Suna;2)騰訊混元3D生成模型升級至2.5版本;3)海螺AI推出基于單張圖像生成多角度角色圖像功能;4)百度發(fā)布"心響"App整合多智能體協(xié)作;5)Nari Labs開源媲美真人的對話語音模型Dia;6)Grok新增視覺處理和多語言支持;7)Genspark推出AI幻燈片工具;8)Character.AI發(fā)布讓靜態(tài)圖片"說話"的AvatarFX模型;9)pad.ws結(jié)合白板和代碼編輯器;10)OpenBMB開源社區(qū)推出長文本生成模型"卷姬";11)騰訊推出AI閱讀助手"企鵝讀伴";12)OpenAI有意收購Chrome瀏覽器;13)字節(jié)跳動調(diào)整AI產(chǎn)品線布局。這些創(chuàng)新展現(xiàn)了AI技術(shù)在自動化、3D生成、語音交互、內(nèi)容創(chuàng)作等領(lǐng)域的快速發(fā)展。

    • 開啟內(nèi)測!360納米AI推出“MCP萬能工具箱”

      4月23日,360旗下納米AI正式發(fā)布"MCP萬能工具箱",該工具基于MCP協(xié)議開發(fā),已接入超110款工具,覆蓋辦公、學(xué)術(shù)、生活服務(wù)、金融等多場景。產(chǎn)品負(fù)責(zé)人梁志輝介紹,MCP協(xié)議類似USB-C接口,為AI調(diào)用外部工具提供標(biāo)準(zhǔn)化連接方式。目前該工具已開啟內(nèi)測,首批受邀用戶包括AI博主和媒體人士。實測顯示,該工具能快速生成專業(yè)分析報告,效率遠(yuǎn)超人工。用戶還可創(chuàng)建專屬智能體,如醫(yī)療、金融等領(lǐng)域的專業(yè)助手。360表示,工具對AI應(yīng)用意義重大,將推動AI從聊天機(jī)器人進(jìn)化為真正的"數(shù)字員工"。

    • 首支報名團(tuán)隊探秘:《武俠世界AI》加入“數(shù)龍杯”

      “數(shù)龍杯”的第一個參賽者來了!在4月2日“數(shù)龍杯”全球AI游戲及應(yīng)用創(chuàng)新大賽正式啟動后,來自中國廣州的“四方格團(tuán)隊”即投遞了作品,成為首支報名成功的開發(fā)團(tuán)隊。大賽主辦方也將繼續(xù)跟蹤報道各類創(chuàng)新團(tuán)隊,為他們創(chuàng)造更多的亮相機(jī)會,以此推動更多的創(chuàng)新項目與廣大用戶見面。