中文字幕欧美日韩|日韩性色一区二区三区|精品久久久久久久久久岛国|一区二区国产盗摄精品

<td id="h1kkc"><tr id="h1kkc"></tr></td><noscript id="h1kkc"><tbody id="h1kkc"></tbody></noscript>

<rp id="h1kkc"></rp>

谷歌推出通用AI代理SIMA：3D游戲世界的全能AI玩家

2024-03-22 08:47 · 稿源：站長之家

劃重點:
?? 無需源代碼或API，SIMA通過文本和圖像提示執(zhí)行操作
?? 與多個游戲工作室合作，SIMA在多款3D游戲中展現(xiàn)卓越性能
?? 由多種大模型組成的SIMA，模仿人類感知、思考、規(guī)劃和執(zhí)行

正文:

近日，谷歌DeepMind的研究團(tuán)隊宣布推出一款面向3D虛擬環(huán)境的通用AI代理——SIMA。這一創(chuàng)新成果標(biāo)志著AI技術(shù)在游戲領(lǐng)域的應(yīng)用邁出了重要一步。SIMA的獨特之處在于，它能夠無需游戲的源代碼或定制API，僅依賴于用戶提供的圖像和簡單文本指令，就能像人類玩家一樣在游戲世界中自由行動。

SIMA的研發(fā)過程中，DeepMind與八家游戲工作室緊密合作，將其在《無人深空》、《模擬山羊3》、《Teardown》、《挖礦模擬器》等多款知名3D游戲中進(jìn)行了廣泛測試。測試結(jié)果顯示，SIMA能夠執(zhí)行超過600種基本操作，包括挖礦、駕駛飛船、制作裝備等，且每項操作的完成時間平均不超過10秒。

SIMA的架構(gòu)設(shè)計靈感來源于人類的身體構(gòu)造，由多種大模型組合而成。其中，視覺感知模型相當(dāng)于AI的“眼睛”，負(fù)責(zé)處理圖像觀察并提取關(guān)鍵信息;大語言模型則是“大腦”，解析和理解自然語言指令;建模規(guī)劃模型扮演“思維”的角色，通過強化學(xué)習(xí)規(guī)劃最佳行動策略;最后，控制和執(zhí)行模型作為“四肢”，將動作序列轉(zhuǎn)化為實際的游戲控制指令。

在數(shù)據(jù)收集和預(yù)處理方面，SIMA采用了先進(jìn)的技術(shù)手段。研究人員從商業(yè)游戲中收集了大量數(shù)據(jù)，并通過數(shù)據(jù)清洗、轉(zhuǎn)換和標(biāo)準(zhǔn)化等步驟，確保了數(shù)據(jù)的質(zhì)量和一致性。這些工作為SIMA的學(xué)習(xí)和執(zhí)行提供了堅實的基礎(chǔ)。

谷歌DeepMind的研究人員表示，他們將繼續(xù)迭代和提升SIMA的通用代理能力，期望未來SIMA能在現(xiàn)實生活中為用戶提供更多幫助。

技術(shù)報告:https://storage.googleapis.com/deepmind-media/DeepMind.com/Blog/sima-generalist-ai-agent-for-3d-virtual-environments/Scaling%20Instructable%20Agents%20Across%20Many%20Simulated%20Worlds.pdf

（舉報）

相關(guān)推薦

關(guān)鍵詞：

薦日銷破千元！AI生成的3D梗圖掛件，被我們賣爆了

先說結(jié)論:我們花15天做的AI3D掛件，在線下賣爆了，單日營收破千元!故事的開始，是因為我們發(fā)現(xiàn)把AI3D打印手辦做成一門小生意的可行性越來越高，這也激發(fā)了我們的“搞錢基因”。再加上前不久新榜在上海舉辦了「新榜內(nèi)容節(jié)」，一拍即合，我們于是做了一批模型去大會現(xiàn)場擺攤試水!最后結(jié)果還不錯，單日最高收入突破1000元，是我們“創(chuàng)業(yè)史”上的一個高光表現(xiàn)。歡迎大家

?AI ?3D打印 ?創(chuàng)業(yè)經(jīng)驗
AI日報： OpenAI推出gpt-image-1圖像生成API;納米AI發(fā)布MCP萬能工具箱;中國占全球AI專利60%

【AI日報】欄目聚焦人工智能領(lǐng)域最新動態(tài)：1) OpenAI推出ChatGPT圖像生成API，開發(fā)者可輕松集成AI繪圖功能，已生成超7億張圖片；2) 谷歌Gemini月活用戶突破3.5億，但仍落后于ChatGPT的6億用戶；3) OpenAI預(yù)測2029年收入將達(dá)1250億美元，AI代理業(yè)務(wù)成主要增長點；4) Ostris發(fā)布8B參數(shù)擴(kuò)散模型Flex.2-preview，優(yōu)化ComfyUI工作流；5) 英偉達(dá)推出多模態(tài)LLM模型Describe Anything，支持指定區(qū)域生成詳細(xì)描?

?OpenAI ?ChatGPT ?圖像生成
聽腦 AI：重新定義語音處理效率的全能助手

聽腦AI是一款專注于語音/視頻轉(zhuǎn)文本的智能助手，具備三大核心功能：1）實時語音轉(zhuǎn)寫，支持會議、課堂等多場景錄音轉(zhuǎn)文字，自動區(qū)分發(fā)言人；2）音視頻解析，可提取本地文件或平臺鏈接內(nèi)容生成可編輯文檔；3）AI問答輔助，能基于語音內(nèi)容生成摘要、PPT大綱等二次創(chuàng)作。其優(yōu)勢在于毫秒級響應(yīng)、125種語言互譯、智能降噪，適用于商務(wù)會議、教育學(xué)習(xí)、內(nèi)容創(chuàng)作等場景，顯著提升工作效率。支持多端同步與加密存儲，提供20分鐘免費試用體驗。

?語音轉(zhuǎn)文本 ?智能助手 ?高效生產(chǎn)力
能理解海豚聲音！谷歌開發(fā)全新AI模型DolphinGemma

快科技4月15日消息，谷歌公布了一款名為DolphinGemma”的大型語言模型，旨在幫助科學(xué)家理解海豚的聲音，并生成類似海豚的聲音序列。研究人員預(yù)計在未來幾個月內(nèi)測試DolphinGemma及其配套的Cetacean Hearing Augmentation Telemetry（CHAT）發(fā)聲系統(tǒng)，以探索是否能夠翻譯并模仿海豚的聲音，進(jìn)而實現(xiàn)與海豚的某種對話”。海豚是地球上最聰明且最善于溝通的動物之一，其社交互動極其復(fù)雜?

?谷歌 ?DolphinGemma ?海豚溝通
薦AI日報：百度文心4.5 Turbo將于4月25日發(fā)布；谷歌推全新智能體開放協(xié)議A2A；視頻號整治不當(dāng)使用AI工具直播行為

歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南，每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點內(nèi)容，聚焦開發(fā)者，助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點擊了解:https://top.aibase.com/1、百度官宣:文心大模型4.5Turbo將于4月25日發(fā)布百度宣布將在4月25日的Create大會上發(fā)布文心大模型4.5Turbo，盡管具體細(xì)節(jié)尚未披露，但業(yè)界對此充滿期待。雖然試用期間無需綁定信用卡，但實際使用需購買托管計劃。

?人工智能 ?AI產(chǎn)品 ?文心大模型
薦UniToken：多模態(tài)AI的“全能選手”，一次編碼搞定圖文理解與圖像生成

復(fù)旦大學(xué)與美團(tuán)研究者提出UniToken框架，首次在統(tǒng)一模型中實現(xiàn)圖文理解與生成任務(wù)的"雙優(yōu)表現(xiàn)"。該方案融合連續(xù)和離散視覺編碼，有效解決了傳統(tǒng)多模態(tài)建模中的"任務(wù)干擾"和"表示割裂"問題。通過三階段訓(xùn)練策略（視覺語義對齊、多任務(wù)聯(lián)合訓(xùn)練、指令強化微調(diào)），UniToken在多個基準(zhǔn)測試中性能超越專用模型。其創(chuàng)新性體現(xiàn)在：1）統(tǒng)一的雙邊視覺編碼

?UniToken ?多模態(tài)建模 ?視覺編碼
?上海毅速推出第三代模具3D打印專機(jī)E3系列，引領(lǐng)模具制造技術(shù)革新

導(dǎo)讀：近年來，金屬3D打印技術(shù)在模具制造領(lǐng)域得到了廣泛的應(yīng)用，模具行業(yè)正在迎來一場前所未有的技術(shù)變革，隨著應(yīng)用的逐漸深入，模具專用的金屬3D打印機(jī)應(yīng)運而生。2025 年 4 月 15 日，上海毅速激光科技有限公司（以下簡稱“毅速”）正式發(fā)布了其第三代模具3D打印專機(jī)系列——E3- 420 和E3-520。這一新品的推出，標(biāo)志著模具制造行業(yè)向增材制造邁出了重要一步。毅速E3- 420 ?

?金屬3D打印 ?模具制造 ?增材制造
薦AI日報：騰訊混元3D生成模型2.5版本發(fā)布；海螺推出圖像人物參考功能；百度上線移動端超級智能體心響App

本文介紹了多款A(yù)I領(lǐng)域的新產(chǎn)品和技術(shù)進(jìn)展：1)Kortix-AI推出開源通用AI智能體平臺Suna；2)騰訊混元3D生成模型升級至2.5版本；3)海螺AI推出基于單張圖像生成多角度角色圖像功能；4)百度發(fā)布"心響"App整合多智能體協(xié)作；5)Nari Labs開源媲美真人的對話語音模型Dia；6)Grok新增視覺處理和多語言支持；7)Genspark推出AI幻燈片工具；8)Character.AI發(fā)布讓靜態(tài)圖片"說話"的AvatarFX模型；9)pad.ws結(jié)合白板和代碼編輯器；10)OpenBMB開源社區(qū)推出長文本生成模型"卷姬"；11)騰訊推出AI閱讀助手"企鵝讀伴"；12)OpenAI有意收購Chrome瀏覽器；13)字節(jié)跳動調(diào)整AI產(chǎn)品線布局。這些創(chuàng)新展現(xiàn)了AI技術(shù)在自動化、3D生成、語音交互、內(nèi)容創(chuàng)作等領(lǐng)域的快速發(fā)展。

?人工智能 ?AI產(chǎn)品 ?開源平臺
開啟內(nèi)測！360納米AI推出“MCP萬能工具箱”

4月23日，360旗下納米AI正式發(fā)布"MCP萬能工具箱"，該工具基于MCP協(xié)議開發(fā)，已接入超110款工具，覆蓋辦公、學(xué)術(shù)、生活服務(wù)、金融等多場景。產(chǎn)品負(fù)責(zé)人梁志輝介紹，MCP協(xié)議類似USB-C接口，為AI調(diào)用外部工具提供標(biāo)準(zhǔn)化連接方式。目前該工具已開啟內(nèi)測，首批受邀用戶包括AI博主和媒體人士。實測顯示，該工具能快速生成專業(yè)分析報告，效率遠(yuǎn)超人工。用戶還可創(chuàng)建專屬智能體，如醫(yī)療、金融等領(lǐng)域的專業(yè)助手。360表示，工具對AI應(yīng)用意義重大，將推動AI從聊天機(jī)器人進(jìn)化為真正的"數(shù)字員工"。

?360納米AI ?360 ?MCP萬能工具箱
首支報名團(tuán)隊探秘：《武俠世界AI》加入“數(shù)龍杯”

“數(shù)龍杯”的第一個參賽者來了！在4月2日“數(shù)龍杯”全球AI游戲及應(yīng)用創(chuàng)新大賽正式啟動后，來自中國廣州的“四方格團(tuán)隊”即投遞了作品，成為首支報名成功的開發(fā)團(tuán)隊。大賽主辦方也將繼續(xù)跟蹤報道各類創(chuàng)新團(tuán)隊，為他們創(chuàng)造更多的亮相機(jī)會，以此推動更多的創(chuàng)新項目與廣大用戶見面。

?數(shù)龍杯 ?AI游戲 ?全球大賽

熱文

3 天
7天

1

累了倦了就找 ChatGPT……AI正在淪為“情緒垃圾桶”！

站長商機(jī)

廣告

商務(wù)合作侵權(quán)投訴廣告服務(wù) 版權(quán)聲明招聘

?CopyRight 2002-2020 CHINAZ.COM