中文字幕欧美日韩|日韩性色一区二区三区|精品久久久久久久久久岛国|一区二区国产盗摄精品

<td id="h1kkc"><tr id="h1kkc"></tr></td><noscript id="h1kkc"><tbody id="h1kkc"></tbody></noscript>

<rp id="h1kkc"></rp>

<option id="auwgm"><del id="auwgm"></del></option>

<sup id="auwgm"></sup>

<optgroup id="auwgm"><cite id="auwgm"></cite></optgroup>

<optgroup id="auwgm"><cite id="auwgm"></cite></optgroup>

<center id="auwgm"><button id="auwgm"></button></center>

<table id="auwgm"><xmp id="auwgm">

英特爾團(tuán)隊(duì)提出L-MAGIC新技術(shù) 通過結(jié)合語(yǔ)言模型讓圖像擴(kuò)散模型生成高質(zhì)量360度場(chǎng)景

2024-06-11 13:59 · 稿源：站長(zhǎng)之家

站長(zhǎng)之家（ChinaZ.com）6月11日消息:在CVPR2024上，美國(guó)英特爾研究院的蔡志鵬博士及其團(tuán)隊(duì)提出了一種名為L(zhǎng)-MAGIC（Language Model Assisted Generation of Images with Coherence）的新技術(shù)。這項(xiàng)技術(shù)通過結(jié)合語(yǔ)言模型和圖像擴(kuò)散模型，實(shí)現(xiàn)了高質(zhì)量、多模態(tài)、零樣本泛化的360度場(chǎng)景生成。

核心特點(diǎn):

結(jié)合語(yǔ)言模型和擴(kuò)散模型:L-MAGIC利用自然圖像連接不同模態(tài)的輸入，并通過條件擴(kuò)散模型如ControlNet從各種模態(tài)輸入生成自然圖像。
迭代變形和填充:在獲得自然圖像后，L-MAGIC通過迭代變形（warping）和填充(inpainting)生成360度場(chǎng)景的多個(gè)視角，使用基于擴(kuò)散的圖像填充模型(如Stable Diffusion v2)生成缺失像素。
語(yǔ)言模型控制:L-MAGIC使用語(yǔ)言模型自動(dòng)控制擴(kuò)散模型，根據(jù)每個(gè)視角需要生成的場(chǎng)景內(nèi)容，有效保持語(yǔ)言及擴(kuò)散模型的泛化性。
多樣化場(chǎng)景生成:L-MAGIC能夠生成多樣化的全局場(chǎng)景結(jié)構(gòu)，無需微調(diào)，從而實(shí)現(xiàn)多樣化場(chǎng)景的高質(zhì)量生成。
多模態(tài)輸入:除了自然圖像，L-MAGIC還能接受文字、手繪草圖、深度圖等多種模態(tài)的輸入。

實(shí)驗(yàn)結(jié)果表明:

L-MAGIC在圖像到360度場(chǎng)景生成及文字到360度場(chǎng)景生成任務(wù)中均達(dá)到了SOTA（State of the Art）。

能夠生成具有多樣化360度場(chǎng)景結(jié)構(gòu)的全景圖，并且能夠平滑地完成360度閉環(huán)。

除了文字和自然圖像，L-MAGIC還能夠使用ControlNet接受多樣化的輸入，如深度圖、設(shè)計(jì)草圖等。

技術(shù)應(yīng)用:

L-MAGIC還能夠利用深度估計(jì)模型生成場(chǎng)景的沉浸式視頻和三維點(diǎn)云，為場(chǎng)景理解和可視化提供了更多可能性。

項(xiàng)目主頁(yè)：https://zhipengcai.github.io/MMPano/

（舉報(bào)）

相關(guān)推薦

關(guān)鍵詞：

英特爾

低端顯卡登上AI的大船！6GB顯存就能生成高質(zhì)量視頻

快科技4月20日消息，GitHub的Lvmin Zhang聯(lián)合斯坦福大學(xué)的Maneesh Agrawala，發(fā)布了一項(xiàng)突破性的新技術(shù)FramePack，通過在視頻擴(kuò)散模型中使用固定長(zhǎng)度的時(shí)域上下文，可以更高效地生成時(shí)間更長(zhǎng)、質(zhì)量更高的視頻。根據(jù)實(shí)測(cè)，基于FramePack構(gòu)建的130億參數(shù)模型，只需一塊6GB顯存的顯卡，就能生成60秒鐘的視頻。FramePack是一種神經(jīng)網(wǎng)絡(luò)架構(gòu)，使用多級(jí)優(yōu)化策略，完成本地AI視頻生成。目前，?
時(shí)空壺接入大語(yǔ)言模型，跨語(yǔ)言溝通已成翻譯的藝術(shù)

在當(dāng)今全球化浪潮中，跨語(yǔ)言溝通的需求如潮水般洶涌。從商務(wù)領(lǐng)域的跨國(guó)談判，到文化交流中的思想碰撞，高效、精準(zhǔn)的語(yǔ)言翻譯成為關(guān)鍵橋梁。隨著技術(shù)的不斷發(fā)展與迭代，時(shí)空壺有望持續(xù)引領(lǐng)行業(yè)變革，推動(dòng)全球交流合作邁向新的高度，真正實(shí)現(xiàn)跨越語(yǔ)言障礙，讓世界溝通無阻。

?跨語(yǔ)言溝通 ?AI ?翻譯設(shè)備
海信商用顯示聯(lián)合英特爾發(fā)布端側(cè)會(huì)議領(lǐng)域垂域模型，以AI技術(shù)重構(gòu)會(huì)議效率與安全邊界

4 月 16 日至 18 日， 2025 北京InfoComm展在國(guó)家會(huì)議中心拉開帷幕。海信商用顯示攜旗下全陣容產(chǎn)品亮相，展位號(hào)為EF1-01。現(xiàn)場(chǎng)，海信商用顯示聯(lián)合英特爾共同推出端側(cè)會(huì)議領(lǐng)域垂域模型，基于Windows系統(tǒng)與離線端側(cè)方案，支持會(huì)中穩(wěn)定生成會(huì)議原文、紀(jì)要及問答記錄，為政府、央國(guó)企等高保密場(chǎng)景提供合規(guī)、可靠的智能會(huì)議體驗(yàn)?，F(xiàn)場(chǎng)，海信商用顯示公司總經(jīng)理羅勇，產(chǎn)品線運(yùn)營(yíng)?

?北京InfoComm展 ?海信商用顯示 ?智能會(huì)議體驗(yàn)
字節(jié)發(fā)布豆包1.5深度思考模型：“實(shí)拍級(jí)”圖像生成

快科技4月17日消息，據(jù)報(bào)道，今日，在火山引擎AI創(chuàng)新巡展杭州站的現(xiàn)場(chǎng)，字節(jié)跳動(dòng)旗下火山引擎總裁譚待正式發(fā)布了備受矚目的豆包1.5深度思考模型。譚待指出，豆包1.5深度思考模型在多個(gè)關(guān)鍵領(lǐng)域展現(xiàn)出卓越性能。在數(shù)學(xué)、編程、科學(xué)推理這類專業(yè)領(lǐng)域中，它能夠精準(zhǔn)高效地處理復(fù)雜問題；在創(chuàng)意寫作等通用任務(wù)方面，同樣表現(xiàn)出色。該模型采用MoE架構(gòu)，總參數(shù)為200B，激?

?豆包1.5深度思考模型 ?火山引擎AI創(chuàng)新 ?字節(jié)跳動(dòng)技術(shù)發(fā)布
阿里開源通義新模型：指定首尾圖片生成視頻

快科技4月18日消息，據(jù)報(bào)道，阿里巴巴旗下通義萬相宣布開源其創(chuàng)新視頻生成技術(shù)首尾幀生視頻14B模型。這項(xiàng)突破性AI技術(shù)能夠根據(jù)用戶提供的起始和結(jié)束畫面，智能生成720p高清過渡視頻，為視頻創(chuàng)作帶來全新可能。該模型通過先進(jìn)的深度學(xué)習(xí)算法，能夠精準(zhǔn)理解輸入畫面的內(nèi)容、風(fēng)格及主題特征。當(dāng)用戶提供首尾兩幀圖像后，模型會(huì)智能分析畫面中的視覺元素，包括物體形?

?阿里巴巴 ?通義萬相 ?視頻生成技術(shù)
AI日?qǐng)?bào)：阿里騰訊全面支持MCP協(xié)議；階躍星辰多模態(tài)推理模型Step-R1-V-Mini；美圖WHEE圖像生成模型Miracle F1

歡迎來到【AI日?qǐng)?bào)】欄目!這里是你每天探索人工智能世界的指南，每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容，聚焦開發(fā)者，助你洞悉技術(shù)趨勢(shì)、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/1、阿里巴巴已宣布全面支持MCP協(xié)議騰訊緊隨其后近日，中國(guó)人工智能領(lǐng)域迎來技術(shù)標(biāo)準(zhǔn)的變革，ModelContextProtocol成為國(guó)內(nèi)AI生態(tài)的事實(shí)標(biāo)準(zhǔn)。12.英偉達(dá)發(fā)布Llama3.1NemotronUltra253B，性能?

?人工智能 ?MCP協(xié)議 ?阿里巴巴
英特爾發(fā)布第二代AI增強(qiáng)SDV SoC：車企自由度更高 AI性能提升10倍

快科技4月23日消息，上海車展今日開幕，英特爾在車展上發(fā)布第二代英特爾AI增強(qiáng)軟件定義汽車（SDV）SoC。該SoC率先在汽車行業(yè)推出基于芯粒架構(gòu)的設(shè)計(jì)，進(jìn)一步擴(kuò)展了英特爾在智能座艙領(lǐng)域的創(chuàng)新產(chǎn)品組合。英特爾希望借助第二代AI增強(qiáng)SDV SoC塑造汽車計(jì)算的未來?！庇⑻貭栐菏俊⒂⑻貭柟靖笨偛?、汽車事業(yè)部總經(jīng)理Jack Weast說。據(jù)介紹，英特爾第二代AI增強(qiáng) SDV SoC允許汽車廠商根據(jù)自身需求定制計(jì)算、圖形和AI功能，降低開發(fā)成本，縮短上市時(shí)間。通過為每個(gè)功能模塊匹配性能出色且合適的芯片。相比上代，生成式和多模態(tài)AI性能最高可提升10?

?英特爾 ?汽車行業(yè) ?AI增強(qiáng)
金倉(cāng)數(shù)據(jù)庫(kù)：三輪驅(qū)動(dòng)，賦能數(shù)字中國(guó)高質(zhì)量發(fā)展

電科金倉(cāng)作為國(guó)產(chǎn)數(shù)據(jù)庫(kù)領(lǐng)軍企業(yè)，累計(jì)申請(qǐng)專利600余項(xiàng)……

?數(shù)字中國(guó) ?數(shù)字經(jīng)濟(jì) ?數(shù)字產(chǎn)業(yè)化
首次實(shí)現(xiàn)圖像思考 OpenAI重磅發(fā)布o(jì)3/o4-mini：史上最強(qiáng)、最智能模型

快科技4月17日消息，今日，OpenAI新款A(yù)I模型o3、o4-mini重磅發(fā)布，這是OpenAI迄今最強(qiáng)、最智能的模型。據(jù)了解，OpenAI o3/o4-mini首次具備真正的視覺推理能力，看圖識(shí)圖已經(jīng)是小菜一碟了，現(xiàn)在還會(huì)看圖思考。OpenAI o3/o4-mini能同時(shí)處理文本、圖像和音頻，并且能作為Agent智能體自動(dòng)調(diào)用網(wǎng)絡(luò)搜索、圖像生成、代碼解析等工具以及深度思考模式。通過強(qiáng)化學(xué)習(xí)，OpenAI訓(xùn)練了o3/o4-mini如何?

?OpenAI ?AI模型 ?視覺推理
夯實(shí)新質(zhì)生產(chǎn)力強(qiáng)基！小熊電器以高質(zhì)量發(fā)展“智”變實(shí)業(yè)

談?wù)撝袊?guó)制造業(yè)發(fā)展的宏大敘事，佛山始終是繞不開的話題。數(shù)十年來，這座簇?fù)硗晟?、豐富制造產(chǎn)業(yè)鏈集群的“嶺南最高枝”，不僅以“有家就有佛山造”而聞名遐邇，更成為全國(guó)制造業(yè)轉(zhuǎn)型的重要觀察窗口。在今天，圍繞“再造一個(gè)新佛山”的全新愿景，一家家前仆后繼、躬身實(shí)踐的企業(yè)，正釋放出現(xiàn)代化產(chǎn)業(yè)體系加速升級(jí)的全新信號(hào)。在“智改數(shù)轉(zhuǎn)”浪潮之下，作為扎

?中國(guó)制造業(yè) ?佛山制造業(yè) ?高質(zhì)量發(fā)展

熱文

3 天
7天

1

累了倦了就找 ChatGPT……AI正在淪為“情緒垃圾桶”！

站長(zhǎng)商機(jī)

廣告

商務(wù)合作侵權(quán)投訴廣告服務(wù) 版權(quán)聲明招聘

?CopyRight 2002-2020 CHINAZ.COM

<pre id="csks4"><center id="csks4"></center></pre>

<center id="csks4"></center>

<fieldset id="csks4"></fieldset>