中文字幕欧美日韩|日韩性色一区二区三区|精品久久久久久久久久岛国|一区二区国产盗摄精品

<td id="h1kkc"><tr id="h1kkc"></tr></td><noscript id="h1kkc"><tbody id="h1kkc"></tbody></noscript>

<rp id="h1kkc"></rp>

CRM：上傳圖片生成3D模型，10秒搞定

2024-03-12 11:42 · 稿源：站長之家

劃重點(diǎn):
1. ??Convolutional Reconstruction Model（CRM）是一種高保真度的前饋單圖像到3D生成模型，充分考慮了稀疏3D數(shù)據(jù)的限制，強(qiáng)調(diào)了在網(wǎng)絡(luò)設(shè)計中整合幾何先驗的必要性。
2. ???CRM通過生成六個正交視圖圖像，經(jīng)過卷積U-Net處理，利用其強(qiáng)大的像素級對齊能力和顯著的帶寬，創(chuàng)建了高分辨率的三平面
3. ?? 模型在僅10秒內(nèi)從圖像中生成高保真紋理網(wǎng)格，無需任何測試時優(yōu)化。

站長之家(ChinaZ.com) 3月12日消息:近期，清華大學(xué)的研究團(tuán)隊在圖像處理領(lǐng)域取得了重要進(jìn)展，他們提出了一種名為Convolutional Reconstruction Model（CRM）的前饋式單圖像到3D紋理網(wǎng)格生成模型。與傳統(tǒng)的大型重建模型(LRM)相比，CRM在生成速度上表現(xiàn)出色，同時克服了基于Transformer的方法在幾何先驗方面存在的不足。

傳統(tǒng)的3D生成模型雖然在生成速度上有所突破，但由于Transformer方法未充分利用三平面組件的幾何先驗，導(dǎo)致在有限的3D數(shù)據(jù)和緩慢的訓(xùn)練情況下質(zhì)量不佳。為了解決這一問題，研究團(tuán)隊提出了CRM，一個高保真度的前饋式單圖像到3D生成模型。

CRM的關(guān)鍵觀察是，三平面的可視化呈現(xiàn)出六個正交圖像的空間對應(yīng)關(guān)系。模型首先從單個輸入圖像生成六個正交視圖圖像，然后將這些圖像輸入卷積U-Net進(jìn)行處理，利用其強(qiáng)大的像素級對齊能力和顯著的帶寬，創(chuàng)建高分辨率的三平面。與此同時，CRM采用Flexicubes作為幾何表示，實現(xiàn)對紋理網(wǎng)格的直接端到端優(yōu)化。

整個推理過程僅需要在A800GPU上花費(fèi)約10秒的時間，其中包括U-Net的前向傳播（不到0.1秒）、查詢表面點(diǎn)的UV紋理和文件I/O。與傳統(tǒng)方法相比，CRM從圖像中僅需短短的時間就能生成高保真度的紋理網(wǎng)格，無需在測試時進(jìn)行任何優(yōu)化。

圖中，展示了整個方法的流程。輸入圖像首先經(jīng)過多視圖圖像擴(kuò)散模型，生成六個正交圖像。然后，另一個擴(kuò)散模型用于生成基于這六個圖像的CCMs（conditional convolutional masks）。最后，這六個圖像和CCMs一起輸入CRM，重建最終的紋理網(wǎng)格。

研究團(tuán)隊通過生成的紋理網(wǎng)格展示了CRM的性能，包括玫瑰、青蛙、大象、哆啦A夢、貓和校車等互動網(wǎng)格。同時，CRM還展示了其在創(chuàng)建類似樂高風(fēng)格的對象方面的潛力。

在與現(xiàn)有方法的比較中，CRM展現(xiàn)出了卓越的性能和效率。研究團(tuán)隊通過BibTeX引用了他們的工作，這表明了對該模型的高度認(rèn)可。

這一項研究為單圖像到3D紋理網(wǎng)格的生成提供了一種新的前饋式模型，具有卓越的速度和質(zhì)量，為圖像處理領(lǐng)域帶來了新的可能性。

項目入口:https://top.aibase.com/tool/crm

（舉報）

相關(guān)推薦

關(guān)鍵詞：

阿里開源通義新模型：指定首尾圖片生成視頻

快科技4月18日消息，據(jù)報道，阿里巴巴旗下通義萬相宣布開源其創(chuàng)新視頻生成技術(shù)首尾幀生視頻14B模型。這項突破性AI技術(shù)能夠根據(jù)用戶提供的起始和結(jié)束畫面，智能生成720p高清過渡視頻，為視頻創(chuàng)作帶來全新可能。該模型通過先進(jìn)的深度學(xué)習(xí)算法，能夠精準(zhǔn)理解輸入畫面的內(nèi)容、風(fēng)格及主題特征。當(dāng)用戶提供首尾兩幀圖像后，模型會智能分析畫面中的視覺元素，包括物體形?

?阿里巴巴 ?通義萬相 ?視頻生成技術(shù)
薦日銷破千元！AI生成的3D梗圖掛件，被我們賣爆了

先說結(jié)論:我們花15天做的AI3D掛件，在線下賣爆了，單日營收破千元!故事的開始，是因為我們發(fā)現(xiàn)把AI3D打印手辦做成一門小生意的可行性越來越高，這也激發(fā)了我們的“搞錢基因”。再加上前不久新榜在上海舉辦了「新榜內(nèi)容節(jié)」，一拍即合，我們于是做了一批模型去大會現(xiàn)場擺攤試水!最后結(jié)果還不錯，單日最高收入突破1000元，是我們“創(chuàng)業(yè)史”上的一個高光表現(xiàn)。歡迎大家

?AI ?3D打印 ?創(chuàng)業(yè)經(jīng)驗
CRM和SCRM有哪些區(qū)別？企業(yè)如何選擇？功能對比+選型建議一文說清！AI趨勢下企業(yè)如何提升營銷服效率？

文章探討了CRM與SCRM系統(tǒng)的區(qū)別及企業(yè)選擇策略。CRM側(cè)重客戶信息管理和銷售流程優(yōu)化，適用于業(yè)務(wù)簡單的企業(yè)；SCRM整合社交媒體數(shù)據(jù)，更適合需要深度客戶洞察和長決策周期的大型企業(yè)。在AI時代，SCRM能更全面收集數(shù)據(jù)，賦能精準(zhǔn)營銷。建議企業(yè)根據(jù)業(yè)務(wù)規(guī)模、客戶決策周期等因素選擇系統(tǒng)，已使用CRM的企業(yè)若面臨轉(zhuǎn)化率低等問題可考慮遷移至SCRM。塵鋒SCRM作為行業(yè)解決方案，結(jié)合AI能力可實現(xiàn)獲客、轉(zhuǎn)化、運(yùn)營全流程數(shù)字化管理，提升業(yè)務(wù)效率。

?銷售過程管理 ?客戶關(guān)系管理 ?CRM與SCRM
ChatGPT上線圖庫功能：可管理AI生成圖片

快科技4月16日消息，據(jù)報道，OpenAI近日宣布將為ChatGPT推出全新的Image Library圖庫功能，該功能將幫助用戶更高效地管理和查看AI生成的圖像。這項創(chuàng)新功能將逐步向所有用戶開放，包括移動端和網(wǎng)頁端的免費(fèi)版、Plus版及Pro版用戶。新功能的設(shè)計充分考慮了用戶體驗的便捷性。用戶只需點(diǎn)擊ChatGPT側(cè)邊欄的Library入口，就能進(jìn)入一個直觀的圖像網(wǎng)格界面。在這個界面中，用戶可以輕?

?OpenAI ?ChatGPT ?Image
1至5元不等！有人開始售賣ChatGPT生成的“吉卜力風(fēng)格”圖片了

SNS上出現(xiàn)了售賣吉卜力風(fēng)格圖片的“交易”，一些二手交易平臺上聲稱收到錢后就會幫忙制作吉卜力風(fēng)格圖片的帖子也層出不窮。吉卜力風(fēng)格的圖片轉(zhuǎn)化功能在全球備受歡迎，近一周時間，通過ChatGPT制作的相關(guān)圖片數(shù)量就超過了7億張。想想他們?yōu)榱舜蛟炷撤N獨(dú)特風(fēng)格所付出的努力，如今卻遭遇這種無法受到著作權(quán)法保護(hù)的情況，無疑會極大地打擊創(chuàng)作者們的積極性。

?動畫風(fēng)格圖片 ?ChatGPT ?吉卜力風(fēng)格
10倍精度升級！騰訊混元3D模型v2.5版本發(fā)布

騰訊混元3D模型升級至v2.5版本，建模精度和貼圖真實度顯著提升。新版本參數(shù)體量從1B增至10B，有效面片數(shù)增加超10倍，支持1024幾何分辨率。紋理系統(tǒng)支持4K高清貼圖和凹凸細(xì)節(jié)，率先支持多視圖生成PBR模型。針對動畫場景優(yōu)化骨骼蒙皮系統(tǒng)，支持非標(biāo)準(zhǔn)姿態(tài)自動綁定。新增文生/圖生3D減面模型、多視圖建模模板等專業(yè)工作流?；煸?D v2.5已全面更新至騰訊AI創(chuàng)作引擎，免費(fèi)生成額度提升至每日20次，并正式上線騰訊云API面向企業(yè)開放。GitHub開源版本累計Star超1.2萬。

?騰訊 ?混元3D ?模型升級
銷售易亮相騰訊云城市峰會成都站，CRM智慧賦能制造業(yè)突破增長邊界

4月18日，騰訊云城市峰會在成都圓滿收官。銷售易再度亮相峰會，展示AI CRM技術(shù)應(yīng)用及智能制造行業(yè)解決方案。騰訊集團(tuán)副總裁李強(qiáng)以"乘云起勢，為增長提速"為主題致辭，指出當(dāng)前全球格局處于大變局時代，騰訊依托"智能驅(qū)動、全球布局、自主創(chuàng)新"三大戰(zhàn)略引擎，助力企業(yè)打造核心競爭力。銷售易與騰訊云深度協(xié)同，基于騰訊混元大模型+DeepSeek開源模型打造中國首款A(yù)I CRM——NeoAgent，覆蓋客戶旅程管理、智能辦公協(xié)同等關(guān)鍵場景，已服務(wù)施耐德電氣、伊頓公司等500強(qiáng)企業(yè)。雙方通過技術(shù)互補(bǔ)與價值共創(chuàng)，持續(xù)輸出可復(fù)制的數(shù)字化增長路徑，推動CRM系統(tǒng)向智能決策中樞進(jìn)化。

?騰訊云峰會 ?AI ?CRM
谷歌Gemini整合Veo 2視頻生成模型，8秒720P視頻輕松搞定

谷歌宣布又有一款 AI 模型將加入 Gemini，但這次它不僅僅是一個聊天機(jī)器人。

?谷歌 ?谷歌gemini ?veo2
薦AI日報：騰訊混元3D生成模型2.5版本發(fā)布；海螺推出圖像人物參考功能；百度上線移動端超級智能體心響App

本文介紹了多款A(yù)I領(lǐng)域的新產(chǎn)品和技術(shù)進(jìn)展：1)Kortix-AI推出開源通用AI智能體平臺Suna；2)騰訊混元3D生成模型升級至2.5版本；3)海螺AI推出基于單張圖像生成多角度角色圖像功能；4)百度發(fā)布"心響"App整合多智能體協(xié)作；5)Nari Labs開源媲美真人的對話語音模型Dia；6)Grok新增視覺處理和多語言支持；7)Genspark推出AI幻燈片工具；8)Character.AI發(fā)布讓靜態(tài)圖片"說話"的AvatarFX模型；9)pad.ws結(jié)合白板和代碼編輯器；10)OpenBMB開源社區(qū)推出長文本生成模型"卷姬"；11)騰訊推出AI閱讀助手"企鵝讀伴"；12)OpenAI有意收購Chrome瀏覽器；13)字節(jié)跳動調(diào)整AI產(chǎn)品線布局。這些創(chuàng)新展現(xiàn)了AI技術(shù)在自動化、3D生成、語音交互、內(nèi)容創(chuàng)作等領(lǐng)域的快速發(fā)展。

?人工智能 ?AI產(chǎn)品 ?開源平臺
薦UniToken：多模態(tài)AI的“全能選手”，一次編碼搞定圖文理解與圖像生成

復(fù)旦大學(xué)與美團(tuán)研究者提出UniToken框架，首次在統(tǒng)一模型中實現(xiàn)圖文理解與生成任務(wù)的"雙優(yōu)表現(xiàn)"。該方案融合連續(xù)和離散視覺編碼，有效解決了傳統(tǒng)多模態(tài)建模中的"任務(wù)干擾"和"表示割裂"問題。通過三階段訓(xùn)練策略（視覺語義對齊、多任務(wù)聯(lián)合訓(xùn)練、指令強(qiáng)化微調(diào)），UniToken在多個基準(zhǔn)測試中性能超越專用模型。其創(chuàng)新性體現(xiàn)在：1）統(tǒng)一的雙邊視覺編碼

?UniToken ?多模態(tài)建模 ?視覺編碼

熱文

3 天
7天

站長商機(jī)

廣告

商務(wù)合作侵權(quán)投訴廣告服務(wù) 版權(quán)聲明招聘

?CopyRight 2002-2020 CHINAZ.COM

<sup id="rf6qo"><noframes id="rf6qo"></noframes></sup>