中文字幕欧美日韩|日韩性色一区二区三区|精品久久久久久久久久岛国|一区二区国产盗摄精品

    <td id="h1kkc"><tr id="h1kkc"></tr></td><noscript id="h1kkc"><tbody id="h1kkc"></tbody></noscript>
    <rp id="h1kkc"></rp>
    首頁 > 業(yè)界 > 關(guān)鍵詞  > CRM最新資訊  > 正文

    CRM:上傳圖片生成3D模型,10秒搞定

    2024-03-12 11:42 · 稿源: 站長之家

    劃重點(diǎn):

    1. ??Convolutional Reconstruction Model(CRM)是一種高保真度的前饋單圖像到3D生成模型,充分考慮了稀疏3D數(shù)據(jù)的限制,強(qiáng)調(diào)了在網(wǎng)絡(luò)設(shè)計中整合幾何先驗的必要性。

    2. ???CRM通過生成六個正交視圖圖像,經(jīng)過卷積U-Net處理,利用其強(qiáng)大的像素級對齊能力和顯著的帶寬,創(chuàng)建了高分辨率的三平面

    3. ?? 模型在僅10秒內(nèi)從圖像中生成高保真紋理網(wǎng)格,無需任何測試時優(yōu)化。

    站長之家(ChinaZ.com) 3月12日 消息:近期,清華大學(xué)的研究團(tuán)隊在圖像處理領(lǐng)域取得了重要進(jìn)展,他們提出了一種名為Convolutional Reconstruction Model(CRM)的前饋式單圖像到3D紋理網(wǎng)格生成模型。與傳統(tǒng)的大型重建模型(LRM)相比,CRM在生成速度上表現(xiàn)出色,同時克服了基于Transformer的方法在幾何先驗方面存在的不足。

    3D.png

    傳統(tǒng)的3D生成模型雖然在生成速度上有所突破,但由于Transformer方法未充分利用三平面組件的幾何先驗,導(dǎo)致在有限的3D數(shù)據(jù)和緩慢的訓(xùn)練情況下質(zhì)量不佳。為了解決這一問題,研究團(tuán)隊提出了CRM,一個高保真度的前饋式單圖像到3D生成模型。

    CRM的關(guān)鍵觀察是,三平面的可視化呈現(xiàn)出六個正交圖像的空間對應(yīng)關(guān)系。模型首先從單個輸入圖像生成六個正交視圖圖像,然后將這些圖像輸入卷積U-Net進(jìn)行處理,利用其強(qiáng)大的像素級對齊能力和顯著的帶寬,創(chuàng)建高分辨率的三平面。與此同時,CRM采用Flexicubes作為幾何表示,實現(xiàn)對紋理網(wǎng)格的直接端到端優(yōu)化。

    整個推理過程僅需要在A800GPU上花費(fèi)約10秒的時間,其中包括U-Net的前向傳播(不到0.1秒)、查詢表面點(diǎn)的UV紋理和文件I/O。與傳統(tǒng)方法相比,CRM從圖像中僅需短短的時間就能生成高保真度的紋理網(wǎng)格,無需在測試時進(jìn)行任何優(yōu)化。

    image.png

    圖中,展示了整個方法的流程。輸入圖像首先經(jīng)過多視圖圖像擴(kuò)散模型,生成六個正交圖像。然后,另一個擴(kuò)散模型用于生成基于這六個圖像的CCMs(conditional convolutional masks)。最后,這六個圖像和CCMs一起輸入CRM,重建最終的紋理網(wǎng)格。

    研究團(tuán)隊通過生成的紋理網(wǎng)格展示了CRM的性能,包括玫瑰、青蛙、大象、哆啦A夢、貓和校車等互動網(wǎng)格。同時,CRM還展示了其在創(chuàng)建類似樂高風(fēng)格的對象方面的潛力。

    image.png

    在與現(xiàn)有方法的比較中,CRM展現(xiàn)出了卓越的性能和效率。研究團(tuán)隊通過BibTeX引用了他們的工作,這表明了對該模型的高度認(rèn)可。

    這一項研究為單圖像到3D紋理網(wǎng)格的生成提供了一種新的前饋式模型,具有卓越的速度和質(zhì)量,為圖像處理領(lǐng)域帶來了新的可能性。

    項目入口:https://top.aibase.com/tool/crm

    舉報

    • 相關(guān)推薦
    • 阿里開源通義新模型:指定首尾圖片生成視頻

      快科技4月18日消息,據(jù)報道,阿里巴巴旗下通義萬相宣布開源其創(chuàng)新視頻生成技術(shù)首尾幀生視頻14B模型。這項突破性AI技術(shù)能夠根據(jù)用戶提供的起始和結(jié)束畫面,智能生成720p高清過渡視頻,為視頻創(chuàng)作帶來全新可能。該模型通過先進(jìn)的深度學(xué)習(xí)算法,能夠精準(zhǔn)理解輸入畫面的內(nèi)容、風(fēng)格及主題特征。當(dāng)用戶提供首尾兩幀圖像后,模型會智能分析畫面中的視覺元素,包括物體形?

    • 日銷破千元!AI生成3D掛件,被我們賣爆了

      先說結(jié)論:我們花15天做的AI3D掛件,在線下賣爆了,單日營收破千元!故事的開始,是因為我們發(fā)現(xiàn)把AI3D打印手辦做成一門小生意的可行性越來越高,這也激發(fā)了我們的“搞錢基因”。再加上前不久新榜在上海舉辦了「新榜內(nèi)容節(jié)」,一拍即合,我們于是做了一批模型去大會現(xiàn)場擺攤試水!最后結(jié)果還不錯,單日最高收入突破1000元,是我們“創(chuàng)業(yè)史”上的一個高光表現(xiàn)。歡迎大家

    • CRM和SCRM有哪些區(qū)別?企業(yè)如何選擇?功能對比+選型建議一文說清!AI趨勢下企業(yè)如何提升營銷服效率?

      文章探討了CRM與SCRM系統(tǒng)的區(qū)別及企業(yè)選擇策略。CRM側(cè)重客戶信息管理和銷售流程優(yōu)化,適用于業(yè)務(wù)簡單的企業(yè);SCRM整合社交媒體數(shù)據(jù),更適合需要深度客戶洞察和長決策周期的大型企業(yè)。在AI時代,SCRM能更全面收集數(shù)據(jù),賦能精準(zhǔn)營銷。建議企業(yè)根據(jù)業(yè)務(wù)規(guī)模、客戶決策周期等因素選擇系統(tǒng),已使用CRM的企業(yè)若面臨轉(zhuǎn)化率低等問題可考慮遷移至SCRM。塵鋒SCRM作為行業(yè)解決方案,結(jié)合AI能力可實現(xiàn)獲客、轉(zhuǎn)化、運(yùn)營全流程數(shù)字化管理,提升業(yè)務(wù)效率。

    • ChatGPT上線庫功能:可管理AI生成圖片

      快科技4月16日消息,據(jù)報道,OpenAI近日宣布將為ChatGPT推出全新的Image Library圖庫功能,該功能將幫助用戶更高效地管理和查看AI生成的圖像。這項創(chuàng)新功能將逐步向所有用戶開放,包括移動端和網(wǎng)頁端的免費(fèi)版、Plus版及Pro版用戶。新功能的設(shè)計充分考慮了用戶體驗的便捷性。用戶只需點(diǎn)擊ChatGPT側(cè)邊欄的Library入口,就能進(jìn)入一個直觀的圖像網(wǎng)格界面。在這個界面中,用戶可以輕?

    • 1至5元不等!有人開始售賣ChatGPT生成的“吉卜力風(fēng)格”圖片

      SNS上出現(xiàn)了售賣吉卜力風(fēng)格圖片的“交易”,一些二手交易平臺上聲稱收到錢后就會幫忙制作吉卜力風(fēng)格圖片的帖子也層出不窮。吉卜力風(fēng)格的圖片轉(zhuǎn)化功能在全球備受歡迎,近一周時間,通過ChatGPT制作的相關(guān)圖片數(shù)量就超過了7億張。想想他們?yōu)榱舜蛟炷撤N獨(dú)特風(fēng)格所付出的努力,如今卻遭遇這種無法受到著作權(quán)法保護(hù)的情況,無疑會極大地打擊創(chuàng)作者們的積極性。

    • 10倍精度升級!騰訊混元3D模型v2.5版本發(fā)布

      騰訊混元3D模型升級至v2.5版本,建模精度和貼圖真實度顯著提升。新版本參數(shù)體量從1B增至10B,有效面片數(shù)增加超10倍,支持1024幾何分辨率。紋理系統(tǒng)支持4K高清貼圖和凹凸細(xì)節(jié),率先支持多視圖生成PBR模型。針對動畫場景優(yōu)化骨骼蒙皮系統(tǒng),支持非標(biāo)準(zhǔn)姿態(tài)自動綁定。新增文生/圖生3D減面模型、多視圖建模模板等專業(yè)工作流?;煸?D v2.5已全面更新至騰訊AI創(chuàng)作引擎,免費(fèi)生成額度提升至每日20次,并正式上線騰訊云API面向企業(yè)開放。GitHub開源版本累計Star超1.2萬。

    • 銷售易亮相騰訊云城市峰會成都站,CRM智慧賦能制造業(yè)突破增長邊界

      4月18日,騰訊云城市峰會在成都圓滿收官。銷售易再度亮相峰會,展示AI CRM技術(shù)應(yīng)用及智能制造行業(yè)解決方案。騰訊集團(tuán)副總裁李強(qiáng)以"乘云起勢,為增長提速"為主題致辭,指出當(dāng)前全球格局處于大變局時代,騰訊依托"智能驅(qū)動、全球布局、自主創(chuàng)新"三大戰(zhàn)略引擎,助力企業(yè)打造核心競爭力。銷售易與騰訊云深度協(xié)同,基于騰訊混元大模型+DeepSeek開源模型打造中國首款A(yù)I CRM——NeoAgent,覆蓋客戶旅程管理、智能辦公協(xié)同等關(guān)鍵場景,已服務(wù)施耐德電氣、伊頓公司等500強(qiáng)企業(yè)。雙方通過技術(shù)互補(bǔ)與價值共創(chuàng),持續(xù)輸出可復(fù)制的數(shù)字化增長路徑,推動CRM系統(tǒng)向智能決策中樞進(jìn)化。

    • 谷歌Gemini整合Veo 2視頻生成模型,8720P視頻輕松搞定

      谷歌宣布又有一款 AI 模型將加入 Gemini,但這次它不僅僅是一個聊天機(jī)器人。

    • AI日報:騰訊混元3D生成模型2.5版本發(fā)布;海螺推出像人物參考功能;百度上線移動端超級智能體心響App

      本文介紹了多款A(yù)I領(lǐng)域的新產(chǎn)品和技術(shù)進(jìn)展:1)Kortix-AI推出開源通用AI智能體平臺Suna;2)騰訊混元3D生成模型升級至2.5版本;3)海螺AI推出基于單張圖像生成多角度角色圖像功能;4)百度發(fā)布"心響"App整合多智能體協(xié)作;5)Nari Labs開源媲美真人的對話語音模型Dia;6)Grok新增視覺處理和多語言支持;7)Genspark推出AI幻燈片工具;8)Character.AI發(fā)布讓靜態(tài)圖片"說話"的AvatarFX模型;9)pad.ws結(jié)合白板和代碼編輯器;10)OpenBMB開源社區(qū)推出長文本生成模型"卷姬";11)騰訊推出AI閱讀助手"企鵝讀伴";12)OpenAI有意收購Chrome瀏覽器;13)字節(jié)跳動調(diào)整AI產(chǎn)品線布局。這些創(chuàng)新展現(xiàn)了AI技術(shù)在自動化、3D生成、語音交互、內(nèi)容創(chuàng)作等領(lǐng)域的快速發(fā)展。

    • UniToken:多模態(tài)AI的“全能選手”,一次編碼搞定文理解與圖像生成

      復(fù)旦大學(xué)與美團(tuán)研究者提出UniToken框架,首次在統(tǒng)一模型中實現(xiàn)圖文理解與生成任務(wù)的"雙優(yōu)表現(xiàn)"。該方案融合連續(xù)和離散視覺編碼,有效解決了傳統(tǒng)多模態(tài)建模中的"任務(wù)干擾"和"表示割裂"問題。通過三階段訓(xùn)練策略(視覺語義對齊、多任務(wù)聯(lián)合訓(xùn)練、指令強(qiáng)化微調(diào)),UniToken在多個基準(zhǔn)測試中性能超越專用模型。其創(chuàng)新性體現(xiàn)在:1)統(tǒng)一的雙邊視覺編碼

    熱文

    • 3 天
    • 7天