站長(zhǎng)之家(ChinaZ.com)9月21日 消息:9月20日,生數(shù)科技發(fā)布了自主研發(fā)的多模態(tài)通用大模型,并同時(shí)推出了兩款應(yīng)用產(chǎn)品:視覺(jué)創(chuàng)意設(shè)計(jì)平臺(tái) PixWeaver 和3D 資產(chǎn)創(chuàng)建工具 VoxCraft。
生數(shù)科技的多模態(tài)通用大模型采用底層融合的思路,將 Transformer 架構(gòu)引入擴(kuò)散模型,實(shí)現(xiàn)文本、圖像、3D、視頻等多模態(tài)知識(shí)的融合。該大模型具備語(yǔ)義理解強(qiáng)、訓(xùn)練速度快、可控性突出和兼容性出色的優(yōu)點(diǎn),基于自研的分布式架構(gòu),訓(xùn)練速度快、通信消耗低,研發(fā)效率提高。
經(jīng)過(guò)多次迭代,大模型在圖像生成、3D 模型生成和視頻編輯等任務(wù)中展現(xiàn)出領(lǐng)先效果。圖像生成支持中文語(yǔ)義理解,畫(huà)面細(xì)節(jié)豐富;3D 模型生成在分辨率和多樣性方面表現(xiàn)出色;視頻生成支持逐幀級(jí)的元素編輯和風(fēng)格遷移。
基于大模型的能力,生數(shù)科技推出了兩款應(yīng)用產(chǎn)品。PixWeaver 是一款視覺(jué)創(chuàng)意設(shè)計(jì)平臺(tái),支持根據(jù)文字描述生成多種風(fēng)格圖像,具備通用性強(qiáng)、中文理解準(zhǔn)確和畫(huà)面細(xì)節(jié)豐富的特點(diǎn)。VoxCraft 是一款支持快速創(chuàng)建3D 圖像的工具,通過(guò)輸入文本描述或上傳2D 圖像,可以高效自動(dòng)化生成多元3D 資產(chǎn)。
此外,生數(shù)科技的大模型還面向游戲制作、影視制作、廣告營(yíng)銷(xiāo)等多個(gè)行業(yè)提供服務(wù)能力,支持各類(lèi)創(chuàng)意內(nèi)容的生成。
體驗(yàn)地址:https://pw.shengshu-ai.com/
(舉報(bào))