中文字幕欧美日韩|日韩性色一区二区三区|精品久久久久久久久久岛国|一区二区国产盗摄精品

    <td id="h1kkc"><tr id="h1kkc"></tr></td><noscript id="h1kkc"><tbody id="h1kkc"></tbody></noscript>
    <rp id="h1kkc"></rp>
    首頁 > 業(yè)界 > 關鍵詞  > 文心大模型最新資訊  > 正文

    AI日報:百度發(fā)布文心大模型學習機;Open-Sora 1.1可生成21秒視頻;Canva可以自動剪輯視頻了;超牛ComfyUI節(jié)點AnyNode來了

    2024-05-28 15:15 · 稿源:站長之家

    歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領域的熱點內(nèi)容,聚焦開發(fā)者,助你洞悉技術趨勢、了解創(chuàng)新AI產(chǎn)品應用。

    新鮮AI產(chǎn)品點擊了解https://top.aibase.com/

    1、百度文心大模型學習機“小度學習機Z30”發(fā)布

    這篇文章介紹了百度旗下的小度科技推出的首款基于文心大模型的學習機Z30,旨在重新定義AI老師,通過先進的AI技術助力孩子主動學習,同時讓家長享受全陪伴的超省心體驗。該學習機擁有出色的視覺體驗和多項先進技術,以及針對多個學習環(huán)節(jié)的全面重構,提供科學、高效的學習方案。AI老師能夠提供豐富的教育內(nèi)容,支持多輪交互和個性化定制,讓學習更加生動有趣和高效有針對性。

    image.png

    【AiBase提要:】

    ?? 小度Z30學習機采用文心大模型技術,逼真還原課文情景,幫助孩子更好地理解和掌握知識。

    ????? 小度Z30支持AI師生互動課和課后個性化練習,量身定制學習計劃,實現(xiàn)全科全學段的隨時答疑。

    ?? AI老師基于文心知識增強的大模型,為孩子提供權威且豐富的教育內(nèi)容,支持多模態(tài)感知和擬人化呈現(xiàn),讓學習更加生動有趣。

    2、Open-Sora 1.1發(fā)布 視頻質(zhì)量提升,生成時長延長至21秒

    Open-Sora1.1發(fā)布帶來了顯著提升,尤其在視頻生成質(zhì)量和時長方面。新版本模型能生成最長約21秒視頻,使用高質(zhì)量視覺數(shù)據(jù)和字幕訓練,提升對世界運作的理解。CausalVideoVAE架構優(yōu)化提高性能和推理效率。

    image.png

    【AiBase提要:】

    ?? 視頻生成質(zhì)量和時長提升: 新版本能生成最長約21秒視頻,通過高質(zhì)量視覺數(shù)據(jù)和字幕訓練,提升對世界運作的理解。

    ?? 高質(zhì)量視覺數(shù)據(jù)和字幕訓練: 使用更高質(zhì)量的視覺數(shù)據(jù)和字幕進行訓練,增強模型對世界運作的理解。

    ?? CausalVideoVAE架構優(yōu)化: 優(yōu)化后的架構提高了視頻生成的性能和推理效率,與Sora基礎模型性能相似。

    詳情鏈接:https://top.aibase.com/tool/open-sora-plan-v1-1-0

    在線體驗地址:https://huggingface.co/spaces/LanguageBind/Open-Sora-Plan-v1.1.0

    3、Canva上線多個好用功能:文本生成插畫、自動剪輯視頻精華片段

    Canva設計平臺最新更新旨在提升專業(yè)團隊和工作空間的吸引力,包括重新設計平臺、推出企業(yè)版、提供AI風格匹配功能等。更新內(nèi)容涵蓋多項功能和改進,使設計工作更高效便捷。

    image.png

    【AiBase提要:】

    ?? Canva推出企業(yè)版,提供更多協(xié)作和安全性控制。

    ?? 新增AI風格匹配功能,定制工作區(qū)顯示文件夾。

    ?? Canva Docs推出建議模式和彩色突出顯示塊,提供編輯建議和強調(diào)文本區(qū)域。

    4、超牛ComfyUI節(jié)點AnyNode來了!要啥功能讓AI幫你編寫

    AnyNode是ComfyUI中一個令人印象深刻的新節(jié)點,利用了大型語言模型(LLMs)的能力,允許用戶通過輸入提示詞來創(chuàng)建具有特定功能的節(jié)點。它為用戶提供了在ComfyUI中進行多樣化操作的工具,極大地擴展了用戶在創(chuàng)建自定義節(jié)點和工作流時的可能性。對于希望實現(xiàn)高級功能和自動化任務的用戶來說,無疑是一個寶貴的資源。

    作者發(fā)布的視頻教程

    【AiBase提要:】

    ?? 功能編寫: 用戶可以根據(jù)要求編寫Python函數(shù),實現(xiàn)任何功能。

    ?? 靈活性: 用戶可以通過提示詞讓LLM幫助編寫不同類型的節(jié)點,如文本總結、顏色通道調(diào)整、Ins濾鏡效果等。

    ?? 與ComfyUI的兼容性: AnyNode作為ComfyUI中的節(jié)點,可以與其他節(jié)點配合使用,鏈接到所需的輸出格式節(jié)點。

    詳情鏈接:https://top.aibase.com/tool/anynode

    5、ChatTTS:一個專為對話場景設計的語音生成模型

    ChatTTS是一個專為對話場景設計的語音生成模型,支持中文和英文,通過大量數(shù)據(jù)訓練,提供高質(zhì)量和自然度的語音合成。項目團隊計劃開源一個基礎模型,注重模型的可控性和安全性。用戶在使用ChatTTS時需注意免責聲明,開源模型將為社區(qū)帶來新的學習和創(chuàng)新機會。

    image.png

    【AiBase提要:】

    ?? 應用場景廣泛:ChatTTS適用于大型語言模型助手的對話任務、對話語音和視頻介紹,提供自然流暢的交互體驗。

    ?? 多語言支持:模型支持中文和英文,跨越語言障礙,服務于更廣泛的用戶群體。

    ?? 開源計劃:團隊計劃開源一個基礎模型,促進學術界和開發(fā)者社區(qū)的研究和開發(fā)。

    詳情鏈接:https://www.bilibili.com/video/BV1zn4y1o7iV/

    項目地址:https://top.aibase.com/tool/chattts

    6、視頻修復項目ProPainter發(fā)布Comfyui節(jié)點

    這篇文章介紹了ComfyUI_ProPainter_Nodes項目,它是一個專門針對視頻修復的解決方案,基于ProPainter框架并實現(xiàn)了ComfyUI界面。該項目提供了高級視頻幀編輯和無縫的視頻修復任務,為視頻編輯和修復領域帶來了強大的工具。

    image.png

    【AiBase提要:】

    ?? 基于ProPainter框架,提供高級視頻幀編輯和無縫的視頻修復任務。

    ?? 提供視頻修復節(jié)點,包括ProPainter節(jié)點和ProPainter Outpainting節(jié)點。

    ?? 提供詳細的安裝說明、工作流程示例和推薦節(jié)點,豐富的輸入?yún)?shù)和節(jié)點參考信息。

    詳情鏈接:https://top.aibase.com/tool/comfyui-propainter-nodes

    7、AI可以生成手語手勢視頻了!SignLLM通過文字描述即可生成手語視頻

    SignLLM是一項創(chuàng)新的多語言手語模型,為聽力障礙者提供了重要的溝通工具,推動了人工智能在語言理解和生成領域的研究。它通過文字描述生成手語視頻,促進信息的無障礙交流。

    image.png

    【AiBase提要:】

    ?? 文本到手語視頻轉(zhuǎn)換:SignLLM模型能將文本轉(zhuǎn)化為手語手勢視頻,直觀易懂。

    ?? 支持多種手語:包括美國手語(ASL)、德國手語(GSL)等八種手語,適用性廣泛。

    ?? 首創(chuàng)多語言手語數(shù)據(jù)集:引入Prompt2Sign數(shù)據(jù)集,對模型訓練和發(fā)展至關重要。

    詳情鏈接:https://top.aibase.com/tool/signllm

    8、降噪黑科技Look Once to Hear!只需看一眼說話的人 除了他以外的聲音就消失了

    這篇文章介紹了一種先進的降噪耳機技術“Look Once to Hear”,通過用戶的視覺輸入來控制聲音的放大或消除。這項技術在嘈雜環(huán)境中提供了專注和便利,讓用戶能夠清晰聽到目標說話者的聲音??赡芙Y合了人工智能、機器學習和聲音處理算法,對聽力障礙者尤其有用。

    image.png

    【AiBase提要:】

    ?? 視覺控制: 用戶只需短暫看向想要聆聽的說話者,耳機便能識別并放大該說話者的聲音。

    ?? 環(huán)境適應性: 適用于嘈雜環(huán)境,幫助用戶在街道、咖啡館等場合中清晰聽到目標說話者的聲音。

    ?? 移動中使用: 即使用戶在移動中,耳機能持續(xù)追蹤并播放目標說話者的語音,提供專注和便利。

    詳情鏈接:https://top.aibase.com/tool/lookoncetohear

    9、Meta被曝使用Instagram等照片訓練AI模型引發(fā)隱私爭議

    這篇文章揭露了Meta利用Instagram和Facebook用戶照片訓練AI模型的隱私爭議。用戶隱私受到嚴重侵犯,數(shù)據(jù)隱私搜集條例被嚴重違反。Meta聲稱用戶可以退出數(shù)據(jù)搜集模式,但之前搜集的數(shù)據(jù)仍可能保存在AI模型中,引發(fā)關注和擔憂。在數(shù)據(jù)隱私和保護方面,企業(yè)應加強合規(guī)措施,確保用戶個人信息得到妥善處理和保護。

    【AiBase提要:】

    ?? Meta使用用戶照片訓練AI模型,違反數(shù)據(jù)隱私搜集條例

    ?? 用戶隱私受到侵犯,引發(fā)廣泛關注

    ? 用戶可以退出數(shù)據(jù)搜集模式,但之前搜集的數(shù)據(jù)仍可能保存在AI模型中

    10、比對口型還牛!InstructAvatar:實現(xiàn)文字生成指定面部的表情和動作

    InstructAvatar 是一項最新的對話形象生成模型,通過文本引導方法實現(xiàn)了對情感和面部動作的細粒度控制,提升了虛擬形象的互動性和泛化能力。該模型在細粒度情感控制、口型同步質(zhì)量和自然性方面優(yōu)于現(xiàn)有方法,能指定面部的表情和動作,為生成具有情感表達的2D虛擬形象帶來了突破性進展。

    image.png

    【AiBase提要:】

    ?? InstructAvatar 實現(xiàn)了對情感和面部動作的細粒度控制,提升了虛擬形象的互動性和泛化能力。

    ?? 實驗結果顯示,InstructAvatar 在細粒度情感控制、口型同步質(zhì)量和自然性方面優(yōu)于現(xiàn)有方法,能指定面部的表情和動作。

    ?? InstructAvatar 的框架包括變分自動編碼器(VAE)和基于擴散模型的動作生成器,通過自然語言界面實現(xiàn)了對生成視頻的細粒度控制。

    詳情鏈接:https://top.aibase.com/tool/instructavatar

    11、馬斯克的 xAI 融資 60 億美元,估值達 240 億美元

    Elon Musk的xAI公司在B輪融資中成功籌集了60億美元,使公司估值達到240億美元。該公司致力于開發(fā)先進的人工智能系統(tǒng),旨在為全人類提供真實、有能力且最大限度有益的AI技術。最新融資將用于推出首個產(chǎn)品、建設先進基礎設施,并加速未來技術的研發(fā)。

    【AiBase提要:】

    ?? xAI公司在B輪融資中籌集了60億美元,估值達240億美元

    ?? 最新融資將用于推出首個產(chǎn)品、建設先進基礎設施,并加速未來技術的研發(fā)

    ?? xAI正在開發(fā)先進的人工智能系統(tǒng),旨在為全人類提供真實、有能力且最大限度有益的AI技術

    12、蘋果的“Greymatter 項目”將是普通用戶在日常中可使用的AI工具

    蘋果將在即將到來的WWDC上展示其最新的人工智能進展,重點放在普通用戶可以在日常生活中使用的AI工具上。新計劃名為“Project Greymatter”,將整合AI工具到主要應用中,并改進操作系統(tǒng)通知功能。蘋果的AI策略是追趕競爭對手,利用用戶基礎和隱私品牌形象繼續(xù)引領市場。

    【AiBase提要:】

    ?? 蘋果將在WWDC展示最新的人工智能進展,專注于普通用戶可用的AI工具。

    ?? 蘋果計劃將AI工具整合到主要應用中,改進操作系統(tǒng)通知功能。

    ?? 蘋果與OpenAI合作開發(fā)聊天機器人,但不會在WWDC展示,而是作為插件顯示在iOS18中。

    舉報

    • 相關推薦
    • AI日報百度大招!發(fā)布文心大模型X1Turbo和AI開放計劃;OpenAI免費開放輕量版Deep Research;即夢視頻3.0內(nèi)測

      【AI日報】主要報道了AI領域的最新動態(tài):1)百度發(fā)布文心大模型X1Turbo和4.5Turbo,性能價格優(yōu)勢顯著;2)百度推出AI開放計劃,降低開發(fā)者門檻;3)OpenAI免費開放輕量版Deep Research研究工具;4)即夢視頻3.0內(nèi)測展示流暢運鏡和精準表情捕捉能力;5)百度發(fā)布全球首個內(nèi)容操作系統(tǒng)"滄舟OS";6)百度文庫與網(wǎng)盤聯(lián)合推出GenFlow超能搭子和AI筆記工具;7)Pixverse推出MCP協(xié)議簡化AI視頻創(chuàng)作;8)Tavus發(fā)布突破性唇形同步模型Hummingbird-0;9)豆包1.5深度思考模型上線,提供免費額度;10)Adobe整合OpenAI和Google模型升級Firefly創(chuàng)意平臺;11)ImageSlider2.0即將加入Gradio核心產(chǎn)品線;12)李彥宏談DeepSeek現(xiàn)存痛點,強調(diào)多模態(tài)能力與降本需求。

    • AI日報百度文心4.5 Turbo將于4月25日發(fā)布;谷歌推全新智能體開放協(xié)議A2A;視頻號整治不當使用AI工具直播行為

      歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領域的熱點內(nèi)容,聚焦開發(fā)者,助你洞悉技術趨勢、了解創(chuàng)新AI產(chǎn)品應用。新鮮AI產(chǎn)品點擊了解:https://top.aibase.com/1、百度官宣:文心大模型4.5Turbo將于4月25日發(fā)布百度宣布將在4月25日的Create大會上發(fā)布文心大模型4.5Turbo,盡管具體細節(jié)尚未披露,但業(yè)界對此充滿期待。雖然試用期間無需綁定信用卡,但實際使用需購買托管計劃。

    • 百度發(fā)布AI開放計劃:零門檻接入、億級流量扶持、開放MCP廣場

      4月25日,百度搜索開放平臺推出AI開放計劃,免費開放數(shù)億流量,為開發(fā)者提供AI應用精準連接用戶的渠道。該計劃提供兩種接入方案:AI應用和MCP Server。百度還提供豐厚開發(fā)者扶持政策,開發(fā)者可注冊加入。該計劃實現(xiàn)開發(fā)者與用戶"雙向奔赴",既為用戶創(chuàng)造"即搜即得"體驗,又為開發(fā)者搭建快速分發(fā)通道。接入案例顯示,ProcessOn接入后單日訪問量激增一倍。百?

    • AI日報:騰訊混元3D生成模型2.5版本發(fā)布;海螺推出圖像人物參考功能;百度上線移動端超級智能體心響App

      本文介紹了多款AI領域的新產(chǎn)品和技術進展:1)Kortix-AI推出開源通用AI智能體平臺Suna;2)騰訊混元3D生成模型升級至2.5版本;3)海螺AI推出基于單張圖像生成多角度角色圖像功能;4)百度發(fā)布"心響"App整合多智能體協(xié)作;5)Nari Labs開源媲美真人的對話語音模型Dia;6)Grok新增視覺處理和多語言支持;7)Genspark推出AI幻燈片工具;8)Character.AI發(fā)布讓靜態(tài)圖片"說話"的AvatarFX模型;9)pad.ws結合白板和代碼編輯器;10)OpenBMB開源社區(qū)推出長文本生成模型"卷姬";11)騰訊推出AI閱讀助手"企鵝讀伴";12)OpenAI有意收購Chrome瀏覽器;13)字節(jié)跳動調(diào)整AI產(chǎn)品線布局。這些創(chuàng)新展現(xiàn)了AI技術在自動化、3D生成、語音交互、內(nèi)容創(chuàng)作等領域的快速發(fā)展。

    • 全球首個!百度發(fā)布內(nèi)容操作系統(tǒng)滄舟OS 讓AI無所不能

      百度在Create2025開發(fā)者大會上推出全球首個內(nèi)容領域操作系統(tǒng)"滄浪OS"。該系統(tǒng)支持全模態(tài)內(nèi)容輸入輸出、多智能體調(diào)用,適配MCP協(xié)議,突破場景和入口限制,實現(xiàn)端到端交付。滄浪OS整合百度文庫、網(wǎng)盤等產(chǎn)品線的AI業(yè)務框架,包含數(shù)百個經(jīng)過驗證的Agent工具,支持跨模態(tài)、跨格式的內(nèi)容理解。系統(tǒng)打通百度文庫、學術數(shù)據(jù)庫及全網(wǎng)公開內(nèi)容,同時支持用戶授權的本地或網(wǎng)盤私有內(nèi)容。目前滄浪OS已全面擁抱MCP生態(tài),通過標準化協(xié)議對外開放核心能力,降低接入門檻,推動AI應用普及。

    • AI日報:智譜開源32B/9B系列GLM模型并啟用Z.ai域名;OpenAI發(fā)布GPT-4.1系列模型;阿里魔搭上線MCP廣場

      歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領域的熱點內(nèi)容,聚焦開發(fā)者,助你洞悉技術趨勢、了解創(chuàng)新AI產(chǎn)品應用。新鮮AI產(chǎn)品點擊了解:https://top.aibase.com/1、智譜AI啟用全新域名Z.ai 并開源32B/9B 系列 GLM 模型智譜技術團隊近期宣布開源32B和9B系列的GLM模型,并推出全新交互體驗平臺Z.ai。這些模型遵循MIT許可協(xié)議,支持商業(yè)用途,提升了

    • AI日報: OpenAI推出gpt-image-1圖像生成API;納米AI發(fā)布MCP萬能工具箱;中國占全球AI專利60%

      【AI日報】欄目聚焦人工智能領域最新動態(tài):1) OpenAI推出ChatGPT圖像生成API,開發(fā)者可輕松集成AI繪圖功能,已生成超7億張圖片;2) 谷歌Gemini月活用戶突破3.5億,但仍落后于ChatGPT的6億用戶;3) OpenAI預測2029年收入將達1250億美元,AI代理業(yè)務成主要增長點;4) Ostris發(fā)布8B參數(shù)擴散模型Flex.2-preview,優(yōu)化ComfyUI工作流;5) 英偉達推出多模態(tài)LLM模型Describe Anything,支持指定區(qū)域生成詳細描?

    • AI日報:OpenAI下周或發(fā)布GPT-4.1系列;Pika全新AI視頻功能Twists;商湯科技日日新V6震撼發(fā)布

      歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領域的熱點內(nèi)容,聚焦開發(fā)者,助你洞悉技術趨勢、了解創(chuàng)新AI產(chǎn)品應用。新鮮AI產(chǎn)品點擊了解:https://top.aibase.com/1、報道稱OpenAI下周重磅發(fā)布GPT-4.1系列,包含Mini版和Nano版OpenAI即將發(fā)布GPT-4.1系列及o3系列,標志著其在多模態(tài)和推理能力上的重大進展。新加坡在AI技能學習上投入的時間顯著高于其他亞太國家,顯示出其在AI人才培養(yǎng)方面的競爭力。

    • AI日報:小米首個推理大模型開源Xiaomi MiMo;快手上線AI筆記工具“喵記多”;騰訊拆分AI團隊

      本文匯總了AI領域最新動態(tài):1)小米開源70億參數(shù)大模型Xiaomi MiMo,在數(shù)學推理和代碼競賽中超越OpenAI和阿里模型;2)快手推出AI筆記工具"喵記多",簡化筆記管理;3)Luma AI發(fā)布電影級鏡頭控制API,降低視頻生成門檻;4)騰訊重組AI團隊,加大語言模型研發(fā)投入;5)Anthropic為Claude引入新語音"Glassy";6)谷歌NotebookLM新增50+語言音頻概述功能;7)xAI將發(fā)布Grok3.5模型;8)Meta推出獨立AI助手應用挑戰(zhàn)ChatGPT;9)OpenAI緊急修復GPT-4o"諂媚"問題;10)Mac本地AI助手Simular升級隱私保護;11)CameraBench項目幫助AI理解鏡頭運動;12)谷歌推出個性化語言學習AI工具。

    • 第十二屆百度獎學金揭曉:半數(shù)攻堅大模型,AI解鎖醫(yī)療、交通新場景

      4月25日,第十二屆百度獎學金頒獎典禮在武漢舉行的"Create 2025百度AI開發(fā)者大會"上舉行。10位來自全球頂尖高校的青年學者獲獎,每人獲20萬元科研資金。獲獎者研究方向涵蓋大模型、多模態(tài)學習、醫(yī)療AI等前沿領域,超半數(shù)聚焦大模型技術創(chuàng)新應用。百度CTO王海峰勉勵青年人才共同奔赴智能時代。該獎學金自2013年設立以來已累計支持116名全球頂尖學子,提供獎金超千萬元。除資金支持外,百度還通過實習、項目合作等方式搭建產(chǎn)學研聯(lián)動平臺,持續(xù)推動AI技術生態(tài)繁榮。