中文字幕欧美日韩|日韩性色一区二区三区|精品久久久久久久久久岛国|一区二区国产盗摄精品

    <td id="h1kkc"><tr id="h1kkc"></tr></td><noscript id="h1kkc"><tbody id="h1kkc"></tbody></noscript>
    <rp id="h1kkc"></rp>
    首頁 > 業(yè)界 > 關(guān)鍵詞  > 正文

    AI日報:當前國產(chǎn)Sora大模型Vidu發(fā)布;Kimi Chat移動端升級;通義千問開源首個千億參數(shù)模型;蘋果計劃與 OpenAI 合作

    2024-04-28 15:08 · 稿源:站長之家

    歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點內(nèi)容,聚焦開發(fā)者,助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應(yīng)用。

    新鮮AI產(chǎn)品點擊了解https://top.aibase.com/

    1、清華團隊發(fā)布視頻大模型Vidu 可生成16 秒、1080P 視頻

    清華大學(xué)與生數(shù)科技在中關(guān)村論壇未來人工智能先鋒論壇上發(fā)布了中國首個長時長、高一致性、高動態(tài)性視頻大模型Vidu,標志著中國在視頻生成技術(shù)領(lǐng)域取得重要進展。該模型采用創(chuàng)新性的U-ViT架構(gòu),能一鍵生成高清視頻內(nèi)容,具備高時空一致性和豐富的想象力。

    image.png

    【AiBase提要:】

    ?? Vidu是中國首個長時長、高一致性、高動態(tài)性視頻大模型

    ?? 融合Diffusion與Transformer技術(shù),能一鍵生成長達 16 秒、1080P的高清視頻內(nèi)容。

    ?? 不僅能模擬真實物理世界,還具備豐富的想象力,支持多鏡頭生成

    產(chǎn)品入口:https://top.aibase.com/tool/vidu

    2、通義千問團隊開源首個千億參數(shù)模型Qwen1.5-110B

    通義千問團隊開源的首個千億參數(shù)模型Qwen1.5-110B在基礎(chǔ)能力和Chat評估中表現(xiàn)出色,展示了模型規(guī)模擴展對性能提升的重要意義。該模型采用Transformer解碼器架構(gòu),支持多種語言,具有高效的分組查詢注意力機制。Qwen1.5-110B是通義千問系列中規(guī)模最大的模型,擁有超過1000億參數(shù),在與SOTA模型的比較中表現(xiàn)出色。團隊將繼續(xù)探索模型規(guī)模提升和擴展預(yù)訓(xùn)練數(shù)據(jù)規(guī)模的優(yōu)勢。

    【AiBase提要:】

    ?? Qwen1.5-110B是首個擁有超過1000億參數(shù)的模型,在Chat評估中表現(xiàn)更好,展示了更大規(guī)模模型的潛力。

    ?? 110B模型的性能提升主要來自于增加的模型規(guī)模,而訓(xùn)練方法并未大幅改變,表明模型規(guī)模擴展對性能提升具有重要意義。

    ?? Qwen1.5-110B采用Transformer解碼器架構(gòu),支持多種語言,具有高效的分組查詢注意力機制,展示了在模型大小擴展方面仍有提升空間。

    模型鏈接:https://top.aibase.com/tool/qwen1-5-110b

    3、Kimi Chat移動端UI大幅重構(gòu)

    Kimi Chat移動端應(yīng)用迎來了重要的更新,版本1.2.1對用戶界面進行了全面的重構(gòu),引入了“月之亮面”淺色模式,提供更加舒適和直觀的用戶體驗。更新包括界面改進、性能優(yōu)化、內(nèi)存管理、電池效率、功能增強、安全性提升、兼容性改進、錯誤修復(fù)、本地化支持和輔助功能。用戶只需更新至最新版本1.2.1即可體驗新功能。

    image.png

    【AiBase提要:】

    ?? 界面改進: 界面重新設(shè)計,美觀易用,操作更直觀。

    ? 性能優(yōu)化: 提升響應(yīng)速度和流暢度,減少卡頓和延遲。

    ?? 安全性提升: 增強應(yīng)用安全性,保護用戶數(shù)據(jù)和隱私。

    詳情鏈接:https://top.aibase.com/tool/kimi-chat

    4、Domo AI新增樂高、美國漫畫等4個風(fēng)格 新用戶可免費試用15個點數(shù)

    DomoAI最近新增了樂高風(fēng)格、美國漫畫風(fēng)格、彩筆風(fēng)格、像素藝術(shù)四個新風(fēng)格,并且為慶祝其推特賬號粉絲超過1萬,新用戶可免費試用15個點數(shù)。此前,DomoAI推出了視頻色度摳圖功能,用戶可以將扣出的人物合成到新背景中。用戶還可以輕松自定義后臺背景顏色,制作跳舞視頻等功能。

    image.png

    【AiBase提要:】

    ?? DomoAI新增了樂高風(fēng)格、美國漫畫風(fēng)格、彩筆風(fēng)格、像素藝術(shù)四個新風(fēng)格

    ?? 新用戶可免費試用15個點數(shù)

    ?? 用戶可以使用 /move 命令將靜態(tài)照片變成動態(tài)視頻

    詳情鏈接:https://top.aibase.com/tool/domoai

    5、蘋果計劃與 OpenAI 合作,加強 iPhone 人工智能功能

    蘋果尋求與 OpenAI 合作,以提升 iPhone 的人工智能功能。前任機器學(xué)習(xí)總監(jiān)離職后,蘋果人工智能發(fā)展步履維艱。蘋果可能在全球開發(fā)者大會前推出新的生成式人工智能產(chǎn)品。

    【AiBase提要:】

    ?? 蘋果尋求與 OpenAI 合作,提升 iPhone 的人工智能功能。

    ?? 前任機器學(xué)習(xí)總監(jiān)離職后,蘋果人工智能發(fā)展步履維艱。

    ?? 蘋果可能在全球開發(fā)者大會前推出新的生成式人工智能產(chǎn)品。

    6、谷歌推出 AI 英語對話練習(xí)功能

    谷歌最近推出了AI語音對話練習(xí)功能,讓用戶可以通過手機與對話機器人進行英語會話練習(xí)。雖然功能目前僅限于部分國家使用,但谷歌可能會將其擴展到更多國家。文章介紹了谷歌的語言學(xué)習(xí)工具提供的對話練習(xí)和反饋功能,以及其在AI輔助語言學(xué)習(xí)領(lǐng)域的發(fā)展。

    image.png

    【AiBase提要:】

    ??? 谷歌推出AI語音對話練習(xí)功能,讓用戶通過手機與對話機器人進行英語會話練習(xí)。

    ?? 目前功能僅限于部分國家使用,但可能會擴展到更多國家。

    ?? 雖然缺乏像Duolingo等應(yīng)用的課程設(shè)置,但提供了對話練習(xí)和反饋功能。

    7、元象開源首個多模態(tài)大模型XVERSE-V

    作為元象公司發(fā)布的首個多模態(tài)大型模型,XVERSE-V在多個權(quán)威評測中表現(xiàn)優(yōu)異,綜合能力出色。該模型融合整體和局部信息的策略,提高了圖像識別和分析的準確性和全面性。除了圖像識別,XVERSE-V在信息圖理解、視障場景處理、文本生成、教育解題等實際應(yīng)用中也表現(xiàn)突出。

    image.png

    【AiBase提要:】

    ?? XVERSE-V是首個多模態(tài)大型模型,支持任意寬高比的圖像輸入

    ?? 該模型在綜合能力上表現(xiàn)出色,取得優(yōu)異成績

    ?? XVERSE-V采用融合整體和局部信息的策略,提高圖像識別和分析的準確性和全面性

    詳情鏈接:https://huggingface.co/xverse/XVERSE-V-13BModelScope

    8、Perplexica:開源AI驅(qū)動的問答搜索引擎

    Perplexica是一個開源的AI驅(qū)動搜索引擎,提供多種搜索模式,旨在為用戶提供更精準、更智能的搜索體驗。它具有先進的機器學(xué)習(xí)算法,確保用戶隱私和提供最新的搜索結(jié)果。Perplexica致力于成為全面、高效的搜索解決方案。

    image.png

    【AiBase提要:】

    ?? 提供多種搜索模式,根據(jù)用戶需求調(diào)整搜索算法,以獲得更相關(guān)的搜索結(jié)果。

    ?? 使用先進的機器學(xué)習(xí)算法來精細化搜索結(jié)果,包括相似性搜索和嵌入技術(shù)。

    ?? 確保隱私保護,使用SearxNG作為當前性保障,避免每日數(shù)據(jù)更新的開銷。

    詳情鏈接:https://top.aibase.com/tool/perplexica

    9、Meta 推出 LayerSkip:提升大語言模型推理速度

    Meta公司最新發(fā)布的LayerSkip技術(shù)旨在提升大型語言模型的推理速度,通過優(yōu)化推理過程,減少計算資源消耗,保持模型性能。這對實時需求高的應(yīng)用場景具有重要意義,反映了Meta在AI模型效率方面的持續(xù)投入和創(chuàng)新。LayerSkip技術(shù)的未來展望將為大語言模型的部署和使用帶來更多可能性,特別是在需要快速處理大量語言數(shù)據(jù)的場合。

    【AiBase提要:】

    ?? LayerSkip在CNN/DM文檔摘要任務(wù)中將推理速度提升了2.16倍,顯著提高了文檔處理效率。

    ? LayerSkip在編程任務(wù)中實現(xiàn)了1.82倍的速度提升,可能優(yōu)化編程輔助工具的性能。

    ?? LayerSkip在TOPv2語義解析任務(wù)上推理速度提升達到了2.0倍,對語義解析等自然語言處理任務(wù)有重要影響。

    論文:https://huggingface.co/papers/2404.16710

    10、調(diào)查顯示:1/3的翻譯者和1/4的插畫師已經(jīng)因AI失去了工作

    AI技術(shù)的快速發(fā)展對創(chuàng)意產(chǎn)業(yè)造成深遠影響,英國作家協(xié)會的調(diào)查揭示了AI對作家、翻譯者、插畫師等職業(yè)的影響,引發(fā)了行業(yè)內(nèi)的擔(dān)憂和呼吁。

    【AiBase提要:】

    ?? 約五分之一的創(chuàng)作者在工作中使用過生成性AI,AI技術(shù)已經(jīng)開始滲透到各個創(chuàng)作領(lǐng)域。

    ?? 1/4的插畫師和1/3的翻譯者因生成性AI失去了工作,工作機會受到直接威脅。

    ?? 大多數(shù)小說家和非小說類作家擔(dān)心AI技術(shù)將對未來創(chuàng)意工作收入產(chǎn)生負面影響,強烈呼吁獲得版權(quán)保護和政府監(jiān)管。

    11、WebLlama:基于Llama-3-8B的智能網(wǎng)頁瀏覽代理

    WebLlama是一款基于Llama-3-8B模型的智能代理工具,通過對話與用戶互動,執(zhí)行網(wǎng)頁瀏覽相關(guān)任務(wù)。它能處理連續(xù)對話,理解用戶指令,自動完成網(wǎng)上搜索、導(dǎo)航和信息檢索等操作。WebLlama展示了強大的對話處理能力和網(wǎng)頁交互功能,提高用戶獲取信息效率,減少手動操作需求。在專業(yè)基準測試中表現(xiàn)優(yōu)異,具有先進性和實用性,有望在自動化網(wǎng)頁瀏覽和信息收集方面發(fā)揮更大作用。

    【AiBase提要:】

    ??? 對話理解: 能聽取用戶指令,與用戶交互。

    ?? 自動網(wǎng)頁瀏覽: 執(zhí)行搜索、導(dǎo)航,幫助用戶獲取信息。

    ?? 完成復(fù)雜任務(wù): 能預(yù)定酒店、購物或查找信息等實際應(yīng)用任務(wù)。

    詳情鏈接:https://top.aibase.com/tool/webllama

    12、Mutable AI發(fā)布Auto Wiki v2:將代碼轉(zhuǎn)換為類似于維基百科風(fēng)格的文章

    Mutable AI推出的Auto Wiki v2是一款革命性的工具,能夠自動將代碼轉(zhuǎn)化為維基百科風(fēng)格的文章,解決了代碼文檔化難題。這一創(chuàng)新解決方案提供了清晰描述的代碼文檔,可視化理解代碼,提升開發(fā)效率。

    image.png

    【AiBase提要:】

    ?? 自動將代碼轉(zhuǎn)化為維基百科風(fēng)格文章,解決代碼文檔化難題。

    ?? 自動生成清晰描述的代碼文檔,可視化理解代碼。

    ?? 提供代碼圖表、自動更新文檔等多項功能,提升開發(fā)效率。

    詳情鏈接:https://top.aibase.com/tool/mutable

    13、Cog-Become-Image:將任意人物圖像轉(zhuǎn)換成指定風(fēng)格的圖

    Cog-Become-Image項目是一個創(chuàng)新的圖像轉(zhuǎn)換工具,可以將任意人物的面部圖像轉(zhuǎn)換成另一種風(fēng)格的圖片。該項目在藝術(shù)創(chuàng)作、媒體制作和娛樂行業(yè)有廣泛的應(yīng)用前景,為圖像轉(zhuǎn)換領(lǐng)域帶來新的可能。無論是專業(yè)開發(fā)者還是技術(shù)愛好者,都可以利用這個項目來實現(xiàn)創(chuàng)意圖像的轉(zhuǎn)換。

    image.png

    【AiBase提要:】

    ?? 面部圖像轉(zhuǎn)換: 用戶可以將2D動漫人物或其他風(fēng)格的人臉圖像轉(zhuǎn)換成逼真的真人圖像。

    ?? 動畫視頻制作: 轉(zhuǎn)換后的圖像可以進一步利用Hyper AI等工具制作成動畫視頻。

    ?? 易于使用: 項目提供了Replicate和ComfyUI兩種運行模型的方式,使得用戶可以輕松地進行圖像轉(zhuǎn)換。

    項目地址:https://top.aibase.com/tool/cog-become-image

    試玩地址:https://replicate.com/fofr/become-image

    14、PhysDreamer:讓3D物體符合物理規(guī)律動起來

    通過視頻生成模型學(xué)習(xí)的物體動態(tài)先驗知識,實現(xiàn)靜態(tài)3D物體對新型交互的真實響應(yīng)。PhysDreamer利用物理學(xué)方法賦予靜態(tài)3D物體交互式動態(tài),提升虛擬體驗的真實感和吸引力。研究提出的PhysDreamer為靜態(tài)3D物體動態(tài)響應(yīng)提供了一種物理合理的方式。

    image.png

    【AiBase提要:】

    ?? 通過視頻生成模型學(xué)習(xí)的物體動態(tài)先驗知識,實現(xiàn)靜態(tài)3D物體對新型交互的真實響應(yīng)。

    ?? PhysDreamer利用物理學(xué)方法賦予靜態(tài)3D物體交互式動態(tài),提升虛擬體驗的真實感和吸引力。

    ?? 研究提出的PhysDreamer為靜態(tài)3D物體動態(tài)響應(yīng)提供了一種物理合理的方式。

    詳情鏈接:https://top.aibase.com/tool/physdreamer

    舉報

    • 相關(guān)推薦
    • AI日報:阿里通義千問Qwen3問鼎全球開源模型;Kimi長思考模型API發(fā)布;OpenAI發(fā)布新一代GPT-4.1模型

      【AI日報】匯總了近期AI領(lǐng)域重要動態(tài):1)阿里通義千問3開源模型上線7天即登頂全球開源模型榜首,在指令遵循和推理能力上超越閉源模型;2)月之暗面推出Kimi長思考模型API,可解決復(fù)雜代碼和數(shù)學(xué)問題;3)OpenAI發(fā)布GPT-4.1模型,性能提升顯著;4)Google推出Gemini2.5Pro模型,提升開發(fā)者編碼能力;5)聯(lián)想發(fā)布"天禧超級智能體",具備多模態(tài)感知能力;6)騰訊元寶上線"對話分

    • AI日報通義千問Qwen3重磅發(fā)布;抖音AI搜索能力開放;ChatGPT 搜索新增網(wǎng)購功能;Suno V4.5版本將發(fā)布

      本期AI日報重點內(nèi)容: 1. 通義千問發(fā)布Qwen3大模型,在代碼、數(shù)學(xué)和通用能力方面表現(xiàn)突出,支持兩種思考模式并開源多個模型權(quán)重 2. 抖音開放AI搜索能力接口,為第三方應(yīng)用提供豐富內(nèi)容資源 3. ChatGPT新增網(wǎng)購功能,通過對話獲取個性化商品推薦 4. Suno AI即將推出V4.5版本,提升音樂生成真實度 5. Simular AI登陸macOS,打造本地化智能助手 6. 暗月之面開源Kimi-VL模型,可處理文本、圖像和視頻 7. UCLA與Meta推出d1框架,提升大語言模型推理速度 8. 通義靈碼上線Qwen3編程智能體 9. Gen-4References圖像生成技術(shù)驚艷亮相 10. Hugging Face推出可編程機械臂SO-101 11. Windsurf推出全新品牌標志 12. Ollama全面支持Qwen3模型本地部署

    • 微信,OpenAIKimi想一起去了:大模型的盡頭依然還是社交平臺

      AI圈最近彌漫著一股微妙的氣息。人們似乎不再熱議大語言模型的最新突破、以及AI應(yīng)用的無限可能時,一些代表著未來的AI巨頭,卻似乎正將目光投向互聯(lián)網(wǎng)那熟悉得不能再熟悉的角落——社交網(wǎng)絡(luò)與社區(qū)。近期的傳聞和動作頗具代表性,在大洋彼岸,手握ChatGPT和Sora等王牌的OpenAI,據(jù)稱正內(nèi)部測試類X的社交功能,其CEO Sam Altman甚至在私下征求反饋;而在國內(nèi),憑借長文本能力

    • AI日報Kimi全新音頻基礎(chǔ)模型Kimi-Audio;階躍星辰開源圖像編輯模型Step1X-Edit;?夸克AI超級框上線 “拍照夸克”

      本期AI日報聚焦多項AI技術(shù)突破與應(yīng)用:1)Moonshot AI推出開源音頻模型Kimi-Audio,基于13億小時訓(xùn)練數(shù)據(jù),支持語音識別等任務(wù);2)階躍星辰開源圖像編輯模型Step1X-Edit,展現(xiàn)強大生成能力;3)夸克AI上線"拍照問夸克"功能,實現(xiàn)視覺問答;4)蘋果iOS18.5將在中國推送,帶來智能功能;5)谷歌發(fā)布601個生成式AI應(yīng)用案例,覆蓋多行業(yè);6)微軟推出深度整合Windows的UFO2自動化系統(tǒng);7)OpenAI升級ChatGPT至GPT-4o版本,提升STEM領(lǐng)域能力;8)Ema公司推出高性價比語言模型EmaFusion;9)Liquid AI發(fā)布面向邊緣設(shè)備的Hyena Edge模型;10)LemonAI推出實時音視頻數(shù)字人產(chǎn)品Slice Live。此外,國內(nèi)方面,智譜與生數(shù)科技達成戰(zhàn)略合作推動大模型發(fā)展,寶馬中國宣布新車將接入DeepSeek技術(shù)。

    • 上線僅7天!阿里通義千問3強勢登頂全球開源模型寶座

      據(jù)了解,千問3是國內(nèi)首個混合推理模型”,快思考”與慢思考”集成進同一個模型,對簡單需求可低算力秒回”答案,對復(fù)雜問題可多步驟深度思考”,大大節(jié)省算力消耗。

    • 阿里千問3登頂全球最強開源模型 已在通義App上線

      阿里集團推出新一代開源AI模型"通義千問3"(Qwen3),包含8款不同規(guī)格的混合推理模型。旗艦型號Qwen3-235B采用混合專家架構(gòu),創(chuàng)下國產(chǎn)模型性能新紀錄;Qwen3-32B則以部署成本低、運行穩(wěn)定見長。該系列在邏輯推理、編程、翻譯等專業(yè)領(lǐng)域表現(xiàn)卓越,用戶可通過通義App和網(wǎng)頁版體驗。升級后的通義App整合問答對話、圖像理解與生成等多項功能,持續(xù)強化代碼生成、數(shù)學(xué)解題等專業(yè)場景應(yīng)用能力,致力于打造實用性強的個人AI助手。

    • GPTBots 集成阿里通義千問 3.0,持續(xù)為企業(yè)提供頂尖 AI 服務(wù)

      GPTBots.ai平臺宣布完成與阿里通義千問3.0系列模型的技術(shù)集成,成為企業(yè)級AI智能體構(gòu)建領(lǐng)域的標桿平臺。該平臺通過混合推理架構(gòu)和多語言交互技術(shù),支持119種語言服務(wù),覆蓋全球主要市場。平臺提供雙模式智能任務(wù)處理:針對復(fù)雜業(yè)務(wù)場景的"深度思考"模式,以及高頻咨詢的"即時響應(yīng)"模式。搭載Qwen-3-235B旗艦?zāi)P秃蚎wen-3-30B輕量版,在代碼生成、數(shù)學(xué)推理等核心能力上達到行業(yè)頂尖水平。平臺實現(xiàn)與企業(yè)ERP、CRM等系統(tǒng)的無縫對接,推動數(shù)據(jù)價值變現(xiàn)。通過標準化流程自動化、全球化服務(wù)等核心價值,幫助企業(yè)提升運營效率70%、降低客服成本70%,并實現(xiàn)數(shù)據(jù)驅(qū)動的決策升級。

    • 奧特曼:ChatGPT不是AGI!OpenAI最強開源模型直擊DeepSeek

      【新智元導(dǎo)讀】代碼截圖泄露,滿血版o3、o4-mini鎖定下周!更勁爆的是,一款據(jù)稱是OpenAI的神秘模型一夜爆紅,每日處理高達260億token,是Claude用量4倍。奧特曼在TED放話:將推超強開源模型,直面DeepSeek挑戰(zhàn)。持續(xù)的創(chuàng)新、豐富的資源和智能AI將會無縫融入日常生活,未來一代人將會覺得當前人們又辛苦又落后。

    • AI日報:阿里通義萬相首尾幀生視頻模型;豆包開源Seed智能體模型UI-TARS-1.5;OpenAI首發(fā)“智能體實踐指南”

      歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點內(nèi)容,聚焦開發(fā)者,助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點擊了解:https://top.aibase.com/1、阿里通義萬相首尾幀生視頻模型Wan2.1-FLF2V-14B開源阿里巴巴的通義實驗室在Hugging Face和GitHub上開源了Wan2.1-FLF2V-14B模型,標志著AI視頻生成技術(shù)的重大進步。該模型支持高清視頻生成

    • AI日報:字節(jié)發(fā)布豆包1.5深度思考模型;微信首個AI助手 “元寶” 上線;OpenAI發(fā)布o4-mini、滿血版o3

      歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點內(nèi)容,聚焦開發(fā)者,助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點擊了解:https://top.aibase.com/1、OpenAI發(fā)布兩款多模態(tài)推理模型o4-mini、滿血版o3OpenAI在技術(shù)直播中推出了其最新的多模態(tài)模型o4-mini和滿血版o3,這兩款模型具備同時處理文本、圖像和音頻的能力,并能調(diào)用外部工?