歡迎來(lái)到【AI日?qǐng)?bào)】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容,聚焦開(kāi)發(fā)者,助你洞悉技術(shù)趨勢(shì)、了解創(chuàng)新AI產(chǎn)品應(yīng)用。
新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/
1、Claude3.5Sonnet模型增加PDF文件處理功能
Anthropic公司最新推出的Claude3.5Sonnet模型增加了PDF文件處理功能,用戶(hù)可以通過(guò)該模型分析PDF文檔中的文本和視覺(jué)元素,包括圖像、圖表和表格等,適用于多種場(chǎng)景。
【AiBase提要:】
?? Claude3.5Sonnet模型新增PDF文件處理功能,支持文本和圖像分析。
??? 處理過(guò)程包括提取文本、轉(zhuǎn)換頁(yè)面為圖像和綜合分析三個(gè)步驟。
?? 處理費(fèi)用根據(jù)文檔長(zhǎng)度和內(nèi)容密度不同,用戶(hù)需遵循文件大小和頁(yè)數(shù)限制。
2、OpenAI完整版o1模型曝光:能力超強(qiáng) 可處理20萬(wàn)個(gè)token
我對(duì)最新曝光的OpenAI o1模型進(jìn)行了點(diǎn)評(píng)。該模型被稱(chēng)為OpenAI最強(qiáng)大的模型,具備處理大量文本和分析圖像的能力,特別適合高級(jí)推理和創(chuàng)造性任務(wù)。預(yù)計(jì)完整版將在今年晚些時(shí)候推出,引起了人工智能領(lǐng)域的廣泛關(guān)注。用戶(hù)們對(duì)o1模型的體驗(yàn)充滿(mǎn)期待。
【AiBase提要:】
?? o1模型短暫開(kāi)放,能處理約20萬(wàn)字和分析圖像。
?? OpenAI稱(chēng)其為“最強(qiáng)大的模型”,適合高級(jí)推理和創(chuàng)造性任務(wù)。
?? 完整版尚未發(fā)布,預(yù)計(jì)將于今年晚些時(shí)候推出。
3、告別隨機(jī)生成!Runway推出高級(jí)攝像機(jī)控制 像導(dǎo)演一樣掌控鏡頭
Runway最新推出的高級(jí)攝像機(jī)控制功能讓用戶(hù)像導(dǎo)演一樣掌控虛擬場(chǎng)景中的鏡頭移動(dòng),為AI視頻創(chuàng)作帶來(lái)前所未有的靈活性和掌控力。用戶(hù)可以實(shí)現(xiàn)水平移動(dòng)、環(huán)繞拍攝、位置探索、循環(huán)拍攝等多種效果,極大拓展了創(chuàng)作潛力。這一功能改變了用戶(hù)對(duì)數(shù)碼相機(jī)工作的看法,實(shí)現(xiàn)無(wú)縫過(guò)渡和增強(qiáng)場(chǎng)景構(gòu)圖。
【AiBase提要:】
?? 用戶(hù)可以像導(dǎo)演一樣精準(zhǔn)控制虛擬場(chǎng)景中的鏡頭移動(dòng),實(shí)現(xiàn)多種效果,包括水平移動(dòng)、環(huán)繞拍攝等。
?? 結(jié)合速度變化的循環(huán)拍攝功能,用戶(hù)可以生成吸睛的視覺(jué)循環(huán)或過(guò)渡,極大拓展了創(chuàng)作潛力。
??? 高級(jí)攝像機(jī)控制功能讓用戶(hù)精確控制場(chǎng)景和主題的呈現(xiàn)方式,將觀(guān)眾帶入一個(gè)栩栩如生、看似3D的世界。
詳情鏈接:https://top.aibase.com/tool/runway
4、付費(fèi)用戶(hù)僅60+,月入?yún)s達(dá)3萬(wàn)!開(kāi)源AI聊天工具LobeChat盈利模式大揭秘
LobeChat團(tuán)隊(duì)在開(kāi)源AI聊天工具LobeChat的云服務(wù)公測(cè)中取得初步成績(jī),月收入突破3萬(wàn)元人民幣,但面臨付費(fèi)轉(zhuǎn)化率低的挑戰(zhàn)。團(tuán)隊(duì)計(jì)劃通過(guò)差異化功能和調(diào)整訂閱模式解決問(wèn)題,同時(shí)承諾解決產(chǎn)品設(shè)計(jì)中的挑戰(zhàn)。盈利空間有限,將關(guān)注MRR指標(biāo)確??沙掷m(xù)發(fā)展。
【AiBase提要:】
?? LobeChat云服務(wù)一個(gè)月月收入突破3萬(wàn)元人民幣,付費(fèi)用戶(hù)數(shù)達(dá)60+,展現(xiàn)商業(yè)化希望。
?? 付費(fèi)轉(zhuǎn)化率低,僅不到1%,可能因市場(chǎng)競(jìng)爭(zhēng)激烈和功能差距。
?? LobeChat團(tuán)隊(duì)計(jì)劃推出差異化功能和調(diào)整訂閱模式,關(guān)注MRR指標(biāo)確??沙掷m(xù)發(fā)展。
詳情鏈接:https://lobechat.com/welcome
5、Diffusion 模型也能“舉一反三”?阿里IC-LoRA給圖像生成模型增加情節(jié)記憶力能力
阿里巴巴通義實(shí)驗(yàn)室最新研究表明,現(xiàn)有的文生圖Diffusion Transformer模型已具備生成多張具有特定關(guān)系圖像的能力,通過(guò)IC-LoRA的加持,模型變得更智能,只需少量樣本即可學(xué)會(huì)新技能。研究人員設(shè)計(jì)了簡(jiǎn)單有效的流程,喚醒Diffusion模型的“上下文學(xué)習(xí)”能力,大大降低了AI模型的訓(xùn)練成本,讓更多人參與AI創(chuàng)作。IC-LoRA的出現(xiàn)是AI圖像生成領(lǐng)域的里程碑式進(jìn)步,讓每個(gè)人都能成為藝術(shù)家。
【AiBase提要:】
?? 現(xiàn)有的文生圖Diffusion Transformer模型已具備生成多張具有特定關(guān)系圖像的能力
?? IC-LoRA加持使模型變得更智能,只需少量樣本即可學(xué)會(huì)新技能
?? 設(shè)計(jì)簡(jiǎn)單有效的流程喚醒Diffusion模型的“上下文學(xué)習(xí)”能力
詳情鏈接:https://ali-vilab.github.io/In-Context-LoRA-Page/
6、顛覆視頻編輯!開(kāi)源神器ComfyUI-MochiEdit 支持視頻轉(zhuǎn)視頻,局部編輯
我想象過(guò)像操控文字一樣編輯視頻的情景,現(xiàn)在這個(gè)想法已經(jīng)成為現(xiàn)實(shí)。ComfyUI-MochiEdit是一款基于ComfyUI和Genmo Mochi的開(kāi)源視頻編輯工具,它提供了一種全新的視頻編輯思路:將視頻轉(zhuǎn)換為噪聲,再通過(guò)目標(biāo)提示重新采樣噪聲,生成全新視頻。這種方法實(shí)現(xiàn)了局部編輯和視頻轉(zhuǎn)視頻功能,讓用戶(hù)可以輕松修改視頻的部分而無(wú)需處理整個(gè)視頻。
【AiBase提要:】
?? 視頻轉(zhuǎn)噪聲再重采樣,實(shí)現(xiàn)局部編輯和視頻轉(zhuǎn)視頻功能
?? 可將輸入視頻轉(zhuǎn)換為具有特定風(fēng)格或內(nèi)容的新視頻
?? 用戶(hù)可通過(guò)調(diào)整節(jié)點(diǎn)參數(shù)控制最終視頻效果
詳情鏈接:https://github.com/logtd/ComfyUI-MochiEdit?tab=readme-ov-file#mochi-unsampler
7、AI熱潮推動(dòng)!Python超越JavaScript,成GitHub最受歡迎編程語(yǔ)言
Python在GitHub開(kāi)發(fā)者平臺(tái)成功超越JavaScript,主要源自生成式人工智能熱潮。GitHub指出AI并未降低開(kāi)源項(xiàng)目代碼質(zhì)量,反而促進(jìn)了AI項(xiàng)目貢獻(xiàn)增長(zhǎng)。開(kāi)發(fā)者越來(lái)越多地將AI模型集成到工具鏈中,關(guān)注小型高效模型和AI代理自動(dòng)化。2024年最受關(guān)注的開(kāi)源AI項(xiàng)目是“ollama/ollama”,展示了AI領(lǐng)域的快速發(fā)展。
【AiBase提要:】
?? Python成功超越JavaScript,成為GitHub最受歡迎編程語(yǔ)言,受益于生成式人工智能熱潮。
?? 生成式AI項(xiàng)目貢獻(xiàn)增長(zhǎng)59%,總數(shù)增加98%,推動(dòng)了AI領(lǐng)域的發(fā)展。
?? GitHub表示AI并未降低開(kāi)源項(xiàng)目代碼質(zhì)量,開(kāi)發(fā)者對(duì)小型高效模型和AI代理自動(dòng)化表現(xiàn)出濃厚興趣。
8、Meta最新黑科技:Sparsh賦予機(jī)器人“人類(lèi)級(jí)”觸覺(jué),靈巧操作不再是夢(mèng)!
Meta FAIR 實(shí)驗(yàn)室近日發(fā)布了名為“Sparsh”的人工多模態(tài)指尖觸覺(jué)感知技術(shù),為機(jī)器人賦予近似人類(lèi)的觸覺(jué)感知能力,將在機(jī)器人操控領(lǐng)域帶來(lái)革命性變化。該技術(shù)采用自監(jiān)督學(xué)習(xí),利用46萬(wàn)+觸覺(jué)圖像進(jìn)行預(yù)訓(xùn)練,支持多種視覺(jué)觸覺(jué)傳感器,顯著提升機(jī)器人在觸覺(jué)感知任務(wù)上的性能。發(fā)布的Sparsh模型標(biāo)志著AI觸覺(jué)感知領(lǐng)域的重大突破,未來(lái)有望改變機(jī)器人與物理世界交互方式。
【AiBase提要:】
?? Sparsh模型采用自監(jiān)督學(xué)習(xí),預(yù)訓(xùn)練使用46萬(wàn)+觸覺(jué)圖像,無(wú)需人工標(biāo)注數(shù)據(jù),學(xué)習(xí)通用觸覺(jué)表征。
?? Sparsh模型支持多種視覺(jué)觸覺(jué)傳感器,如DIGIT、GelSight2017和GelSight Mini,提升機(jī)器人在觸覺(jué)感知任務(wù)上的性能。
?? Sparsh模型在TacBench基準(zhǔn)測(cè)試平臺(tái)上表現(xiàn)出色,在力估計(jì)、滑動(dòng)檢測(cè)等任務(wù)中即使使用1%標(biāo)注數(shù)據(jù)也能取得滿(mǎn)意結(jié)果。
詳情鏈接:
https://scontent-sjc3-1.xx.fbcdn.net/v/t39.2365-6/464969941_1107633400780143_7479102347328147009_n.pdf?_nc_cat=103&ccb=1-7&_nc_sid=3c67a6&_nc_ohc=y8Ui1HEw3BQQ7kNvgFe-ePu&_nc_zt=14&_nc_ht=scontent-sjc3-1.xx&_nc_gid=AeaFsuZziasVwPfMQsEoZqu&oh=00_AYAMqxGq0ATCySDxZWB0ZT8BgSkogYmj13c9f3ytVtkmSg&oe=672DEEE4
9、全新開(kāi)源音頻模型Hertz-Dev:超低延遲,實(shí)現(xiàn)AI實(shí)時(shí)對(duì)話(huà)
在當(dāng)今科技的浪潮中,對(duì)話(huà)式人工智能(AI)已經(jīng)成為我們生活中的重要組成部分。Standard Intelligence Lab推出的Hertz-Dev開(kāi)源音頻模型,實(shí)現(xiàn)了超低延遲的實(shí)時(shí)對(duì)話(huà)AI,為人與機(jī)器之間的互動(dòng)帶來(lái)新的希望。
【AiBase提要:】
?? Hertz-Dev是一個(gè)開(kāi)源的8.5億參數(shù)音頻模型,理論延遲僅為80毫秒,實(shí)際延遲為120毫秒,極大提升了實(shí)時(shí)對(duì)話(huà)體驗(yàn)。
?? 獨(dú)立開(kāi)發(fā)者和研究人員可以輕松使用先進(jìn)的實(shí)時(shí)對(duì)話(huà)AI技術(shù),無(wú)需龐大硬件支持,降低了門(mén)檻。
?? Hertz-Dev的廣泛應(yīng)用將推動(dòng)人工智能在客戶(hù)支持、智能家居等領(lǐng)域發(fā)展,讓人與機(jī)器的互動(dòng)更為自然。
詳情鏈接:https://github.com/Standard-Intelligence/hertz-dev
10、前小鵬高管創(chuàng)辦 AI 陪伴機(jī)器人公司,成功融資千萬(wàn)元!
作為前小鵬機(jī)器人產(chǎn)品設(shè)計(jì)負(fù)責(zé)人的孫兆治創(chuàng)辦的上海珞博智能科技有限公司成功完成千萬(wàn)元級(jí)人民幣的天使輪融資。公司專(zhuān)注于A(yíng)I陪伴機(jī)器人領(lǐng)域,產(chǎn)品定位為“AI潮玩”,將兼顧桌面和可穿戴場(chǎng)景,具備多項(xiàng)創(chuàng)新特性。
【AiBase提要:】
?? 珞博智能完成千萬(wàn)元級(jí)人民幣的天使輪融資,主要來(lái)自行業(yè)投資者。
?? 公司成立于2024年1月,首款產(chǎn)品定位為“AI潮玩”,已完成前三輪原型機(jī)設(shè)計(jì)開(kāi)發(fā)。
?? 創(chuàng)始人孫兆治具有豐富的用戶(hù)體驗(yàn)設(shè)計(jì)和工業(yè)設(shè)計(jì)背景,公司目標(biāo)市場(chǎng)明確,面向年輕女性用戶(hù)的情感陪伴需求。
(舉報(bào))