11.11云上盛惠!海量產(chǎn)品 · 輕松上云!云服務(wù)器首年1.8折起,買1年送3個(gè)月!超值優(yōu)惠,性能穩(wěn)定,讓您的云端之旅更加暢享??靵?lái)騰訊云選購(gòu)吧!
盡管蘋(píng)果在生成式AI熱潮開(kāi)始后并未推出任何AI模型,但近期公司正在著手一些AI項(xiàng)目。蘋(píng)果研究人員分享了一篇揭示公司正在研發(fā)的新語(yǔ)言模型的論文,內(nèi)部消息稱蘋(píng)果正在研發(fā)兩款A(yù)I驅(qū)動(dòng)的機(jī)器人。由于模型對(duì)用戶應(yīng)用屏幕的全面理解以及執(zhí)行某些任務(wù)的知識(shí),F(xiàn)erret-UI可以用于強(qiáng)化Siri,讓其為用戶執(zhí)行任務(wù)。
蘋(píng)果公司近日發(fā)布了一款名為MLLLLMFerret-UI的新型機(jī)器學(xué)習(xí)語(yǔ)言模型,旨在提升對(duì)移動(dòng)應(yīng)用用戶界面的理解。這款模型經(jīng)過(guò)特別優(yōu)化,能夠處理移動(dòng)UI屏幕上的各種任務(wù),并具備指向、定位和推理等能力。Ferret-UI還能夠通過(guò)功能推斷來(lái)解釋屏幕的整體目的,顯示出在理解和生成自然語(yǔ)言指令方面的高級(jí)能力。
Ferret-UI是一個(gè)新的MLLLM,專門為提高對(duì)移動(dòng)UI屏幕的理解設(shè)計(jì)。具備引用、定位和推理能力,處理UI屏幕上的任務(wù)。點(diǎn)擊前往Ferret-UI官網(wǎng)體驗(yàn)入口需求人群:適用于移動(dòng)UI屏幕的理解和操作,提高對(duì)UI元素的識(shí)別精度。
蘋(píng)果公司與康奈爾大學(xué)的研究人員于10月份悄然推出了一款名為「Ferret」的開(kāi)源多模態(tài)大型語(yǔ)言模型。這一研究成果首次在Github上發(fā)布,但并未引起太多關(guān)注,沒(méi)有進(jìn)行任何宣布或慶祝。考慮到蘋(píng)果與NvidiaGPU采用的歷史,這被視為對(duì)GPU制造商的罕見(jiàn)認(rèn)可。
研究人員在最新的一項(xiàng)研究中介紹了Ferret,這是一款多模式語(yǔ)言模型,旨在實(shí)現(xiàn)高級(jí)圖像理解和描述。該研究聚焦于視覺(jué)-語(yǔ)言學(xué)習(xí)中的關(guān)鍵問(wèn)題,即如何融合地理信息和語(yǔ)義知識(shí),以便模型能夠同時(shí)引用和定位圖像中的元素。這一研究為多模式語(yǔ)言模型領(lǐng)域帶來(lái)了突破性進(jìn)展,為圖像理解和描述提供了新的可能性。
FerretAI是一款旨在幫助用戶在進(jìn)入商業(yè)協(xié)議之前獲取網(wǎng)絡(luò)背景信息的AI工具。這個(gè)工具自動(dòng)監(jiān)控各種信息來(lái)源,包括報(bào)紙檔案、法律記錄和公司所有權(quán)記錄,以審查潛在的客戶、投資者和商業(yè)伙伴。盡管該工具當(dāng)前收集的所有數(shù)據(jù)都是公開(kāi)可獲得的,但仍會(huì)引發(fā)潛在的隱私擔(dān)憂。
蘋(píng)果AI/ML團(tuán)隊(duì)與哥倫比亞大學(xué)合作研發(fā)的多模態(tài)大模型“雪貂”已經(jīng)成功突破了谷歌人機(jī)驗(yàn)證碼的難題,能夠輕松識(shí)別圖像中的交通信號(hào)燈并準(zhǔn)確圈出其位置,其性能直逼GPT-4V。Ferret的關(guān)鍵在于改進(jìn)了大模型在“看說(shuō)答”任務(wù)中的精確度,這得益于其出色的圖文關(guān)聯(lián)能力。通過(guò)這一研究,F(xiàn)erret為解決圖像理解和多模態(tài)任務(wù)提供了新的方向,有望在人機(jī)交互、智能搜索等領(lǐng)域取得