Ferret-UI是一個(gè)新的MLLLM,專(zhuān)門(mén)為提高對(duì)移動(dòng)UI屏幕的理解而設(shè)計(jì)。具備引用、定位和推理能力,處理UI屏幕上的任務(wù)。具有“任何分辨率”技術(shù),通過(guò)放大細(xì)節(jié)解決小對(duì)象識(shí)別問(wèn)題。涉及任務(wù)制定、訓(xùn)練樣本收集、模型架構(gòu)與數(shù)據(jù)集建立等,表現(xiàn)突出在高級(jí)任務(wù)的對(duì)話(huà)能力。
點(diǎn)擊前往Ferret-UI官網(wǎng)體驗(yàn)入口
需求人群:
適用于移動(dòng)UI屏幕的理解和操作,提高對(duì)UI元素的識(shí)別精度。
使用場(chǎng)景示例:
- iOS18 的應(yīng)用界面自動(dòng)操作
- 移動(dòng)應(yīng)用UI屏幕識(shí)別與操作
- 高級(jí)任務(wù)中的對(duì)話(huà)能力展示
產(chǎn)品特色:
- 引用、定位和推理能力
- 任何分辨率技術(shù)
- 訓(xùn)練樣本收集與任務(wù)制定
- 模型架構(gòu)與數(shù)據(jù)集建立
- 高級(jí)任務(wù)中的對(duì)話(huà)能力
(舉報(bào))