11.11云上盛惠!海量產(chǎn)品 · 輕松上云!云服務器首年1.8折起,買1年送3個月!超值優(yōu)惠,性能穩(wěn)定,讓您的云端之旅更加暢享??靵眚v訊云選購吧!
微軟在官網(wǎng)發(fā)布了視覺Agent解析框架OmniParser最新版本V2.0,可將DeepSeek-R1、GPT-4o、Qwen-2.5VL等模型,變成可在計算機使用的AIAgent。與V1版本相比,V2在檢測較小的可交互UI元素時準確率更高、推理速度更快,延遲降低了60%。當任務是“點擊設置按鈕”時,OmniParser不僅提供了設置按鈕的邊界框和ID提供了其功能描述,顆顯著提高了模型的準確性和魯棒性。