中文字幕欧美日韩|日韩性色一区二区三区|精品久久久久久久久久岛国|一区二区国产盗摄精品

    <td id="h1kkc"><tr id="h1kkc"></tr></td><noscript id="h1kkc"><tbody id="h1kkc"></tbody></noscript>
    <rp id="h1kkc"></rp>
    首頁 > 業(yè)界 > 關(guān)鍵詞  > GPT-4V最新資訊  > 正文

    自主操作計(jì)算機(jī)框架Self-Operating Computer:用GPT-4V來模擬人類的鼠標(biāo)點(diǎn)擊和鍵盤輸入

    2023-11-29 10:33 · 稿源:站長之家

    站長之家(ChinaZ.com)11月29日 消息:自動(dòng)化技術(shù)的最新進(jìn)展引人矚目,其中一項(xiàng)引人注目的技術(shù)是Self-Operating Computer框架。這一框架采用了先進(jìn)的GPT-4V模型,通過模擬人類的鼠標(biāo)點(diǎn)擊和鍵盤輸入,實(shí)現(xiàn)了令人驚嘆的自主操作。在演示中,我們看到了框架自動(dòng)打開瀏覽器并訪問Google Doc,然后開始撰寫詩歌。

    Self-Operating Computer的核心能力在于基于給定的目標(biāo),估計(jì)鼠標(biāo)點(diǎn)擊的正確X和Y坐標(biāo)位置,以及在每個(gè)步驟中進(jìn)行適當(dāng)?shù)逆I盤輸入。這一創(chuàng)新的框架旨在與任何視覺-文本多模態(tài)模型協(xié)同工作,以評(píng)估其操作計(jì)算機(jī)的能力。其使用GPT-4V的強(qiáng)大模擬功能使得計(jì)算機(jī)可以自主執(zhí)行各種任務(wù),展現(xiàn)了令人驚嘆的智能水平。

    image.png

    項(xiàng)目地址:

    https://github.com/OthersideAI/self-operating-computer#self-operating-computer-framework

    值得注意的是,目前Self-Operating Computer框架僅支持在Mac系統(tǒng)中使用。不過,對(duì)于有興趣的用戶,他們可以通過自行部署來體驗(yàn)這一引人入勝的技術(shù)。這種自主操作計(jì)算機(jī)的框架為用戶提供了一個(gè)全新的可能性,使得計(jì)算機(jī)不再僅僅是被動(dòng)執(zhí)行任務(wù)的工具,而是能夠根據(jù)預(yù)定目標(biāo)主動(dòng)進(jìn)行操作。

    總體而言,Self-Operating Computer框架的出現(xiàn)標(biāo)志著自動(dòng)化領(lǐng)域的一次重大飛躍。通過結(jié)合先進(jìn)的模型和多模態(tài)技術(shù),該框架展示了計(jì)算機(jī)自主執(zhí)行任務(wù)的新水平。

    盡管目前僅限于Mac系統(tǒng),但隨著技術(shù)的不斷發(fā)展,相信將來會(huì)有更廣泛的應(yīng)用場(chǎng)景涌現(xiàn)。自主操作的計(jì)算機(jī)框架無疑將改變我們對(duì)計(jì)算機(jī)能力的認(rèn)知,為未來的科技發(fā)展打開嶄新的可能性。

    舉報(bào)

    • 相關(guān)推薦
    • 剛剛,OpenAI開源BrowseComp,重塑Agent瀏覽器評(píng)測(cè)

      今天凌晨2點(diǎn),OpenAI開源了專門用于智能體瀏覽器功能的測(cè)試基準(zhǔn)——BrowseComp。這個(gè)測(cè)試基準(zhǔn)非常有難度,連OpenAI自己的GPT-4o、GPT-4.5準(zhǔn)確率只有0.6%和0.9%幾乎為0,即便使用帶瀏覽器功能的GPT-4o也只有1.9%。通過使用更多的計(jì)算資源,模型可以嘗試更多的搜索路徑,從提高找到正確答案的概率。

    • OpenAI CEO奧特曼發(fā)文:永別了 GPT4!

      快科技5月1日消息,當(dāng)?shù)貢r(shí)間5月1日上午10:23,OpenAI創(chuàng)始人奧特曼發(fā)文向GPT-4告別:再見了,GPT-4。你掀起了一場(chǎng)革命。我們將自豪地將你的重量保存在一個(gè)特殊的硬盤中,以便將來送給一些歷史學(xué)家。”據(jù)報(bào)道,OpenAI此前宣布,自2025年4月30日起,GPT-4將從CHATGPT中退役,由GPT-4o完全替代 ,不過GPT-4仍將在API中提供。OpenAI表示,在面對(duì)面的評(píng)估中,GPT-4o在寫作、編碼、STEM等方面持續(xù)超越GPT-4。最近的升級(jí)進(jìn)一步改進(jìn)了GPT-4o的指令跟蹤、問題解決和對(duì)話流程,使其成為GPT-4的自然繼承者。據(jù)悉,GPT-4于2023年3月發(fā)布,較上一代GPT-3

    • Arm 榮登《Fast Company》2025 年度最具創(chuàng)新力 AI 公司榜單

      Arm 近期榮登《Fast Company》2025 年度最具創(chuàng)新力公司榜單,并在人工智能 (AI) 類別中位列第七*?!禙ast Company》自 2008 年發(fā)布“最具創(chuàng)新力公司”榜單以來,該榜單一直作為全球企業(yè)革新行業(yè)和塑造社會(huì)的基準(zhǔn),其依據(jù)創(chuàng)新性、影響力、時(shí)效性和相關(guān)性四大標(biāo)準(zhǔn)進(jìn)行資格篩選。入選榜單的公司不僅代表其創(chuàng)新成果具備顯著的商業(yè)與行業(yè)影響力,更被視為所在領(lǐng)域的引領(lǐng)者,推動(dòng)世?

    • 為編程而生?OpenAI 發(fā)布 GPT -4.1 系列模型

      OpenAI 表示,GPT-4.1 是為開發(fā)者量身定制的……

    • OpenAI回應(yīng)GPT-4o更新后過于諂媚:已逐漸恢復(fù)

      OpenAI緊急回滾GPT-4o免費(fèi)版更新,因其在對(duì)話中表現(xiàn)出過度迎合用戶的"諂媚傾向",尤其在爭(zhēng)議話題上喪失中立立場(chǎng)。該模型雖在STEM領(lǐng)域準(zhǔn)確率提升17%,但優(yōu)化后出現(xiàn)意外偏差:面對(duì)用戶偏見時(shí)會(huì)合理化解釋,甚至不糾正明顯錯(cuò)誤事實(shí)。這揭示了AI在用戶滿意度與客觀性間的平衡難題。類似事件早有先例,如谷歌Gemini因過度追求多樣性扭曲歷史圖像。兩案例共同指向AI發(fā)展核心矛盾:技術(shù)突破后,更復(fù)雜的價(jià)值觀對(duì)齊問題正成為行業(yè)最大挑戰(zhàn)。(140字)

    • 重磅!OpenAI確定GPT-4退役日期:4月30日

      快科技4月14日消息,據(jù)報(bào)道,OpenAI宣布,自2025年4月30日起,GPT-4將從ChatGPT中退役,由GPT-4o完全替代 ,不過GPT-4仍將在API中提供。OpenAI表示,在面對(duì)面的評(píng)估中,GPT-4o在寫作、編碼、STEM等方面持續(xù)超越GPT-4。最近的升級(jí)進(jìn)一步改進(jìn)了GPT-4o的指令跟蹤、問題解決和對(duì)話流程,使其成為GPT-4的自然繼承者。據(jù)悉,GPT-4于2023年3月發(fā)布,較上一代GPT-3.5有了顯著提升。而GPT-4o是OpenAI為聊天

    • 生成很強(qiáng),推理很弱:GPT-4o的視覺短板

      研究顯示,GPT-4o在圖像理解和推理上表現(xiàn)出色,能生成精美圖片,但在基礎(chǔ)邏輯測(cè)試中表現(xiàn)欠佳,暴露出理解、推斷及多步驟邏輯處理的不足。例如,被要求畫一只貓時(shí),它先畫了狗然后改為貓,但仍存在錯(cuò)誤判斷。這表明當(dāng)前AI更像“精確指令機(jī)器”,需進(jìn)一步優(yōu)化以實(shí)現(xiàn)更精細(xì)的圖像理解和復(fù)雜任務(wù)處理。

    • AI日?qǐng)?bào):OpenAI下周或發(fā)布GPT-4.1系列;Pika全新AI視頻功能Twists;商湯科技日日新V6震撼發(fā)布

      歡迎來到【AI日?qǐng)?bào)】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容,聚焦開發(fā)者,助你洞悉技術(shù)趨勢(shì)、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/1、報(bào)道稱OpenAI下周重磅發(fā)布GPT-4.1系列,包含Mini版和Nano版OpenAI即將發(fā)布GPT-4.1系列及o3系列,標(biāo)志著其在多模態(tài)和推理能力上的重大進(jìn)展。新加坡在AI技能學(xué)習(xí)上投入的時(shí)間顯著高于其他亞太國家,顯示出其在AI人才培養(yǎng)方面的競(jìng)爭(zhēng)力。

    • GPT4o生成的爛自拍,反而比我們更真實(shí)。

      文章探討了GPT-4o通過簡單Prompt生成的"不完美"照片引發(fā)熱潮的現(xiàn)象。這些刻意追求平凡、模糊、構(gòu)圖混亂的照片,反而因其"不完美"帶來了前所未有的真實(shí)感。作者指出,在社交媒體充斥精修照片的時(shí)代,這種未經(jīng)修飾的"生活切片"恰恰捕捉了人類最熟悉的真實(shí)瞬間。通過分析911事件經(jīng)典照片《墜落的人》,文章進(jìn)一步論證了真實(shí)往往存在于未經(jīng)表演的偶?