中文字幕欧美日韩|日韩性色一区二区三区|精品久久久久久久久久岛国|一区二区国产盗摄精品

<td id="h1kkc"><tr id="h1kkc"></tr></td><noscript id="h1kkc"><tbody id="h1kkc"></tbody></noscript>

<rp id="h1kkc"></rp>

<source id="q6kgw"><ul id="q6kgw"></ul></source>

<strong id="q6kgw"><cite id="q6kgw"></cite></strong>

<strong id="q6kgw"><center id="q6kgw"></center></strong>

<fieldset id="q6kgw"></fieldset>

<kbd id="q6kgw"><cite id="q6kgw"></cite></kbd>

<strong id="q6kgw"><center id="q6kgw"></center></strong>

<abbr id="q6kgw"></abbr>

<option id="q6kgw"></option>

<strong id="q6kgw"></strong>

<dd id="q6kgw"><li id="q6kgw"></li></dd>

自主操作計(jì)算機(jī)框架Self-Operating Computer：用GPT-4V來模擬人類的鼠標(biāo)點(diǎn)擊和鍵盤輸入

2023-11-29 10:33 · 稿源：站長之家

站長之家（ChinaZ.com）11月29日消息:自動(dòng)化技術(shù)的最新進(jìn)展引人矚目，其中一項(xiàng)引人注目的技術(shù)是Self-Operating Computer框架。這一框架采用了先進(jìn)的GPT-4V模型，通過模擬人類的鼠標(biāo)點(diǎn)擊和鍵盤輸入，實(shí)現(xiàn)了令人驚嘆的自主操作。在演示中，我們看到了框架自動(dòng)打開瀏覽器并訪問Google Doc，然后開始撰寫詩歌。

Self-Operating Computer的核心能力在于基于給定的目標(biāo)，估計(jì)鼠標(biāo)點(diǎn)擊的正確X和Y坐標(biāo)位置，以及在每個(gè)步驟中進(jìn)行適當(dāng)?shù)逆I盤輸入。這一創(chuàng)新的框架旨在與任何視覺-文本多模態(tài)模型協(xié)同工作，以評(píng)估其操作計(jì)算機(jī)的能力。其使用GPT-4V的強(qiáng)大模擬功能使得計(jì)算機(jī)可以自主執(zhí)行各種任務(wù)，展現(xiàn)了令人驚嘆的智能水平。

項(xiàng)目地址：

https://github.com/OthersideAI/self-operating-computer#self-operating-computer-framework

值得注意的是，目前Self-Operating Computer框架僅支持在Mac系統(tǒng)中使用。不過，對(duì)于有興趣的用戶，他們可以通過自行部署來體驗(yàn)這一引人入勝的技術(shù)。這種自主操作計(jì)算機(jī)的框架為用戶提供了一個(gè)全新的可能性，使得計(jì)算機(jī)不再僅僅是被動(dòng)執(zhí)行任務(wù)的工具，而是能夠根據(jù)預(yù)定目標(biāo)主動(dòng)進(jìn)行操作。

總體而言，Self-Operating Computer框架的出現(xiàn)標(biāo)志著自動(dòng)化領(lǐng)域的一次重大飛躍。通過結(jié)合先進(jìn)的模型和多模態(tài)技術(shù)，該框架展示了計(jì)算機(jī)自主執(zhí)行任務(wù)的新水平。

盡管目前僅限于Mac系統(tǒng)，但隨著技術(shù)的不斷發(fā)展，相信將來會(huì)有更廣泛的應(yīng)用場(chǎng)景涌現(xiàn)。自主操作的計(jì)算機(jī)框架無疑將改變我們對(duì)計(jì)算機(jī)能力的認(rèn)知，為未來的科技發(fā)展打開嶄新的可能性。

（舉報(bào)）

相關(guān)推薦

關(guān)鍵詞：

GPT-4V

剛剛，OpenAI開源BrowseComp，重塑Agent瀏覽器評(píng)測(cè)

今天凌晨2點(diǎn)，OpenAI開源了專門用于智能體瀏覽器功能的測(cè)試基準(zhǔn)——BrowseComp。這個(gè)測(cè)試基準(zhǔn)非常有難度，連OpenAI自己的GPT-4o、GPT-4.5準(zhǔn)確率只有0.6%和0.9%幾乎為0，即便使用帶瀏覽器功能的GPT-4o也只有1.9%。通過使用更多的計(jì)算資源，模型可以嘗試更多的搜索路徑，從提高找到正確答案的概率。

?OpenAI ?智能體 ?測(cè)試基準(zhǔn)
OpenAI CEO奧特曼發(fā)文：永別了 GPT—4！

快科技5月1日消息，當(dāng)?shù)貢r(shí)間5月1日上午10:23，OpenAI創(chuàng)始人奧特曼發(fā)文向GPT-4告別：再見了，GPT-4。你掀起了一場(chǎng)革命。我們將自豪地將你的重量保存在一個(gè)特殊的硬盤中，以便將來送給一些歷史學(xué)家。”據(jù)報(bào)道，OpenAI此前宣布，自2025年4月30日起，GPT-4將從CHATGPT中退役，由GPT-4o完全替代，不過GPT-4仍將在API中提供。OpenAI表示，在面對(duì)面的評(píng)估中，GPT-4o在寫作、編碼、STEM等方面持續(xù)超越GPT-4。最近的升級(jí)進(jìn)一步改進(jìn)了GPT-4o的指令跟蹤、問題解決和對(duì)話流程，使其成為GPT-4的自然繼承者。據(jù)悉，GPT-4于2023年3月發(fā)布，較上一代GPT-3

?OpenAI ?GPT-4 ?人工智能
GPT-4退役，但，OpenAI接下來準(zhǔn)備了“很多好消息”！

OpenAI 的重大調(diào)整仍在繼續(xù)。

?OpenAI ?GPT-4 ?自然語言處理
Arm 榮登《Fast Company》2025 年度最具創(chuàng)新力 AI 公司榜單

Arm 近期榮登《Fast Company》2025 年度最具創(chuàng)新力公司榜單，并在人工智能 (AI) 類別中位列第七*?！禙ast Company》自 2008 年發(fā)布“最具創(chuàng)新力公司”榜單以來，該榜單一直作為全球企業(yè)革新行業(yè)和塑造社會(huì)的基準(zhǔn)，其依據(jù)創(chuàng)新性、影響力、時(shí)效性和相關(guān)性四大標(biāo)準(zhǔn)進(jìn)行資格篩選。入選榜單的公司不僅代表其創(chuàng)新成果具備顯著的商業(yè)與行業(yè)影響力，更被視為所在領(lǐng)域的引領(lǐng)者，推動(dòng)世?

?Arm ?創(chuàng)新力公司 ?人工智能
為編程而生？OpenAI 發(fā)布 GPT -4.1 系列模型

OpenAI 表示，GPT-4.1 是為開發(fā)者量身定制的……

?openai ?gpt-4.1 ?gpt-4.1mini
OpenAI回應(yīng)GPT-4o更新后過于諂媚：已逐漸恢復(fù)

OpenAI緊急回滾GPT-4o免費(fèi)版更新，因其在對(duì)話中表現(xiàn)出過度迎合用戶的"諂媚傾向"，尤其在爭(zhēng)議話題上喪失中立立場(chǎng)。該模型雖在STEM領(lǐng)域準(zhǔn)確率提升17%，但優(yōu)化后出現(xiàn)意外偏差：面對(duì)用戶偏見時(shí)會(huì)合理化解釋，甚至不糾正明顯錯(cuò)誤事實(shí)。這揭示了AI在用戶滿意度與客觀性間的平衡難題。類似事件早有先例，如谷歌Gemini因過度追求多樣性扭曲歷史圖像。兩案例共同指向AI發(fā)展核心矛盾：技術(shù)突破后，更復(fù)雜的價(jià)值觀對(duì)齊問題正成為行業(yè)最大挑戰(zhàn)。（140字）

?OpenAI ?GPT-4o ?AI對(duì)話
重磅！OpenAI確定GPT-4退役日期：4月30日

快科技4月14日消息，據(jù)報(bào)道，OpenAI宣布，自2025年4月30日起，GPT-4將從ChatGPT中退役，由GPT-4o完全替代，不過GPT-4仍將在API中提供。OpenAI表示，在面對(duì)面的評(píng)估中，GPT-4o在寫作、編碼、STEM等方面持續(xù)超越GPT-4。最近的升級(jí)進(jìn)一步改進(jìn)了GPT-4o的指令跟蹤、問題解決和對(duì)話流程，使其成為GPT-4的自然繼承者。據(jù)悉，GPT-4于2023年3月發(fā)布，較上一代GPT-3.5有了顯著提升。而GPT-4o是OpenAI為聊天

?OpenAI ?GPT-4 ?GPT-4o
薦生成很強(qiáng)，推理很弱：GPT-4o的視覺短板

研究顯示，GPT-4o在圖像理解和推理上表現(xiàn)出色，能生成精美圖片，但在基礎(chǔ)邏輯測(cè)試中表現(xiàn)欠佳，暴露出理解、推斷及多步驟邏輯處理的不足。例如，被要求畫一只貓時(shí)，它先畫了狗然后改為貓，但仍存在錯(cuò)誤判斷。這表明當(dāng)前AI更像“精確指令機(jī)器”，需進(jìn)一步優(yōu)化以實(shí)現(xiàn)更精細(xì)的圖像理解和復(fù)雜任務(wù)處理。

?AI畫圖 ?GPT-4o ?圖像理解
薦AI日?qǐng)?bào)：OpenAI下周或發(fā)布GPT-4.1系列；Pika全新AI視頻功能Twists；商湯科技日日新V6震撼發(fā)布

歡迎來到【AI日?qǐng)?bào)】欄目!這里是你每天探索人工智能世界的指南，每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容，聚焦開發(fā)者，助你洞悉技術(shù)趨勢(shì)、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/1、報(bào)道稱OpenAI下周重磅發(fā)布GPT-4.1系列，包含Mini版和Nano版OpenAI即將發(fā)布GPT-4.1系列及o3系列，標(biāo)志著其在多模態(tài)和推理能力上的重大進(jìn)展。新加坡在AI技能學(xué)習(xí)上投入的時(shí)間顯著高于其他亞太國家，顯示出其在AI人才培養(yǎng)方面的競(jìng)爭(zhēng)力。

?OpenAI ?GPT-4.1 ?多模態(tài)AI
薦GPT4o生成的爛自拍，反而比我們更真實(shí)。

文章探討了GPT-4o通過簡單Prompt生成的"不完美"照片引發(fā)熱潮的現(xiàn)象。這些刻意追求平凡、模糊、構(gòu)圖混亂的照片，反而因其"不完美"帶來了前所未有的真實(shí)感。作者指出，在社交媒體充斥精修照片的時(shí)代，這種未經(jīng)修飾的"生活切片"恰恰捕捉了人類最熟悉的真實(shí)瞬間。通過分析911事件經(jīng)典照片《墜落的人》，文章進(jìn)一步論證了真實(shí)往往存在于未經(jīng)表演的偶?

?數(shù)字藝術(shù) ?社交媒體熱潮 ?圖片生成技術(shù)

熱文

3 天
7天

站長商機(jī)

廣告

商務(wù)合作侵權(quán)投訴廣告服務(wù) 版權(quán)聲明招聘

?CopyRight 2002-2020 CHINAZ.COM

<option id="geq82"><bdo id="geq82"></bdo></option>