在Google Cloud Next25大會(huì)上,谷歌宣布開(kāi)源了首個(gè)標(biāo)準(zhǔn)智能體交互協(xié)議——Agent2Agent Protocol(簡(jiǎn)稱A2A),這一舉措有望徹底改變智能體之間的交互方式,打破系統(tǒng)孤島,對(duì)智能體的能力、跨平臺(tái)協(xié)作以及執(zhí)行效率產(chǎn)生質(zhì)的飛躍。
A2A協(xié)議是一種開(kāi)放標(biāo)準(zhǔn),旨在為智能體提供一種通用的交互方式,使它們能夠在不同的底層框架和供應(yīng)商之間無(wú)縫協(xié)作。例如,一家大型電商公司可能同時(shí)使用Atlassian進(jìn)行團(tuán)隊(duì)項(xiàng)目管理、Box進(jìn)行文件存儲(chǔ)和共享、Salesforce進(jìn)行客戶關(guān)系管理以及Workday進(jìn)行人力資源管理。在過(guò)去,這些平臺(tái)上的智能體無(wú)法自由通信,但A2A協(xié)議的出現(xiàn)使得這些企業(yè)平臺(tái)能夠安全、自由地自動(dòng)化交互數(shù)據(jù),極大地提升了工作效率和數(shù)據(jù)流通性。
谷歌在設(shè)計(jì)A2A協(xié)議時(shí)遵循了五個(gè)關(guān)鍵原則。首先,A2A專注于使智能體能夠在自然的、非結(jié)構(gòu)化的模式下協(xié)作,即使它們不共享內(nèi)存、工具和上下文,從而啟用真正的多智能體場(chǎng)景。其次,該協(xié)議基于現(xiàn)有的流行標(biāo)準(zhǔn)構(gòu)建,如HTTP、服務(wù)器端事件(SSE)和JSON-RPC,這使得它更容易與企業(yè)現(xiàn)有的IT堆棧集成。第三,A2A支持企業(yè)級(jí)的認(rèn)證和授權(quán),與OpenAPI的認(rèn)證方案具有對(duì)等性,確保數(shù)據(jù)傳輸?shù)陌踩院秃弦?guī)性。第四,A2A具有靈活性,能夠支持從快速任務(wù)到可能需要數(shù)小時(shí)甚至數(shù)天的深入研究等各種場(chǎng)景,并在整個(gè)過(guò)程中向用戶提供實(shí)時(shí)反饋、通知和狀態(tài)更新。最后,A2A支持多種模態(tài),包括音頻、圖像和視頻流,滿足不同場(chǎng)景下的需求。
A2A的工作原理是通過(guò)促進(jìn)客戶端智能體和遠(yuǎn)程智能體之間的通信來(lái)實(shí)現(xiàn)的??蛻舳酥悄荏w負(fù)責(zé)制定和傳達(dá)任務(wù),而遠(yuǎn)程智能體則根據(jù)這些任務(wù)采取行動(dòng),提供正確的信息或執(zhí)行相應(yīng)的操作。在這個(gè)過(guò)程中,智能體可以通過(guò)“智能體卡”來(lái)宣傳它們的能力,這些“智能體卡”以JSON格式存在,能夠讓客戶端智能體識(shí)別出哪個(gè)遠(yuǎn)程智能體最適合執(zhí)行特定的任務(wù)。一旦確定了合適的遠(yuǎn)程智能體,客戶端智能體就可以利用A2A協(xié)議與之進(jìn)行通信,將任務(wù)分配給它。任務(wù)管理是A2A協(xié)議中的一個(gè)重要環(huán)節(jié),協(xié)議定義了一個(gè)“任務(wù)”對(duì)象,這個(gè)對(duì)象具有自己的生命周期。
對(duì)于一些簡(jiǎn)單的任務(wù),可能可以立即完成;而對(duì)于一些復(fù)雜的、長(zhǎng)期的任務(wù),智能體們可以相互溝通,以保持對(duì)任務(wù)完成狀態(tài)的同步。當(dāng)任務(wù)完成時(shí),其輸出被稱為“工件”。此外,A2A還支持智能體之間的協(xié)作,智能體們可以相互發(fā)送消息,這些消息可以包含上下文信息、回復(fù)、工件或者用戶指令,從而更好地協(xié)同工作,共同完成復(fù)雜的任務(wù)。最后,A2A還具備用戶體驗(yàn)協(xié)商的功能,每條消息都包含“部分”,這些部分是完整的內(nèi)容片段,例如生成的圖像。每個(gè)部分都有指定的內(nèi)容類型,這使得客戶端和遠(yuǎn)程智能體能夠協(xié)商所需的正確格式,并且明確包括用戶界面能力的協(xié)商,比如iframe、視頻、網(wǎng)絡(luò)表單等,從而根據(jù)用戶的需求和設(shè)備的能力,提供最佳的用戶體驗(yàn)。
(舉報(bào))