中文字幕欧美日韩|日韩性色一区二区三区|精品久久久久久久久久岛国|一区二区国产盗摄精品

    <td id="h1kkc"><tr id="h1kkc"></tr></td><noscript id="h1kkc"><tbody id="h1kkc"></tbody></noscript>
    <rp id="h1kkc"></rp>
    首頁 > 見聞 > 關鍵詞  > robots.txt最新資訊  > 正文

    谷歌開源robots.txt正推動官方網(wǎng)絡爬蟲標準

    2019-07-02 11:07 · 稿源:站長之家

    站長之家(ChinaZ.com) 7月2日 消息:據(jù)外媒報道,谷歌希望將幾十年前的拒絕蜘蛛?yún)f(xié)議 (REP)變成為官方互聯(lián)網(wǎng)標準。為了推動該項計劃,谷歌正在制作自己的 robots.txt 解析器開源。

    據(jù)venturebeat介紹,早在 1994 年,荷蘭軟件工程師Martijn Koster就提出了REP標準,它幾乎已經(jīng)成為網(wǎng)站用來告訴自動爬蟲程序的哪些部分不應該被處理的標準。例如谷歌的網(wǎng)頁抓取機器人Googlebot(類似百度蜘蛛)在為網(wǎng)站建立索引時會掃描robots.txt文件,以檢查應該忽略哪些部分的特殊說明。它最大限度地減少了無意義的索引,有時會隱藏敏感信息。此外,這些文件并不僅僅用于給出直接的爬行指令,還可以填充某些關鍵字,以改善搜索引擎優(yōu)化,以及其他用例。

    不過,谷歌認為需要對其爬蟲技術進行改進,該公司正在公開尋找用于解碼robots.txt解析器,試圖建立一個真正的網(wǎng)絡爬行標準。理想情況下,這將從如何揭開robots.txt文件神秘面紗,并創(chuàng)造更多通用格式。

    谷歌倡議向國際互聯(lián)網(wǎng)工程任務組提交自己方法,將“更好地定義”爬蟲應該如何處理 robots.txt,并減少一些意外。

    該草案并不完全可用,但它將不僅適用于網(wǎng)站,還包括最小文件大小、設置最大一天緩存時間以及在服務器出現(xiàn)問題時讓網(wǎng)站休息。

    舉報

    • 相關推薦
    • 全國首個!深開鴻發(fā)布基于開源鴻蒙機器人操作系統(tǒng)M-Robots OS

      今日,深開鴻宣布,正式發(fā)布全國首個基于開源鴻蒙的分布式異構多機協(xié)同機器人操作系統(tǒng)M-RobotsOS1.0。深開鴻CEO王成錄在發(fā)布會上指出:操作系統(tǒng)是機器人產(chǎn)業(yè)的魂,決定了機器人的智能化水平和生態(tài)擴展性。王成錄強調(diào),我們的目標不是替代現(xiàn)有系統(tǒng)是面向未來多機協(xié)同場景,構建全新架構。

    • AI Agent大變天!谷歌開源A2A,一夜改變智能體交互

      谷歌在GoogleCloudNext25大會上,開源了首個標準智能體交互協(xié)議——Agent2AgentProtocol。A2A將徹底打破系統(tǒng)孤島,對智能體的能力、跨平臺、執(zhí)行效率產(chǎn)生質(zhì)的改變,支持Atlassian、Box、Cohere、Intuit、Langchain、MongoDB、PayPal、Salesforce、SAP、ServiceNow、UKG和Workday等主流企業(yè)應用平臺。通過A2A協(xié)議,MongoDB可以使其數(shù)據(jù)庫服務與智能Agent相結合,實現(xiàn)更高效的數(shù)據(jù)管理和自動化數(shù)據(jù)處理。

    • 谷歌開源發(fā)布A2A協(xié)議 Agent2Agent智能體交互協(xié)議詳細介紹

      在GoogleCloudNext25大會上,谷歌宣布開源了首個標準智能體交互協(xié)議——Agent2AgentProtocol,這一舉措有望徹底改變智能體之間的交互方式,打破系統(tǒng)孤島,對智能體的能力、跨平臺協(xié)作以及執(zhí)行效率產(chǎn)生質(zhì)的飛躍。A2A協(xié)議是一種開放標準,旨在為智能體提供一種通用的交互方式,使它們能夠在不同的底層框架和供應商之間無縫協(xié)作。每個部分都有指定的內(nèi)容類型,這使得客戶端和遠程智能體能夠協(xié)商所需的正確格式,并且明確包括用戶界面能力的協(xié)商,比如iframe、視頻、網(wǎng)絡表單等,從根據(jù)用戶的需求和設備的能力,提供最佳的用戶體驗。

    • 對標OpenAI,谷歌開源Agent SDK,支持MCP、A2A、5000星

      谷歌在GoogleCloudNext25大會上,開源了首個Agent開發(fā)套件—ADK。這也是OpenAI之后第二家大廠發(fā)布的標準化智能體SDK。谷歌剛開源ADK幾天在Github已經(jīng)超過5000顆星,非常受開發(fā)者的歡迎。

    • 為了反爬蟲 GitHub部署新規(guī)則:使用中文可能被限制訪問

      據(jù)報道,GitHub部署了新的風控規(guī)則,會檢查用戶瀏覽器請求頭的語言部分,如果檢測到用戶使用的是中文(僅限zh_CN),則可能會觸發(fā)訪問限制。不過GitHub并非全面封禁中文用戶,而是將多個條件整合觸發(fā)限制,首先會檢查常規(guī)規(guī)則(如黑名單IP和UA),再檢測IP地址質(zhì)量。只有當這兩個條件全部通過后,才會檢查語言部分是否包含zh_CN,如果用戶IP質(zhì)量沒問題,通常不會觸發(fā)語?

    • 不止春晚“秧Bot” 宇樹科技新專利可演民族舞

      快科技4月18日消息,近日,宇樹科技申請的一種機器人和機器人控制方法”專利公布。據(jù)天眼查披露的專利摘要顯示,宇樹科技的新發(fā)明屬于機器人設備技術領域,該專利可用于大規(guī)模人形機器人舞蹈表演,特別是可以進行民族舞表演。該專利機器人包括機器人本體和旋轉表演件,機器人的本體上設有用于裝配旋轉表演件的手臂和用于拋動表演道具的拋出電機,旋轉表演件裝?

    • 谷歌版MCP”來了,開源A2A,不同廠商Agent也能協(xié)作

      “谷歌版MCP”來了!谷歌推出A2A協(xié)議,即Agent2Agent,能讓AIAgent在不同生態(tài)系統(tǒng)間安全協(xié)作無需考慮框架或供應商。不同平臺構建的AIAgent之間可以進行通信、發(fā)現(xiàn)彼此的能力、協(xié)商任務并開展協(xié)作,企業(yè)可通過專業(yè)Agent團隊處理復雜工作流。從各大廠最近動作來看,蕪湖,不愧是Agent元年。

    • REDMI Turbo 4 Pro官宣下周發(fā)布:同檔無敵

      快科技4月18日消息,王騰剛剛正式宣布,REDMI Turbo4Pro將于下周發(fā)布。他還介紹,K80系列全面升檔以后,產(chǎn)品力橫掃同檔,而Turbo4Pro是全面進階的產(chǎn)品,預計將替代原本K80的位置。王騰強調(diào),Pro,代表著更高規(guī)格、更高標準、更強體驗,我們的目標就是打造一款同檔無敵的全面Pro”準旗艦。REDMI Turbo4Pro將實現(xiàn)性能、質(zhì)感、續(xù)航大幅躍升。性能方面,REDMI Turbo4Pro將行業(yè)首發(fā)搭載高?

    • AI日報:阿里新模型Qwen3即將來襲;GitHub開源MCP服務器;Runway發(fā)布Gen-4 Turbo

      歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領域的熱點內(nèi)容,聚焦開發(fā)者,助你洞悉技術趨勢、了解創(chuàng)新AI產(chǎn)品應用。新鮮AI產(chǎn)品點擊了解:https://top.aibase.com/1、Qwen3即將來襲:阿里云新模型相關支持已正式合并至vLLM代碼庫阿里云的Qwen3模型即將發(fā)布,標志著其在AI領域的又一重要進展。新推出的AI聽歌報告能夠精準識別用戶音樂偏好,場景

    • GPTBots 集成阿里通義千問 3.0,持續(xù)為企業(yè)提供頂尖 AI 服務

      GPTBots.ai平臺宣布完成與阿里通義千問3.0系列模型的技術集成,成為企業(yè)級AI智能體構建領域的標桿平臺。該平臺通過混合推理架構和多語言交互技術,支持119種語言服務,覆蓋全球主要市場。平臺提供雙模式智能任務處理:針對復雜業(yè)務場景的"深度思考"模式,以及高頻咨詢的"即時響應"模式。搭載Qwen-3-235B旗艦模型和Qwen-3-30B輕量版,在代碼生成、數(shù)學推理等核心能力上達到行業(yè)頂尖水平。平臺實現(xiàn)與企業(yè)ERP、CRM等系統(tǒng)的無縫對接,推動數(shù)據(jù)價值變現(xiàn)。通過標準化流程自動化、全球化服務等核心價值,幫助企業(yè)提升運營效率70%、降低客服成本70%,并實現(xiàn)數(shù)據(jù)驅動的決策升級。