中文字幕欧美日韩|日韩性色一区二区三区|精品久久久久久久久久岛国|一区二区国产盗摄精品

    <td id="h1kkc"><tr id="h1kkc"></tr></td><noscript id="h1kkc"><tbody id="h1kkc"></tbody></noscript>
    <rp id="h1kkc"></rp>
    首頁(yè) > 業(yè)界 > 關(guān)鍵詞  > Ghostbuster最新資訊  > 正文

    Ghostbuster:一個(gè)準(zhǔn)確度高的AI生成文本檢測(cè)工具

    2023-11-15 11:19 · 稿源:站長(zhǎng)之家

    **劃重點(diǎn):**

    1. ?? 大型語(yǔ)言模型如ChatGPT的高效寫作引發(fā)問題,學(xué)生濫用以代寫作業(yè),一些學(xué)校因此禁用ChatGPT。

    2. ??? Ghostbuster是一種先進(jìn)的AI生成文本檢測(cè)方法,通過評(píng)估各種生成文本的可能性,無(wú)需了解具體模型或其概率。

    3. ?? Ghostbuster在多個(gè)領(lǐng)域、不同提示和模型上取得了出色的性能,彌補(bǔ)了現(xiàn)有方法的不足,有望在多個(gè)應(yīng)用中發(fā)揮作用。

    站長(zhǎng)之家(ChinaZ.com)11月15日 消息:大語(yǔ)言模型如ChatGPT,以其卓越的寫作能力引發(fā)了問題。學(xué)生們紛紛利用這些模型代寫作業(yè),導(dǎo)致一些學(xué)校不得不采取禁止ChatGPT的措施。此外,這些模型還存在生成帶有事實(shí)錯(cuò)誤的文本的傾向,因此謹(jǐn)慎的讀者可能想知道,在信任某些新聞文章或其他來(lái)源之前,是否有生成式AI工具用于代寫。

    image.png

    針對(duì)這一問題,研究人員提出了Ghostbuster這一先進(jìn)的AI生成文本檢測(cè)方法。該方法通過評(píng)估文檔中每個(gè)標(biāo)記在多個(gè)較弱的語(yǔ)言模型下生成的概率,然后將這些概率的函數(shù)作為最終分類器的輸入進(jìn)行組合。Ghostbuster無(wú)需知道生成文檔所使用的具體模型,也無(wú)需知道在該特定模型下生成文檔的概率。這使得Ghostbuster特別適用于檢測(cè)由未知模型或黑盒模型生成的文本,例如流行的商業(yè)模型ChatGPT和Claude,其概率不可用。研究人員著重確保Ghostbuster具有良好的泛化性能,因此他們?cè)诓煌I(lǐng)域(使用新收集的散文、新聞和故事數(shù)據(jù)集)、語(yǔ)言模型或提示下進(jìn)行了評(píng)估。

    為什么選擇這種方法呢?

    當(dāng)前許多AI生成文本檢測(cè)系統(tǒng)對(duì)于分類不同類型的文本(例如不同的寫作風(fēng)格、或不同的文本生成模型或提示)往往表現(xiàn)脆弱。簡(jiǎn)單使用困惑度(perplexity)的模型通常無(wú)法捕捉更復(fù)雜的特征,在新的寫作領(lǐng)域表現(xiàn)尤為糟糕。與此相反,基于大型語(yǔ)言模型(如RoBERTa)的分類器雖然能輕松捕捉復(fù)雜特征,但容易對(duì)訓(xùn)練數(shù)據(jù)過擬合且泛化性能差。Ghostbuster的方法在這兩者之間取得了平衡,既能夠捕捉復(fù)雜特征,又不容易過擬合。

    如何運(yùn)作

    Ghostbuster 采用三階段訓(xùn)練過程:計(jì)算概率、選擇特征和分類器訓(xùn)練。

    計(jì)算概率:通過計(jì)算在一系列較弱的語(yǔ)言模型(一個(gè)一元模型、一個(gè)三元模型和兩個(gè)非指令調(diào)整的 GPT-3模型)下生成文檔中每個(gè)單詞的概率,將每個(gè)文檔轉(zhuǎn)換為一系列向量、艾達(dá)和達(dá)芬奇)。

    選擇特征:使用結(jié)構(gòu)化搜索過程來(lái)選擇特征,其工作原理是(1)定義一組組合概率的向量和標(biāo)量運(yùn)算,以及(2)使用前向特征選擇搜索這些操作的有用組合,重復(fù)添加最好的剩余特征。

    分類器訓(xùn)練:根據(jù)最佳的基于概率的特征和一些額外的手動(dòng)選擇的特征訓(xùn)練了線性分類器。

    Ghostbuster準(zhǔn)確率表現(xiàn)

    在同一領(lǐng)域訓(xùn)練和測(cè)試時(shí),Ghostbuster在所有三個(gè)數(shù)據(jù)集上取得了99.0的F1分?jǐn)?shù),超過GPTZero5.9F1和DetectGPT41.6F1。在領(lǐng)域之外,Ghostbuster在所有條件下平均取得了97.0的F1,超過DetectGPT39.6F1和GPTZero7.5F1。與此相對(duì),我們的RoBERTa基線在所有數(shù)據(jù)集的領(lǐng)域內(nèi)評(píng)估時(shí)取得了98.1的F1,但其泛化性能不一致。Ghostbuster在所有領(lǐng)域上的性能均優(yōu)于RoBERTa,僅在領(lǐng)域之外的創(chuàng)意寫作中稍遜一籌,但總體上比RoBERTa在領(lǐng)域之外的性能更好(13.8F1差距)。

    為了確保Ghostbuster對(duì)用戶可能提示模型的各種方式的魯棒性,例如請(qǐng)求不同的寫作風(fēng)格或閱讀水平,研究人員評(píng)估了Ghostbuster對(duì)多個(gè)提示變體的魯棒性。Ghostbuster在這些提示變體上的性能優(yōu)于所有其他測(cè)試方法,達(dá)到99.5的F1。為了測(cè)試對(duì)模型的跨域泛化,研究人員在Claude生成的文本上評(píng)估了Ghostbuster的性能,結(jié)果Ghostbuster也在92.2的F1上超過了所有其他測(cè)試方法。

    image.png

    AI生成文本檢測(cè)器曾被輕微編輯生成的文本所欺騙。研究人員檢查了Ghostbuster對(duì)編輯的魯棒性,例如交換句子或段落,重新排列字符,或用同義詞替換單詞。大多數(shù)在句子或段落級(jí)別的更改并沒有顯著影響性能,盡管如果文本通過重復(fù)改寫,使用商業(yè)檢測(cè)規(guī)避器(如Undetectable AI)或進(jìn)行大量單詞或字符級(jí)別的更改,則性能會(huì)平穩(wěn)下降。性能在較長(zhǎng)的文檔上也表現(xiàn)最佳。

    由于AI生成文本檢測(cè)器可能會(huì)將非母語(yǔ)英語(yǔ)的文本誤判為AI生成的文本,研究人員評(píng)估了Ghostbuster對(duì)非母語(yǔ)英語(yǔ)寫作的性能。所有測(cè)試模型在三個(gè)測(cè)試數(shù)據(jù)集中的兩個(gè)上都具有95%以上的準(zhǔn)確率,但在第三組較短的散文中表現(xiàn)較差。然而,文檔長(zhǎng)度可能是主要因素,因?yàn)镚hostbuster在這些文檔上的表現(xiàn)幾乎與其在其他長(zhǎng)度相似的領(lǐng)域之外文檔上的表現(xiàn)一樣好(74.7F1),后者的F1在75.6到93.1之間。

    希望將Ghostbuster應(yīng)用于潛在的文本生成的禁區(qū)使用的用戶應(yīng)該注意,對(duì)于較短的文本、遠(yuǎn)離Ghostbuster訓(xùn)練領(lǐng)域的領(lǐng)域(例如不同的英語(yǔ)變體)、非英語(yǔ)母語(yǔ)的文本、人工編輯的模型生成或通過提示AI模型修改人工創(chuàng)作的文本,錯(cuò)誤更有可能發(fā)生。為了避免延續(xù)算法傷害,我們強(qiáng)烈不建議在沒有人類監(jiān)督的情況下自動(dòng)懲罰所謂的文本生成使用。相反,我們建議在分類某人的寫作為AI生成可能會(huì)對(duì)其造成傷害時(shí),謹(jǐn)慎使用Ghostbuster的人機(jī)協(xié)同使用。Ghostbuster還可以在一系列較低風(fēng)險(xiǎn)的應(yīng)用中發(fā)揮作用,包括從語(yǔ)言模型訓(xùn)練數(shù)據(jù)中過濾AI生成的文本,并檢查在線信息源是否為AI生成。

    Ghostbuster是一種先進(jìn)的AI生成文本檢測(cè)模型,在測(cè)試的領(lǐng)域中取得了99.0的F1性能,相較現(xiàn)有模型取得了實(shí)質(zhì)性的進(jìn)展。它在不同領(lǐng)域、提示和模型上表現(xiàn)良好,對(duì)于識(shí)別來(lái)自黑盒或未知模型的文本非常合適,因?yàn)樗鼰o(wú)需訪問生成文檔的具體模型的概率。

    image.png

    Ghostbuster未來(lái)的方向包括為模型決策提供解釋和提高對(duì)試圖欺騙檢測(cè)器的攻擊的魯棒性。AI生成文本檢測(cè)方法還可以與水印等替代方法一起使用。研究人員還希望Ghostbuster能在過濾語(yǔ)言模型訓(xùn)練數(shù)據(jù)或標(biāo)記網(wǎng)絡(luò)上的AI生成內(nèi)容等各種應(yīng)用中發(fā)揮作用。

    工具地址:https://ghostbuster.app/

    論文網(wǎng)址:https://arxiv.org/abs/2305.15047

    github項(xiàng)目網(wǎng)址:https://github.com/vivek3141/ghostbuster

    大家嘗試在這里猜測(cè)文本是否是人工智能生成的:ghostbuster.app/experiment

    舉報(bào)

    • 相關(guān)推薦
    • ChatGPT上線圖庫(kù)功能:可管理AI生成圖片

      快科技4月16日消息,據(jù)報(bào)道,OpenAI近日宣布將為ChatGPT推出全新的Image Library圖庫(kù)功能,該功能將幫助用戶更高效地管理和查看AI生成的圖像。這項(xiàng)創(chuàng)新功能將逐步向所有用戶開放,包括移動(dòng)端和網(wǎng)頁(yè)端的免費(fèi)版、Plus版及Pro版用戶。新功能的設(shè)計(jì)充分考慮了用戶體驗(yàn)的便捷性。用戶只需點(diǎn)擊ChatGPT側(cè)邊欄的Library入口,就能進(jìn)入一個(gè)直觀的圖像網(wǎng)格界面。在這個(gè)界面中,用戶可以輕?

    • 日銷破千元!AI生成的3D梗圖掛件,被我們賣爆了

      先說結(jié)論:我們花15天做的AI3D掛件,在線下賣爆了,單日營(yíng)收破千元!故事的開始,是因?yàn)槲覀儼l(fā)現(xiàn)把AI3D打印手辦做成一門小生意的可行性越來(lái)越高,這也激發(fā)了我們的“搞錢基因”。再加上前不久新榜在上海舉辦了「新榜內(nèi)容節(jié)」,一拍即合,我們于是做了一批模型去大會(huì)現(xiàn)場(chǎng)擺攤試水!最后結(jié)果還不錯(cuò),單日最高收入突破1000元,是我們“創(chuàng)業(yè)史”上的一個(gè)高光表現(xiàn)。歡迎大家

    • GPTBots 集成阿里通義千問 3.0,持續(xù)為企業(yè)提供頂尖 AI 服務(wù)

      GPTBots.ai平臺(tái)宣布完成與阿里通義千問3.0系列模型的技術(shù)集成,成為企業(yè)級(jí)AI智能體構(gòu)建領(lǐng)域的標(biāo)桿平臺(tái)。該平臺(tái)通過混合推理架構(gòu)和多語(yǔ)言交互技術(shù),支持119種語(yǔ)言服務(wù),覆蓋全球主要市場(chǎng)。平臺(tái)提供雙模式智能任務(wù)處理:針對(duì)復(fù)雜業(yè)務(wù)場(chǎng)景的"深度思考"模式,以及高頻咨詢的"即時(shí)響應(yīng)"模式。搭載Qwen-3-235B旗艦?zāi)P秃蚎wen-3-30B輕量版,在代碼生成、數(shù)學(xué)推理等核心能力上達(dá)到行業(yè)頂尖水平。平臺(tái)實(shí)現(xiàn)與企業(yè)ERP、CRM等系統(tǒng)的無(wú)縫對(duì)接,推動(dòng)數(shù)據(jù)價(jià)值變現(xiàn)。通過標(biāo)準(zhǔn)化流程自動(dòng)化、全球化服務(wù)等核心價(jià)值,幫助企業(yè)提升運(yùn)營(yíng)效率70%、降低客服成本70%,并實(shí)現(xiàn)數(shù)據(jù)驅(qū)動(dòng)的決策升級(jí)。

    • 低端顯卡登上AI的大船!6GB顯存就能生成質(zhì)量視頻

      快科技4月20日消息,GitHub的Lvmin Zhang聯(lián)合斯坦福大學(xué)的Maneesh Agrawala,發(fā)布了一項(xiàng)突破性的新技術(shù)FramePack,通過在視頻擴(kuò)散模型中使用固定長(zhǎng)度的時(shí)域上下文,可以更高效地生成時(shí)間更長(zhǎng)、質(zhì)量更高的視頻。根據(jù)實(shí)測(cè),基于FramePack構(gòu)建的130億參數(shù)模型,只需一塊6GB顯存的顯卡,就能生成60秒鐘的視頻。FramePack是一種神經(jīng)網(wǎng)絡(luò)架構(gòu),使用多級(jí)優(yōu)化策略,完成本地AI視頻生成。目前,?

    • MAXHUB打造AI+電腦,讓辦公從“人適應(yīng)工具”到“工具服務(wù)人”

      數(shù)字化轉(zhuǎn)型趨勢(shì)下,企業(yè)正在思考,如何用人工智能重塑辦公效率,“AI PC”的概念也成為計(jì)算機(jī)行業(yè)的熱門話題。 4 月 16 日,InfoComm China2025 現(xiàn)場(chǎng),MAXHUB發(fā)布全新一代AI+電腦,以AI技術(shù)為支點(diǎn),重構(gòu)結(jié)構(gòu)與應(yīng)用,實(shí)現(xiàn)辦公范式革新。AI+PC深度融合,打造更懂用戶的辦公電腦傳統(tǒng)的辦公流程中,用戶被迫消耗大量精力應(yīng)對(duì)設(shè)備操作與運(yùn)維瑣事——整理散亂文檔、轉(zhuǎn)換文件格式、切

    • AI日?qǐng)?bào): OpenAI推出gpt-image-1圖像生成API;納米AI發(fā)布MCP萬(wàn)能工具箱;中國(guó)占全球AI專利60%

      【AI日?qǐng)?bào)】欄目聚焦人工智能領(lǐng)域最新動(dòng)態(tài):1) OpenAI推出ChatGPT圖像生成API,開發(fā)者可輕松集成AI繪圖功能,已生成超7億張圖片;2) 谷歌Gemini月活用戶突破3.5億,但仍落后于ChatGPT的6億用戶;3) OpenAI預(yù)測(cè)2029年收入將達(dá)1250億美元,AI代理業(yè)務(wù)成主要增長(zhǎng)點(diǎn);4) Ostris發(fā)布8B參數(shù)擴(kuò)散模型Flex.2-preview,優(yōu)化ComfyUI工作流;5) 英偉達(dá)推出多模態(tài)LLM模型Describe Anything,支持指定區(qū)域生成詳細(xì)描?

    • Create2025百AI開發(fā)者大會(huì)舉行 文心4.5 Turbo、X1 Turbo發(fā)布

      百度在武漢舉辦Create2025+AI開發(fā)者大會(huì),李彥宏強(qiáng)調(diào)AI應(yīng)用創(chuàng)造價(jià)值的關(guān)鍵。他指出當(dāng)前AI模型迭代加速,MCP成為行業(yè)標(biāo)準(zhǔn),但開發(fā)者擔(dān)憂應(yīng)用快速過時(shí)。李彥宏建議開發(fā)者選對(duì)場(chǎng)景和基礎(chǔ)模型,并學(xué)習(xí)調(diào)優(yōu)方法。百度發(fā)布文心大模型4.5 Turbo和X1 Turbo,價(jià)格大幅下降80%和50%,性能提升且成本更低,為開發(fā)者提供更實(shí)惠高效的工具選擇。

    • AI日?qǐng)?bào):百文心4.5 Turbo將于4月25日發(fā)布;谷歌推全新智能體開放協(xié)議A2A;視頻號(hào)整治不當(dāng)使用AI工具直播行為

      歡迎來(lái)到【AI日?qǐng)?bào)】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容,聚焦開發(fā)者,助你洞悉技術(shù)趨勢(shì)、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/1、百度官宣:文心大模型4.5Turbo將于4月25日發(fā)布百度宣布將在4月25日的Create大會(huì)上發(fā)布文心大模型4.5Turbo,盡管具體細(xì)節(jié)尚未披露,但業(yè)界對(duì)此充滿期待。雖然試用期間無(wú)需綁定信用卡,但實(shí)際使用需購(gòu)買托管計(jì)劃。

    • Create2025百AI開發(fā)者大會(huì)上熱搜 4.5Turbo、X1Turbo發(fā)布

      百度在武漢舉辦2025AI開發(fā)者大會(huì),正式發(fā)布文心大模型4.5Turbo和X1Turbo兩大版本。4.5Turbo在多模態(tài)處理能力上實(shí)現(xiàn)突破,支持文本、圖像、語(yǔ)音跨模態(tài)交互,調(diào)用成本較前代直降80%,僅為競(jìng)品價(jià)格的40%。X1Turbo強(qiáng)化深度推理能力,價(jià)格較上代降50%,成本僅占競(jìng)品的25%。兩款產(chǎn)品圍繞"多模態(tài)、強(qiáng)推理、低成本"三大特性展開,其中4.5Turbo提升邏輯推理與代碼生成效率,X1Turbo支持多步驟復(fù)雜推理和跨工具調(diào)用能力。百度此次定價(jià)策略極具競(jìng)爭(zhēng)力,4.5Turbo成本降至行業(yè)主流水平的1/5,瞄準(zhǔn)中小企業(yè)及個(gè)人開發(fā)者;X1Turbo雖定位高端,但成本僅為競(jìng)品1/4,主要面向科研機(jī)構(gòu)、金融分析等高要求領(lǐng)域。

    • 449元 真我Buds Air7 Pro發(fā)布:53dB真我最強(qiáng)降噪、AI同傳

      快科技4月23日消息,今日,真我Buds Air7 Pro耳機(jī)發(fā)布,售價(jià)449元。真我Buds Air7 Pro是該價(jià)位段首款采用全金屬航空鋁設(shè)計(jì)的耳機(jī),可選速沙白、熾焰紅、銀石灰、風(fēng)馳綠四種配色。耳機(jī)搭載11mm低音單元和6mm微平面高音單元,支持LHDC5.0高清傳輸協(xié)議,獲得Hi-Res小金標(biāo)認(rèn)證,192kHz采樣率、1000kbps傳輸速率。真我Buds Air7 Pro支持自定義調(diào)整高、中、低三個(gè)頻段,支持3D空間音效。耳機(jī)降噪深度高達(dá)53dB、5000Hz最高降噪頻寬,是真我史上最強(qiáng)降噪性能,支持自適應(yīng)降噪。此外,真我Buds Air7 Pro還支持AI同聲傳譯、實(shí)時(shí)對(duì)話翻譯,支持32種外

    熱文

    • 3 天
    • 7天