文章概要:
1. 富士通宣布推出兩項(xiàng)新的人工智能信任技術(shù),旨在提高對(duì)話型人工智能模型的可靠性,包括檢測(cè)幻覺(jué)和對(duì)抗性攻擊的技術(shù)。
2. 這些新技術(shù)將集成到富士通的人工智能平臺(tái)“Kozuchi”中,旨在為企業(yè)和個(gè)人用戶提供工具,評(píng)估對(duì)話型人工智能回復(fù)的可靠性,增強(qiáng)人工智能的安全性。
3. 這些技術(shù)的應(yīng)用領(lǐng)域廣泛,將有助于保護(hù)企業(yè)免受虛假信息、釣魚(yú)攻擊等威脅,從而促進(jìn)更安全的人工智能使用。
站長(zhǎng)之家(ChinaZ.com)9月26日 消息:富士通于2023年9月26日宣布推出兩項(xiàng)新的人工智能(AI)信任技術(shù),旨在提高對(duì)話型人工智能模型的可靠性,從而增強(qiáng)其在各種用例中的安全性。這兩項(xiàng)新技術(shù)包括檢測(cè)對(duì)話型人工智能模型中的幻覺(jué)以及檢測(cè)通過(guò)注入虛假信息進(jìn)行的對(duì)抗性攻擊所植入的網(wǎng)絡(luò)釣魚(yú)網(wǎng)址的技術(shù)。
第一項(xiàng)技術(shù)旨在高度精確地檢測(cè)對(duì)話型人工智能回復(fù)中的幻覺(jué)。在業(yè)務(wù)運(yùn)營(yíng)中,企業(yè)經(jīng)常使用對(duì)話型人工智能來(lái)提取與問(wèn)題相關(guān)的信息,并將這些數(shù)據(jù)作為參考信息添加到向外部對(duì)話型人工智能提問(wèn)時(shí)。盡管這種方法提供了準(zhǔn)確的回復(fù)并減少了幻覺(jué),但完全防止幻覺(jué)仍然是一個(gè)持續(xù)存在的問(wèn)題。這是因?yàn)閷?duì)話型人工智能在某些情況下無(wú)法正確提取與問(wèn)題相關(guān)的信息,從而創(chuàng)建不相關(guān)或不正確的回復(fù)。
圖源備注:圖片由AI生成,圖片授權(quán)服務(wù)商Midjourney
為了計(jì)算高度精確的幻覺(jué)評(píng)分,新技術(shù)首先將人工智能的回復(fù)分為三個(gè)部分(主語(yǔ)、謂語(yǔ)、賓語(yǔ)等),然后自動(dòng)識(shí)別回復(fù)中的命名實(shí)體。接下來(lái),技術(shù)將這些命名實(shí)體留空,并反復(fù)向外部人工智能提問(wèn),以更準(zhǔn)確地定義這些特定表達(dá)方式。根據(jù)使用WikiBio GPT-3幻覺(jué)數(shù)據(jù)集等開(kāi)放數(shù)據(jù)進(jìn)行的基準(zhǔn)測(cè)試顯示,相對(duì)于其他用于檢測(cè)AI幻覺(jué)的先進(jìn)方法,如SelfCheckGPT,該技術(shù)可以將檢測(cè)的準(zhǔn)確性(AUC-ROC)提高約22%。
第二項(xiàng)技術(shù)旨在檢測(cè)對(duì)話型人工智能回復(fù)中植入的網(wǎng)絡(luò)釣魚(yú)網(wǎng)址。由于對(duì)話型人工智能基于其訓(xùn)練數(shù)據(jù)創(chuàng)建回復(fù),惡意實(shí)體可以通過(guò)在人工智能訓(xùn)練數(shù)據(jù)中注入惡意信息,欺騙人工智能以創(chuàng)建包含操縱信息的回復(fù),例如導(dǎo)致虛假網(wǎng)站的網(wǎng)絡(luò)釣魚(yú)網(wǎng)址。
為了解決這個(gè)問(wèn)題,富士通開(kāi)發(fā)了一項(xiàng)技術(shù),用于檢測(cè)對(duì)話型人工智能回復(fù)中的操縱網(wǎng)址。一旦技術(shù)識(shí)別出網(wǎng)絡(luò)釣魚(yú)網(wǎng)址,它將向用戶發(fā)出警告消息。這項(xiàng)新技術(shù)不僅可以檢測(cè)網(wǎng)絡(luò)釣魚(yú)網(wǎng)址,還可以增強(qiáng)人工智能模型對(duì)現(xiàn)有攻擊的抵抗力,以確保其提供高度可靠的回復(fù)。該技術(shù)是在富士通與以色列本古里安大學(xué)的合作下共同開(kāi)發(fā)的,利用了惡意實(shí)體通常攻擊單一類(lèi)型的人工智能模型的傾向,通過(guò)使用不同的人工智能模型處理信息并評(píng)估判斷結(jié)果的合理性差異來(lái)檢測(cè)惡意數(shù)據(jù)。此技術(shù)不僅可用于檢測(cè)網(wǎng)絡(luò)釣魚(yú)網(wǎng)址,還可用于預(yù)防欺騙使用表格數(shù)據(jù)的人工智能模型的一般攻擊,從而避免對(duì)其他服務(wù)的攻擊。
這兩項(xiàng)新技術(shù)將納入富士通的對(duì)話型人工智能核心引擎中,通過(guò)“富士通Kozuchi(代號(hào))-富士通AI平臺(tái)”提供給用戶,使用戶可以訪問(wèn)廣泛的強(qiáng)大人工智能和機(jī)器學(xué)習(xí)技術(shù)。檢測(cè)對(duì)話型人工智能中的幻覺(jué)的技術(shù)將于2023年9月28日起提供給日本用戶,而檢測(cè)對(duì)話型人工智能回復(fù)中的網(wǎng)絡(luò)釣魚(yú)網(wǎng)址的技術(shù)將于2023年10月起提供。這兩項(xiàng)新技術(shù)將通過(guò)Kozuchi提供給企業(yè)用戶作為演示環(huán)境,并通過(guò)專用門(mén)戶網(wǎng)站提供給個(gè)人用戶。富士通計(jì)劃將這兩項(xiàng)新技術(shù)未來(lái)推廣到全球市場(chǎng)。
(舉報(bào))