要點:
微軟與弗吉尼亞理工大學(xué)合作,提出“思維算法”新訓(xùn)練方法,目的是使大語言模型如ChatGPT在推理上更高效、更具人類思維邏輯。
“思維算法”通過組織模型有序地探索不同解決方案,融合了人類直觀認知與算法邏輯思維的優(yōu)勢。
研究人員認為,這種方法可以指導(dǎo)模型高效解決復(fù)雜實際問題,還可減少模型的碳足跡。
站長之家(ChinaZ.com)9月1日 消息:微軟公司推出了一種名為“思維算法”(AoT)的全新AI訓(xùn)練方法,旨在提高大型語言模型(如ChatGPT)在推理能力方面的效率和人類相似度。
對于已經(jīng)在人工智能領(lǐng)域進行大量投資的公司來說,這是自然的發(fā)展步驟,尤其是對OpenAI——DALL-E、ChatGPT和功能強大的GPT語言模型的創(chuàng)造者。
根據(jù)發(fā)表的研究論文,微軟表示,AoT技術(shù)是一種潛在的游戲規(guī)則改變者,因為它“引導(dǎo)語言模型通過更簡化的問題解決路徑”。這種新穎的方法利用了“上下文學(xué)習”,使模型能夠系統(tǒng)地以有組織的方式探索不同的解決方案。
“我們的方法優(yōu)于先前的單查詢方法,并與最近采用廣泛樹搜索的多查詢方法相當。有趣的是,我們的結(jié)果表明,使用算法指導(dǎo)模型可以導(dǎo)致性能超過算法本身?!?/p>
研究人員聲稱,當這種技術(shù)優(yōu)化其搜索過程時,模型獲得了改進的“直覺”。
人機混合算法?AoT方法解決了當前上下文學(xué)習技術(shù)(如“思維鏈”)的限制。有時,CoT提供錯誤的中間步驟,而AoT則使用算法示例來指導(dǎo)模型,以獲得更可靠的結(jié)果。
AoT從人和機器中汲取靈感,以提高生成型AI模型的性能。雖然人類在直觀認知方面表現(xiàn)出色,但算法以其有組織的、詳盡的探索而聞名。研究論文稱,“思維算法”尋求將這兩種方面融合起來,增強大型語言模型的推理能力。
微軟表示,這種混合技術(shù)使模型能夠克服人類工作記憶的限制,從而能夠更全面地分析想法。
與CoT的線性推理或“思維樹”(ToT)技術(shù)不同,AoT允許對子問題的不同選項進行靈活的思考,只需最少的提示就能保持有效性。它還與外部樹搜索工具相媲美,有效地平衡成本和計算。
總的來說,AoT代表了從監(jiān)督學(xué)習到整合搜索過程的轉(zhuǎn)變。通過改進提示工程,研究人員相信這種方法可以使模型高效地解決復(fù)雜的現(xiàn)實世界問題,同時也減少它們的碳足跡。
鑒于其在人工智能領(lǐng)域的大量投資,微軟似乎有能力將AoT納入像GPT-4這樣的先進系統(tǒng)。盡管具有挑戰(zhàn)性,但教導(dǎo)語言模型以更人性化的方式進行“思考”可能會帶來革命性的變革。
(舉報)