**劃重點:**
- ?? **數據領導者的調查:** 一項由Informatica進行的數據領導者調查表明,數據質量是實施生成式人工智能(GenAI)時面臨的最大障礙。
- ??? **數據管理工具和數據源:** 企業(yè)使用的數據管理工具數量以及大量企業(yè)應對1000多個獨立數據源的情況也對GenAI項目產生了影響。
- ?? **GenAI的實施和挑戰(zhàn):** 據調查,45%的公司已經以某種形式實施了GenAI,而另有53%計劃實施。
站長之家(ChinaZ.com)2月6日 消息:Informatica最新的CDO Insights2024報告揭示,對于實施生成式人工智能(GenAI),數據質量是最大的障礙。該報告基于對全球大型企業(yè)中600名數據領導者的調查,發(fā)現45%的公司已經以某種形式實施了GenAI,而另有53%計劃實施。對于幾乎沒有人在14個月前知曉的技術而言,只有2%的公司表示GenAI不適用于他們,這是一個非常低的數字。
然而,要成功實施GenAI并不像注冊一個OpenAI賬戶,讓GPT自由運行那么簡單。盡管今天的預訓練大型語言模型(LLMs)比過去的自然語言處理技術更易于使用,但擁有良好的數據仍然對于使一切正常運行至關重要,無論是從頭開始訓練模型、微調預構建模型,還是在運行時提示LLM。糟糕的數據將同樣摧毀GenAI項目,就像它會摧毀任何類型的人工智能或機器學習項目一樣。
在這方面,Informatica的調查發(fā)現,正在部署GenAI或計劃部署GenAI的數據領導者中有42%(約600人中的588人)將數據質量列為GenAI成功的頭號關切。報告顯示,其他GenAI的關切包括數據隱私和保護、AI倫理、用于培訓和微調語言模型的數據數量以及AI治理。
這些數據管理工具在Informatica的調查基礎上被廣泛使用。實際上,這家總部位于加利福尼亞州Redwood City的公司報告說,100%的調查參與者表示他們正在投資于支持數據戰(zhàn)略和優(yōu)先事項的數據管理能力,這無疑是一個很好的跡象。
然而,對Informatica來說,這個100%的數字也有一線曙光。該公司發(fā)現,58%的受訪者使用了五種或更多種數據管理工具。此外,這些數據管理工具中的大多數在49%的受訪者中并非作為云托管服務提供。
更多的數據通常意味著更多的洞察和更好的信號。但根據Informatica的說法,五分之二的公司表示他們正在處理1000個或更多個數據源。近80%的受訪者表示他們預計2024年數據源的數量將增加。
39%的數據領導者報告稱,在2024年,改善GenAI用例的數據可靠性和一致性是優(yōu)先事項。另有39%的人將在2024年設定建立數據驅動文化和提高數據素養(yǎng)的目標,而38%的人將在2024年設定改善對數據和數據流程的治理的目標。
數據管理已經成為GenAI的關鍵推動因素并非令Jitesh Ghai,Informatica的首席產品官感到驚訝。
Ghai在新聞稿中說:“毫不奇怪,無論地區(qū)還是行業(yè),生成式人工智能的實施和成功所需的數據策略仍然主導著大多數數據領導者的帶寬。”他表示:“雖然這些領導者必須克服許多技術和組織上的障礙,但很明顯,對于解鎖GenAI的巨大潛力并使企業(yè)完全掌控其不斷擴大的數據資產,全面、高度集成的數據管理能力的投資是關鍵?!?/span>
(舉報)