站長之家(ChinaZ.com) 1月5日 消息:騰訊云 ASR(Automatic Speech Recognition)是騰訊云推出的語音識別系統(tǒng)。最新升級后,騰訊云 ASR 能夠更好地處理方言和噪聲,提高識別準確率和理解能力。
在方言方面,騰訊云 ASR 可以識別23種地方言,并且能夠應對方言混戰(zhàn)的情況。通過自研的多語言混合識別引擎,騰訊云 ASR 可以快速識別并無縫切換不同方言,只需要一個引擎就能搞定。通過蒸餾算法和半監(jiān)督訓練,騰訊云 ASR 可以高效地學習已標注和未標注的數(shù)據(jù),甚至可以處理少數(shù)民族的小方言。
在語義識別方面,騰訊云 ASR 使用了大語言模型 LLM,通過上下文語義和大數(shù)據(jù)提取意圖,提升識別準確率。對于讀音相似的詞,騰訊云 ASR 也能選出正確的詞。此外,對于特殊場景或?qū)I(yè)術(shù)語,AI 也能更準確地識別。
在噪聲過濾方面,騰訊云 ASR 通過自主學習和優(yōu)化算法,訓練出抗干擾的能力。它可以自動過濾噪聲,提高識別精準度。
騰訊云 ASR 已經(jīng)在騰訊內(nèi)部產(chǎn)品和外部不同行業(yè)中廣泛應用,覆蓋了錄音質(zhì)檢、會議實時轉(zhuǎn)寫、語音輸入法等多個場景。產(chǎn)品的單日調(diào)用量達到了百億次,服務的內(nèi)外部企業(yè)客戶數(shù)達到了數(shù)千個。
體驗地址:https://cloud.tencent.com/product/asr
新鮮AI產(chǎn)品點擊了解:https://top.aibase.com/
(舉報)