亚洲欧美国产中文,伊人222成人综合网,免费国产a国产片高清下载app,最近最新中文字幕免费高清1

電話咨詢 在線咨詢 產(chǎn)品定制
電話咨詢 在線咨詢 產(chǎn)品定制
010-68321050

我國智能語音技術(shù)尚處于語音識別階段,魯棒性問題短期難以解決

杜一明 2019-09-26 1797 0

專屬客服號

微信訂閱號

大數(shù)據(jù)治理

全面提升數(shù)據(jù)價值

賦能業(yè)務(wù)提質(zhì)增效

通過研究發(fā)現(xiàn),隨著智慧家居、智能客服、智慧教育等人工智能應(yīng)用層的發(fā)展,語音識別技術(shù)得到了廣泛應(yīng)用,眾多企業(yè)涌入分享智能語音行業(yè)初期紅利,我國智能語音行業(yè)已經(jīng)呈現(xiàn)出馬太效應(yīng)。目前我國智能語音技術(shù)智能化程度并不算高,語義識別、口音、語調(diào)、噪音克服等魯棒性問題將是下一階段智能語音技術(shù)攻克著力點。

摘要:通過研究發(fā)現(xiàn),隨著智慧家居、智能客服、智慧教育等人工智能應(yīng)用層的發(fā)展,語音識別技術(shù)得到了廣泛應(yīng)用,眾多企業(yè)涌入分享智能語音行業(yè)初期紅利,我國智能語音行業(yè)已經(jīng)呈現(xiàn)出馬太效應(yīng)。目前我國智能語音技術(shù)智能化程度并不算高,語義識別、口音、語調(diào)、噪音克服等魯棒性問題將是下一階段智能語音技術(shù)攻克著力點。

智能語音是語言學(xué)、數(shù)學(xué)、計算機學(xué)、以及心理學(xué)等多學(xué)科交叉應(yīng)用的結(jié)果,研究通過語音實現(xiàn)人機交互,主要包括語音識別、自然語言處理以及語音合成(由于目前研究領(lǐng)域關(guān)于語音識別與自然語言處理范疇的界定并不清晰,本文根據(jù)技術(shù)發(fā)展現(xiàn)狀按照并行關(guān)系界定)。智能語音廣泛地應(yīng)用于通信、汽車電子、家庭服務(wù)、醫(yī)療等領(lǐng)域,是人工智能發(fā)展的關(guān)鍵技術(shù)組成。

我國在智能語音領(lǐng)域進展迅猛,商業(yè)化應(yīng)用落地是主要驅(qū)動力

我國智能語音市場年平均復(fù)合增長率高于全球水平,行業(yè)存在大規(guī)模增長紅利。如圖1所示,2011年我國智能語音市場規(guī)模僅有6.3億元,之后隨著我國智能語音產(chǎn)業(yè)化發(fā)展,市場規(guī)模呈現(xiàn)出高速增長的態(tài)勢,截至2018年底我國智能語音市場規(guī)模已達到了159.7億元,期間年平均復(fù)合增長率(CAGR)高達58.7%,遠超全球30%的年平均增長水平,意味著我國智能語音擁有巨大的市場需求,行業(yè)存在大規(guī)模增長紅利,預(yù)測2019年我國智能語音市場規(guī)模將超過250億元。

圖1 2011-2018年中國智能語音市場規(guī)模以及2019年預(yù)測

(資料來源:公開資料整理,五度易鏈行業(yè)研究中心)

智能語音在不同領(lǐng)域的商業(yè)化應(yīng)用是我國智能語音行業(yè)發(fā)展的主要驅(qū)動力。全球關(guān)于語音識別的研究起始于20世紀(jì)50年代,我國同時期于1958年開始涉足語音識別領(lǐng)域,標(biāo)志性事件是中國科學(xué)院聲學(xué)所利用電子管電路識別10個元音。之后由于國內(nèi)計算機技術(shù)普及率較低以及數(shù)字信號等技術(shù)發(fā)展較為落后,我國語音識別技術(shù)發(fā)展受到了嚴(yán)重制約,逐漸被國外拉開差距。但是近些年隨著我國電子信息技術(shù)的飛躍式進步,我國在語音識別領(lǐng)域具備了比肩發(fā)達國家的發(fā)展條件,同時伴隨著人工智能以及物聯(lián)網(wǎng)的發(fā)展,語音識別技術(shù)與智能家居、智慧教育、智能客服、機器人、無人駕駛等行業(yè)不斷探索融合,并在部分領(lǐng)域已經(jīng)實現(xiàn)了商業(yè)化落地,有力推動了我國智能語音行業(yè)的發(fā)展進步,目前我國相關(guān)企業(yè)的語音識別準(zhǔn)確度普遍達到了97%。

國內(nèi)語音識別行業(yè)出現(xiàn)馬太效應(yīng),本土企業(yè)國際競爭力較弱

我國智能語音市場形成了以科大訊飛為首的一超多強的競爭格局,行業(yè)馬太效應(yīng)顯現(xiàn)。如圖2所示,科大訊飛市場占比最高,達到了44%,其次是百度市場占比為28%,二者合計占據(jù)了國內(nèi)語音識別72%的市場份額,屬于第一梯隊;其次是蘋果、Nuance等外資企業(yè);最后是國內(nèi)中小型語音識別企業(yè)。由此可見,我國語音識別行業(yè)馬太效應(yīng)已經(jīng)顯現(xiàn),科大訊飛、百度等龍頭企業(yè)依托自身品牌優(yōu)勢以及客戶優(yōu)勢將不斷穩(wěn)固自身市場地位,并占據(jù)更多市場份額,使得中小型企業(yè)以及新近企業(yè)生存難度加大。

圖2 我國智能語音市場份額占比

(資料來源:公開資料整理,五度易鏈行業(yè)研究中心)

國內(nèi)智能語音企業(yè)本土競爭力強,但國際競爭力較弱。如圖3所示,觀察全球智能語音市場競爭格局可以發(fā)現(xiàn),盡管科大訊飛依靠本土優(yōu)勢占據(jù)了國內(nèi)將近一半的市場份額,但是國際競爭力較弱,僅占據(jù)全球5%的市場份額;而Nuance以及蘋果雖然只占據(jù)國內(nèi)10%的市場份額,但是從全球范圍內(nèi)來看,二者卻占據(jù)了全球智能語音47%的市場份額。

圖3 全球智能語音市場份額占比

(資料來源:公開資料整理,五度易鏈行業(yè)研究中心)

智能語音魯棒性問題是目前阻礙智能語音發(fā)展的關(guān)鍵因素

我國智能語音尚處于識別階段,魯棒性問題將是下一階段智能語音技術(shù)攻關(guān)著力點。目前基于實驗室環(huán)境,我國智能語音識別準(zhǔn)確率普遍達到了97%以上,但是當(dāng)處于嘈雜環(huán)境中時,疊加語速、語調(diào)以及口音等因素,語音識別的準(zhǔn)確率會急劇下降,嚴(yán)重影響智能語音技術(shù)的魯棒性。另一方面,語義識別是智能語音智能化程度的主要體現(xiàn),但是受限于算法優(yōu)化進展緩慢,目前機器在語義識別方面還比較薄弱,智能語音整體上智能化程度并不算高。綜合來看,當(dāng)前智能語音面臨的魯棒性問題主要包括非期待行為與交互任務(wù)、地方口音、非母語發(fā)聲、語速、語調(diào)、聲電轉(zhuǎn)換與信道傳輸、數(shù)據(jù)搜集等,只有不斷攻克智能語音魯棒性問題,才能有效擴大當(dāng)前智能語音技術(shù)的內(nèi)涵與外延,真正實現(xiàn)智能化的人機交互。

結(jié)語

我國智能語音行業(yè)在經(jīng)歷了初期發(fā)展之后,語音識別技術(shù)已經(jīng)演進的較為成熟,但是在更深層次的語義識別、噪音過濾、語調(diào)識別等智能化方面尚未取得長足進步,嚴(yán)重阻礙了智能語音與其他行業(yè)的深度結(jié)合。下一步我國智能語音將真正進入到智能化發(fā)展階段,從而通過語音實現(xiàn)真正意義上的人機智能交互。

本文為我公司原創(chuàng),歡迎轉(zhuǎn)載,轉(zhuǎn)載請標(biāo)明出處,違者必究!

產(chǎn)業(yè)專題

申請產(chǎn)品定制

請完善以下信息,我們的顧問會在1個工作日內(nèi)與您聯(lián)系,為您安排產(chǎn)品定制服務(wù)

  • *姓名

  • *手機號

  • *驗證碼

    獲取驗證碼
    獲取驗證碼
  • *您的郵箱

  • *政府/園區(qū)/機構(gòu)/企業(yè)名稱

  • 您的職務(wù)

  • 備注