36氪2019年2月18日報道,聲揚(yáng)科技voiceai已完成pre-a輪融資。voiceai主要研究技術(shù)即是聲紋識別。聲紋識別賽道作為一個正在爆發(fā)的藍(lán)海市場,涌現(xiàn)出了不少玩家,業(yè)內(nèi)人士預(yù)測,聲紋識別是指紋和人臉之后的下一個生物識別技術(shù)。聲紋識別應(yīng)用廣泛 抑或是下一風(fēng)口關(guān)于聲紋識別,簡而言之,是將聲信號轉(zhuǎn)換成電信號,再用計算機(jī)進(jìn)行識別的技術(shù)。聲紋識別作為重要的辨認(rèn)技術(shù),廣泛應(yīng)用于金融、交通、醫(yī)療、教育、旅游等公共服務(wù)領(lǐng)域認(rèn)證服務(wù)。不過,聲紋識別更大的應(yīng)用前景在于安防領(lǐng)域,比如刑偵破案、門禁、銀行交易等等。此外,在智能家居等領(lǐng)域,為了安全,也為了更好的智能體驗(yàn),比如在人聲鼎沸情境中準(zhǔn)確識別哪句話是主人下達(dá)的命令等,有人認(rèn)為它將會成為智能家居未來發(fā)展的關(guān)鍵,抑或是語音交互的下一個風(fēng)口。從其發(fā)展前景而言,聲紋識別的市場潛力巨大,前景可觀。如今,在聲紋識別需求日益增長的情況下,投身于聲紋識別的企業(yè)開始崛起,部分并已取得了不錯的成果。比如國外的nuance、voicevault、voice biometrics、phonefactor,或是國內(nèi)的科大訊飛、中科信利、廈門天聰、上海電虹等。人們何以看重聲紋識別?人工智能主要有三個研究方向:視覺識別、智能語音、自然語言處理nlp。其中,在語音識別領(lǐng)域,聲紋識別屬于相對藍(lán)海市場,解決的主要是“我是我”的問題,多應(yīng)用在安全驗(yàn)證場景。在語音轉(zhuǎn)文字賽道,各家的效果可能趨于0.1%、0.2%的差距,為了避免同質(zhì)化競爭,許多公司選擇從“聲紋識別”切入。聲紋識別相對于其他生物識別大的優(yōu)勢主要體現(xiàn)在以下幾點(diǎn): 一是非接觸式識別,相對于指紋識別而言,它更加便捷;二是降低侵犯隱私風(fēng)險,相對于人臉識別而言,社會大眾對于聲紋識別的抵觸大大降低,隨便采集到的一段話便可以進(jìn)行聲紋識別;三是獲取語音的識別成本低,相對于人臉識別、指紋識別等,聲紋識別只要求麥克風(fēng)便可以進(jìn)行采集。從近幾年情形可以看出,相比于指紋識別、人臉識別等生物識別技術(shù),聲紋識別是“低調(diào)”的,但市場需求的確存在,且市場熱度也有上升趨勢。聲紋識別難以成為“獨(dú)行俠”盡管前景可觀,但就目前而言,聲紋識別要想真正成熟并落地,還需要克服一些難題。與其他類型識別一樣,聲紋識別訓(xùn)練也需要龐大的數(shù)據(jù)積累及對數(shù)據(jù)的標(biāo)注,并且難上加難:聲紋識別訓(xùn)練庫的建立,至少要保證性別比例分布為50%±5%,包含有不同年齡段、不同地域、不同口音、不同職業(yè)。同時,測試樣本應(yīng)該涵蓋文本內(nèi)容是否相關(guān)、采集設(shè)備、傳輸信道、環(huán)境噪音、錄音回放、聲音模仿、時間跨度、采樣時長、健康狀況和情感因素等影響聲紋識別性能的主要因素。因此嚴(yán)格說來,聲紋識別當(dāng)“獨(dú)行俠”的機(jī)會微乎其微。只有在智能家居等相對局限的場景中才能夠獨(dú)立提供服務(wù)。在更多場景下,則是通過與人臉、語音等其他識別技術(shù)配合,進(jìn)行身份確認(rèn)。聲紋識別對數(shù)據(jù)的要求其實(shí)比語音識別還要高很多,這條路會很難。但慶幸的是,我國目前也有許多ai初創(chuàng)公司在堅持做拓荒者。用speakin的coo易鵬宇所說,“這不正是創(chuàng)業(yè)者需要做的事嗎?”