老羅大秀語(yǔ)音識(shí)別 但它真的重要嗎?
老羅在發(fā)布會(huì)上現(xiàn)場(chǎng)展示語(yǔ)音識(shí)別確實(shí)驚艷了一把,但語(yǔ)音識(shí)別真的是發(fā)展的重點(diǎn)嗎?
如果沒(méi)有人工智能,語(yǔ)音識(shí)別如同雞肋,食之無(wú)味,棄之可惜。
http://www.brrgbq.cn/Uploads/Bingdu/2016-10-19/58072b0c361ea.jpg
1
科客網(wǎng)
http://www.brrgbq.cn/news/14788.html
科客點(diǎn)評(píng):如果沒(méi)有人工智能,語(yǔ)音識(shí)別如同雞肋,食之無(wú)味,棄之可惜。
在10月18日晚上的錘子手機(jī)發(fā)布會(huì)上,老羅現(xiàn)場(chǎng)展示了科大訊飛97%正確率的語(yǔ)音輸入。時(shí)間定格于發(fā)布會(huì)106分40秒,在老羅一陣碎碎念之后的不到一秒之內(nèi),文字轉(zhuǎn)換完成。其轉(zhuǎn)換速度之快,準(zhǔn)確率之高以及現(xiàn)場(chǎng)展示的特殊環(huán)境,都讓人驚艷了一把。
語(yǔ)音識(shí)別實(shí)用嗎?
事實(shí)上,語(yǔ)音輸入并不是什么新鮮詞,但這次借助老羅的“單口相聲”,語(yǔ)音輸入又跳到眾人視線中。令人奇怪的是,訊飛的語(yǔ)音輸入在很早以前就有了,這次展示卻令我們有種重新認(rèn)識(shí)語(yǔ)音輸入的感覺(jué)。
幾年前,語(yǔ)音輸入的準(zhǔn)確率也不低,基本都有90%以上。然而,放到實(shí)際生活中,語(yǔ)音輸入的實(shí)用性仍然不是很高。在使用語(yǔ)音輸入的時(shí)候,其準(zhǔn)確率會(huì)受到非常多的因素影響,在不同的環(huán)境下使用會(huì)有差別,在不同使用者的口音下更是差別巨大。
但放到今天,語(yǔ)音識(shí)別還是不實(shí)用嗎?
應(yīng)該說(shuō),由于準(zhǔn)確率的提高,語(yǔ)音識(shí)別的實(shí)用性對(duì)普通用戶來(lái)說(shuō)有所上升。但從科客的實(shí)際體驗(yàn)來(lái)說(shuō),哪怕是訊飛,其準(zhǔn)確率仍然受限于使用者的音量、發(fā)音標(biāo)準(zhǔn)程度、環(huán)境干擾諸多因素。其中最大的影響因素應(yīng)該是口音。拿廣東地區(qū)來(lái)說(shuō),光是粵語(yǔ),不同地區(qū)的人發(fā)音都有所區(qū)別。對(duì)于人類(lèi)來(lái)說(shuō),我們可以較為輕松的識(shí)別不同口音,并較為準(zhǔn)確領(lǐng)會(huì)他人表達(dá)的意思。然而對(duì)機(jī)器而言,它就需要更大的數(shù)據(jù)庫(kù)。倘若哪一天,語(yǔ)音輸入能夠只能判斷方言口音,并且能在街頭隨機(jī)抽取不同口音的人進(jìn)行語(yǔ)音輸入準(zhǔn)確率的測(cè)試,那相信其實(shí)用性將會(huì)非常的大。但就目前而言,語(yǔ)音輸入的進(jìn)步對(duì)不少年紀(jì)大的,只會(huì)用手寫(xiě)輸入的用戶來(lái)說(shuō),其實(shí)用性確實(shí)不小。
競(jìng)爭(zhēng)者眾多
需要承認(rèn),訊飛的多語(yǔ)言識(shí)別率確實(shí)是世界頂尖,中文是最好的。但是,其他競(jìng)爭(zhēng)者要做到90%甚至95%以上也不是難事。另外,這些競(jìng)爭(zhēng)者中不乏像谷歌、百度這樣擁有大量數(shù)據(jù)庫(kù)的企業(yè),他們?cè)诤A坑脩魯?shù)據(jù)和人工智能技術(shù)上的優(yōu)勢(shì),能讓他們迅速的發(fā)展出優(yōu)秀的語(yǔ)音智能。除此之外,這類(lèi)互聯(lián)網(wǎng)企業(yè)還有足夠的能力發(fā)展諸多產(chǎn)品線,形成生態(tài),以提供更優(yōu)質(zhì)而全面的服務(wù)。從這個(gè)角度來(lái)說(shuō),訊飛的發(fā)展道路有些窄。
語(yǔ)音識(shí)別的應(yīng)用
另一方面,必須注意到,語(yǔ)音輸入本身只是一個(gè)途徑,它最終仍然要和實(shí)際操作相結(jié)合。比如在無(wú)人汽車(chē)領(lǐng)域,發(fā)展語(yǔ)音輸入就很有必要。試想一下,當(dāng)你坐上一輛無(wú)人汽車(chē),滿懷新奇和期待,結(jié)果屏幕卻彈出一塊鍵盤(pán),那時(shí)你對(duì)這項(xiàng)高科技是否會(huì)感到失望?
而智能家居又是未來(lái)一大利用語(yǔ)音識(shí)別進(jìn)行交互的重要領(lǐng)域。語(yǔ)音識(shí)別與智能家居的結(jié)合在幾年前就有了。微軟在win10發(fā)布會(huì)上主打的一點(diǎn)就是跨平臺(tái),并利用Cortana這個(gè)語(yǔ)音識(shí)別進(jìn)行更便捷的操作。也許這是第一步,在整合數(shù)碼設(shè)備之后, 微軟甚至能一步步逐漸滲透,從電視到洗衣機(jī),從窗戶到整個(gè)房屋,全都用人工智能進(jìn)行操作。而語(yǔ)音識(shí)別自然理所當(dāng)然會(huì)成為更智能家居體驗(yàn)的主要交互方式。這是能夠改變?nèi)藗兩畹闹匾I(lǐng)域,以語(yǔ)音識(shí)別為基礎(chǔ)建構(gòu)起來(lái)的整個(gè)生態(tài),就成了目前各大語(yǔ)音識(shí)別廠商追逐和競(jìng)爭(zhēng)的目標(biāo)。
重點(diǎn)還是人工智能
從語(yǔ)音識(shí)別在未來(lái)可能涉及的領(lǐng)域可以看到,雖然語(yǔ)音識(shí)別能讓生活工作變得更加的高效便捷,然而,其核心卻是人工智能。雖然微軟CEO薩提亞·納德拉對(duì)語(yǔ)音識(shí)別不吝贊美,甚至稱(chēng)語(yǔ)音識(shí)別突破的意義不亞于將圖形界面引入電腦,然而,沒(méi)有人工智能為核心,語(yǔ)音識(shí)別會(huì)出現(xiàn)下圖這樣的答非所問(wèn),就算再準(zhǔn)確又如何?
無(wú)論是無(wú)人汽車(chē),還是智能家居,或者是其他領(lǐng)域,語(yǔ)音識(shí)別只能算是第一步。畢竟如果計(jì)算機(jī)無(wú)法理解我們的指令,那么也不會(huì)有后續(xù)的操作。要想在這些領(lǐng)域有所發(fā)展,給用戶更好的體驗(yàn),那就必須著眼于人工智能。如果語(yǔ)音識(shí)別沒(méi)有依托于人工智能,不能和其他產(chǎn)品相互配合,那語(yǔ)音識(shí)別的意義也就沒(méi)有那么大了。由此來(lái)看,語(yǔ)音識(shí)別真的是重點(diǎn)嗎?恐怕不見(jiàn)得。關(guān)注科客網(wǎng)官方微信kekebat,獲取更多精彩資訊。
注:科客網(wǎng)原創(chuàng)文章,歡迎轉(zhuǎn)載與分享,轉(zhuǎn)載請(qǐng)注明出處。
梅兒莉薇
████████████看 黃 魸 手 機(jī) 瀏 覽 噐 咑 幵:275236.c○m 郗蒛資羱!無(wú)需下載、直接欣賞,妳嬞鍀!████████████綴做