老羅大秀語音識別 但它真的重要嗎?
老羅在發(fā)布會上現(xiàn)場展示語音識別確實驚艷了一把,但語音識別真的是發(fā)展的重點嗎?
如果沒有人工智能,語音識別如同雞肋,食之無味,棄之可惜。
http://www.brrgbq.cn/Uploads/Bingdu/2016-10-19/58072b0c361ea.jpg
1
科客網(wǎng)
http://www.brrgbq.cn/news/14788.html
科客點評:如果沒有人工智能,語音識別如同雞肋,食之無味,棄之可惜。
在10月18日晚上的錘子手機(jī)發(fā)布會上,老羅現(xiàn)場展示了科大訊飛97%正確率的語音輸入。時間定格于發(fā)布會106分40秒,在老羅一陣碎碎念之后的不到一秒之內(nèi),文字轉(zhuǎn)換完成。其轉(zhuǎn)換速度之快,準(zhǔn)確率之高以及現(xiàn)場展示的特殊環(huán)境,都讓人驚艷了一把。
語音識別實用嗎?
事實上,語音輸入并不是什么新鮮詞,但這次借助老羅的“單口相聲”,語音輸入又跳到眾人視線中。令人奇怪的是,訊飛的語音輸入在很早以前就有了,這次展示卻令我們有種重新認(rèn)識語音輸入的感覺。
幾年前,語音輸入的準(zhǔn)確率也不低,基本都有90%以上。然而,放到實際生活中,語音輸入的實用性仍然不是很高。在使用語音輸入的時候,其準(zhǔn)確率會受到非常多的因素影響,在不同的環(huán)境下使用會有差別,在不同使用者的口音下更是差別巨大。
但放到今天,語音識別還是不實用嗎?
應(yīng)該說,由于準(zhǔn)確率的提高,語音識別的實用性對普通用戶來說有所上升。但從科客的實際體驗來說,哪怕是訊飛,其準(zhǔn)確率仍然受限于使用者的音量、發(fā)音標(biāo)準(zhǔn)程度、環(huán)境干擾諸多因素。其中最大的影響因素應(yīng)該是口音。拿廣東地區(qū)來說,光是粵語,不同地區(qū)的人發(fā)音都有所區(qū)別。對于人類來說,我們可以較為輕松的識別不同口音,并較為準(zhǔn)確領(lǐng)會他人表達(dá)的意思。然而對機(jī)器而言,它就需要更大的數(shù)據(jù)庫。倘若哪一天,語音輸入能夠只能判斷方言口音,并且能在街頭隨機(jī)抽取不同口音的人進(jìn)行語音輸入準(zhǔn)確率的測試,那相信其實用性將會非常的大。但就目前而言,語音輸入的進(jìn)步對不少年紀(jì)大的,只會用手寫輸入的用戶來說,其實用性確實不小。
競爭者眾多
需要承認(rèn),訊飛的多語言識別率確實是世界頂尖,中文是最好的。但是,其他競爭者要做到90%甚至95%以上也不是難事。另外,這些競爭者中不乏像谷歌、百度這樣擁有大量數(shù)據(jù)庫的企業(yè),他們在海量用戶數(shù)據(jù)和人工智能技術(shù)上的優(yōu)勢,能讓他們迅速的發(fā)展出優(yōu)秀的語音智能。除此之外,這類互聯(lián)網(wǎng)企業(yè)還有足夠的能力發(fā)展諸多產(chǎn)品線,形成生態(tài),以提供更優(yōu)質(zhì)而全面的服務(wù)。從這個角度來說,訊飛的發(fā)展道路有些窄。
語音識別的應(yīng)用
另一方面,必須注意到,語音輸入本身只是一個途徑,它最終仍然要和實際操作相結(jié)合。比如在無人汽車領(lǐng)域,發(fā)展語音輸入就很有必要。試想一下,當(dāng)你坐上一輛無人汽車,滿懷新奇和期待,結(jié)果屏幕卻彈出一塊鍵盤,那時你對這項高科技是否會感到失望?
而智能家居又是未來一大利用語音識別進(jìn)行交互的重要領(lǐng)域。語音識別與智能家居的結(jié)合在幾年前就有了。微軟在win10發(fā)布會上主打的一點就是跨平臺,并利用Cortana這個語音識別進(jìn)行更便捷的操作。也許這是第一步,在整合數(shù)碼設(shè)備之后, 微軟甚至能一步步逐漸滲透,從電視到洗衣機(jī),從窗戶到整個房屋,全都用人工智能進(jìn)行操作。而語音識別自然理所當(dāng)然會成為更智能家居體驗的主要交互方式。這是能夠改變?nèi)藗兩畹闹匾I(lǐng)域,以語音識別為基礎(chǔ)建構(gòu)起來的整個生態(tài),就成了目前各大語音識別廠商追逐和競爭的目標(biāo)。
重點還是人工智能
從語音識別在未來可能涉及的領(lǐng)域可以看到,雖然語音識別能讓生活工作變得更加的高效便捷,然而,其核心卻是人工智能。雖然微軟CEO薩提亞·納德拉對語音識別不吝贊美,甚至稱語音識別突破的意義不亞于將圖形界面引入電腦,然而,沒有人工智能為核心,語音識別會出現(xiàn)下圖這樣的答非所問,就算再準(zhǔn)確又如何?
無論是無人汽車,還是智能家居,或者是其他領(lǐng)域,語音識別只能算是第一步。畢竟如果計算機(jī)無法理解我們的指令,那么也不會有后續(xù)的操作。要想在這些領(lǐng)域有所發(fā)展,給用戶更好的體驗,那就必須著眼于人工智能。如果語音識別沒有依托于人工智能,不能和其他產(chǎn)品相互配合,那語音識別的意義也就沒有那么大了。由此來看,語音識別真的是重點嗎?恐怕不見得。關(guān)注科客網(wǎng)官方微信kekebat,獲取更多精彩資訊。
注:科客網(wǎng)原創(chuàng)文章,歡迎轉(zhuǎn)載與分享,轉(zhuǎn)載請注明出處。
梅兒莉薇
████████████看 黃 魸 手 機(jī) 瀏 覽 噐 咑 幵:275236.c○m 郗蒛資羱!無需下載、直接欣賞,妳嬞鍀!████████████綴做