語音手機時代:該和和身邊的機器談心了
在按鍵時代,手機行業(yè)的霸主是諾基亞;在觸控時代,蘋果一騎絕塵。在語音交互的新時代,又將成就哪些商業(yè)寵兒?
0
科客點評:電影都變成了現(xiàn)實。
有部美國電影叫《Her》,講述了一個宅男愛上電腦操作系統(tǒng)的故事。他每日每夜通過耳機與聲音性感的薩曼莎(類似Siri的女聲)對話,談情說愛,甚至一起意淫XO。但遺憾的是薩曼莎并不存在,她只是未來人機交互的一個紐帶。
愛上機器也許聽起來不可思議,但電影《Her》描繪的新世界其實并不遙遠。也許用不了幾年,我們的雙手和眼睛就會從人機交互之中釋放出來。控制機器,你將 不再需要敲打鍵盤、觸摸屏幕。隨著語音交互技術(shù)的進步,你需要做的僅僅是發(fā)號施令,用人類最原始的方式與機器交談。在你的周圍,萬物聯(lián)網(wǎng),隨時待命,整個世界仿佛都在豎起耳朵,聽候你的差遣。
與世界對話,你仍然需要一個助手。現(xiàn)在看來,最適合承載這一使命的似乎還將是手機。畢竟,這是一個集成了通訊、社交、學(xué)習(xí)、工作等等無數(shù)功能的百寶箱,暫時無可替代。目前興起的智能家居、可穿戴設(shè)備,也都紛紛把手機當(dāng)成控制中心和數(shù)據(jù)中心。
新技術(shù)意味著新商機、新格局。在按鍵時代,手機行業(yè)的霸主是諾基亞;在觸控時代,蘋果一騎絕塵。在語音交互的新時代,又將成就哪些商業(yè)的寵兒?
我們完全有理由相信:未來是屬于語音手機的。當(dāng)然,每一個行業(yè)在黎明到來前,都會經(jīng)歷漫長的黑暗時光。語音手機要想崛起,也注定要經(jīng)歷不少曲折。
你好,世界
人們都在期待一個全新的未來,機器能聽會說、有感情、懂思考的未來。不過,彼岸并非伸手可觸。在幻想人工智能普及之前,我們必須建立起一個與機器自由交流的通道,不需要代碼、不需要鍵盤和屏幕,而是用人類最原始的方式——語言,來對話。
為什么一定要用語言?
首先,人類發(fā)明機器的目的是為了提高效率、節(jié)省時間。長期以來,機器的能力飛速增長,但人與機器交流手段的變化卻并不明顯??梢哉f,人機交互已成為效率瓶頸。要想讓世界運轉(zhuǎn)的更快,機器必須聽得懂人的語言。
對人來說,語言交流也是最省力的手段。它可以徹底解放你的雙手和雙眼,你不再需要盯著手機屏幕、不再需要手動觸摸電子設(shè)備,就可以使它們按照你的意愿運 轉(zhuǎn),這種變化絕不僅僅意味著酷。對于在視覺、觸覺等方面存在障礙(如老年人、弱視、殘障人士)或不適合(如兒童需要保護視力)的龐大特定人群,語音同樣是 最佳的交互選擇。
此外,聲紋也是最契合萬物互聯(lián)時代的應(yīng)用之一。每個人說話時使用的發(fā)聲器官——舌、牙齒、喉頭、肺、鼻腔在尺寸和形態(tài)方面差異很大。所以,聲紋所攜帶的個 人生物識別信息是與安全結(jié)合的天然基礎(chǔ),而這種非接觸特性相對接觸式生物識別信息(比如指紋),可以為用戶帶來更多便利性和更好的用戶體驗,也可以規(guī)避一 些安全性方面的隱患。
在2G和3G時代,流量成為了語音交互的瓶頸。語音數(shù)據(jù)庫累積較慢,又限制了語音辨識與語義理解的提升。而缺乏大數(shù)據(jù)支持,又導(dǎo)致語音功能體驗較差,惡性 循環(huán)。4G時代的來臨為語音帶來了福音,首先,傳輸速度大大提升,用戶流量較多,使用語音變得頻繁,容易形成海量數(shù)據(jù)庫,辨識度和語義理解將隨之改善,為 語音交互整體爆發(fā)提供了基礎(chǔ)。
是時候和你身邊的機器談?wù)勑牧恕?/span>
生態(tài)鏈初現(xiàn)
越來越多的手機、平板、智能家居、可穿戴設(shè)備,以及車載設(shè)備,正在日益重視語音的作用。特別是蘋果Siri、騰訊微信、科大訊 飛等主流企業(yè)和產(chǎn)品,一直在培養(yǎng)人們的語音習(xí)慣。谷歌預(yù)計目前大約有50%的Android設(shè)備通過語音進行搜索,咨詢公司SA則預(yù)測含語音及手勢觸覺反 饋技術(shù)的智能機目前在中高端智能機上已經(jīng)很普遍,2014年發(fā)貨規(guī)模將達到5.7億部,滲透率(占智能機)約一半左右。
經(jīng)過多年的發(fā)展,智能語音人機交互產(chǎn)業(yè)目前已經(jīng)形成了從核心技術(shù)研發(fā)到知識庫提供再到應(yīng)用、服務(wù)的完善的產(chǎn)業(yè)鏈。
在核心技術(shù)方面及應(yīng)用方面,世界各國都在賽跑。美國設(shè)立的DARPA高科技研究計劃、日本設(shè)立的“第五代計算機”技術(shù)攻關(guān)計劃、歐洲尤里卡計劃中對該方向均設(shè)立了專項予以重點支持。IBM、微軟、Motorola、Nuance等國外著名的IT廠商也在同臺競技。
在中國,核心技術(shù)研發(fā)環(huán)節(jié),有小i機器人等智能機器人廠商,以及清華、中科院等人工智能技術(shù)研究院校和科研院所;人機交互技術(shù)及服務(wù)提供商,如科大訊飛、 捷通華聲、車音網(wǎng)等語音技術(shù)提供商及微信、QQ等平臺服務(wù)商;在數(shù)據(jù)和內(nèi)容提供商環(huán)節(jié)更是百花齊放;智能終端領(lǐng)域則有中興、聯(lián)想、華為等廠商。
不過,語音交互的爆發(fā)光靠每個產(chǎn)業(yè)鏈條的單兵作戰(zhàn)并不足夠。市場亟需一個能夠整合各方資源的平臺方,而這個平臺方必須離用戶最近,既當(dāng)數(shù)據(jù)入口、也當(dāng)交互中心。
語音手機便應(yīng)運而生。
語音手機的輝煌時代將至
手機,離我們距離最近的移動終端,從鍵盤輸入到觸摸屏輸入,用了30年時間。每一次操作方式的進步,都催生出了一批世界級的企業(yè)出現(xiàn)。語音手機時代的到來也不例外。
智能終端、家電、汽車市場,在這些多樣化的智能應(yīng)用場景下,語音的優(yōu)勢以及價值一旦發(fā)揮出來,天然的交互入口導(dǎo)流作用,將對即時通訊、搜索、購物、LBS 等垂直應(yīng)用服務(wù)市場產(chǎn)生巨大的影響。語音交互將凌駕于搜索引擎、社交工具等其他應(yīng)用入口之上,形成一個以語音交互技術(shù)為核心的全新應(yīng)用生態(tài)鏈。
與傳統(tǒng)的手機相比,未來的語音手機將支持語音喚醒手機、語音拍照、語音控制音樂播放、語音控制其他APP等等。當(dāng)你駕車時,用語音可以喚醒手機、解鎖手 機,用語音直接撥叫通訊錄里的號碼,接聽電話,而不用擔(dān)心影響注意力;當(dāng)你用手機自拍時,用語音就可以拍出一張完美的照片,不用擔(dān)心手抖的問題;當(dāng)你想在 手機的眾多軟件里搜索你需要的軟件時,運用語音指令就可以迅速啟動軟件。
這些功能體驗也許還談不上完美,但我們已經(jīng)看到,有越來越多的玩家正在加入這一陣營。隨著支持語音功能的手機、軟件、應(yīng)用,以及其他硬件產(chǎn)品越來越多,語音交互積累的數(shù)據(jù)和交互的體驗質(zhì)量相互促進,萬物語音的時代真的已經(jīng)不遠了。
當(dāng)然,在此之前,個性化的語音識別和語義理解技術(shù)還需要持續(xù)改進,水滴石穿,非一日之功。語音時代前途光明,語音手機大有可為。
一切才剛剛開始。(賀樹龍,微信公號:heshulong1988)
注:轉(zhuǎn)載文章,不代表本站贊同其觀點和對其真實性負責(zé),本站不承擔(dān)此類稿件侵權(quán)行為的連帶責(zé)任。如版權(quán)持有者對所轉(zhuǎn)載文章有異議,請與我們聯(lián)系。
zz
單身狗狗狗
碧珀明
只能和手機語音擼么 寂寞的丹參狗