2015-01-10|發(fā)布者:admin
在過去的幾年里,智能手機(jī)功能都得到了空前的提升。不過,一個(gè)顯見的趨勢是,以硬件提升為主導(dǎo)的發(fā)展,已經(jīng)逐漸放緩,并且遭遇瓶頸。在此前的文章中,筆者已經(jīng)介紹了這的現(xiàn)象,并且認(rèn)為智能手機(jī)未來的競爭方向之一是設(shè)計(jì),而無邊框設(shè)計(jì)會是一種趨勢。當(dāng)然,除了在設(shè)計(jì)方面尋求差異化之外,交互體驗(yàn)的提升,在2015年有望成為智能手機(jī)發(fā)展的突破口,在這方面,最可能的趨勢就是語音。
自從第一代的iPhone將智能手機(jī)的人機(jī)交互從鍵盤轉(zhuǎn)移到觸摸之后,人機(jī)交互并未出現(xiàn)革命性的改進(jìn)。必須承認(rèn)觸控操作是過去幾年最好的方案,但它是否真的是人機(jī)交互的最優(yōu)方式?答案是否定的,隨著技術(shù)的改進(jìn),人們越來越期待由語音這種人與人之間最自然的溝通體驗(yàn),轉(zhuǎn)移到人與智能手機(jī)之間。
語音本就是人類天生的溝通方式,也是獲取信息最自然最便捷的方式。盡管觸摸屏比起鍵盤來,已經(jīng)是人機(jī)交互的一種革命,但通過語音來“解放雙手”,始終是人們希望在智能手機(jī)上進(jìn)一步改善的方向。
從智能手機(jī)的實(shí)際用戶體驗(yàn)而言,觸控操作是典型的“樹狀結(jié)構(gòu)”,從根節(jié)點(diǎn)出發(fā)到子節(jié)點(diǎn),操作路徑可能較長,且不易于查找。而語音則是扁平化的,沒有任何層級限制,可直達(dá)目標(biāo),因而更加高效。
語音操控也可有效避免觸控存在的盲區(qū)。比如,用戶在開車時(shí)用觸控操作手機(jī)便存在安全隱患;在諸如洗衣做飯這樣的家務(wù)場景,也存在兩手無暇顧及手機(jī)的情況。當(dāng)然,智能手機(jī)大屏化趨勢也給語音帶來了機(jī)會——目前看來大屏幕的趨勢不可逆轉(zhuǎn),但大屏幕的確會影響操作的便利性。
當(dāng)然,上述這些優(yōu)勢并非筆者的發(fā)現(xiàn),事實(shí)上語音比觸控更有優(yōu)勢可謂業(yè)界共識。將語音操控融入手機(jī)也絕非新鮮事,早在非智能手機(jī)時(shí)代就有“語音王”存在,而智能手機(jī)發(fā)展今天,蘋果、谷歌、微軟三大巨頭也都已經(jīng)在語音方面拿出來自己的嘗試。最引人熟知的是蘋果的智能語音助手Siri,這個(gè)隨著iPhone 4S推出的功能成為那一代產(chǎn)品最大的賣點(diǎn)。不過,有數(shù)據(jù)顯示這一功能的使用率并不高,而之后谷歌和微軟推出的Google now、小娜Cortana也是相似的情況。
一些軟件開發(fā)商也推出了類似的APP,試圖在某些場景或者功能下利用語音實(shí)現(xiàn)更好的操控。不過這些語音助手類的應(yīng)用,大多變成了消遣娛樂的“游戲”,并未成為真正幫助人們操控手機(jī)的工具。
這些嘗試不能算做失敗,但它們的確都未帶來革命性的改變。這其中的原因是多方面的,比如,現(xiàn)有的語音功能過于依賴網(wǎng)絡(luò),響應(yīng)速度并不理想;語音功能所能實(shí)現(xiàn)的功能有限,本土化服務(wù)資源接入也并不足。
屬于語音的時(shí)代正在來臨
在這樣的行業(yè)背景下,之所以將語音操控認(rèn)為2015年智能手機(jī)可能的發(fā)展趨勢,是因?yàn)橛薪K端廠商開始將語音視為智能手機(jī)操控的解決方案。
在筆者看來,語音功能要發(fā)展,必須由終端廠商主導(dǎo),它不能是一個(gè)獨(dú)立的APP,而應(yīng)該是軟硬件結(jié)合,深植于系統(tǒng)硬件平臺底層的。傳統(tǒng)的互聯(lián)網(wǎng)公司、軟件公司主導(dǎo)的語音功能,很難解決硬件方面遇到的挑戰(zhàn),從而導(dǎo)致不同型號的手機(jī)在語音識別率、反應(yīng)速度、功耗方面差異巨大且存在諸多問題。
更重要的是,即使我們將語音視為新一輪人機(jī)交互的革命,也必須意識到語音的發(fā)展并不是要放棄其他的操控模式(正如即使觸摸屏成為主流,但大多數(shù)手機(jī)仍需要一些實(shí)體按鍵)。事實(shí)上,只有將語音和如觸控、體感等其他操控方式結(jié)合起來,用戶才能得到更好的體驗(yàn)。這些都需要終端廠商在底層進(jìn)行整合和優(yōu)化。
由中興發(fā)起的智慧語音聯(lián)盟,就是這方面需求突破的范例。這一聯(lián)盟包括語音處理芯片商(Audience)、語音識別軟件商(Nuance)、搜索服務(wù)提供商(百度)、內(nèi)容提供方(高德等)以及中國科學(xué)院自動化所等科研機(jī)構(gòu)。中興希望通過整合行業(yè)領(lǐng)先的技術(shù)和資源,促進(jìn)終端語音技術(shù)的發(fā)展,推動智慧語音的規(guī);瘧(yīng)用和普及。
網(wǎng)絡(luò)的發(fā)展也是語音功能有望取得突破的重要原因。此前的一些產(chǎn)品嘗試已經(jīng)證明,單獨(dú)依靠云端或者本地的語音功能,都具有明顯的局限性,語音功能只有將本地識別和云端計(jì)算結(jié)合,才能發(fā)揮本地的便捷性和云端大數(shù)據(jù)的優(yōu)勢,使語音使用更加高效且人性化。2015年4G網(wǎng)絡(luò)的發(fā)展日益完善,會早就語音功能大發(fā)展的基礎(chǔ)條件。
尋求智能語音的突破口
當(dāng)然必須承認(rèn),目前的語音操控仍面臨很多亟待解決的問題。從基本的技術(shù)角度而言,語音降噪性(即不同噪音環(huán)境下的識別率)仍需要大幅提升,以實(shí)現(xiàn)嘈雜的環(huán)境下自然、有效地語音識別;不同口音的識別也是一個(gè)挑戰(zhàn),特別是在中國這樣方言種類眾多的市場,對精準(zhǔn)性提出了更高要求。
另外,目前的語音功能主要還停留在輔助操控方面,可預(yù)見的發(fā)展方向是實(shí)現(xiàn)從喚醒到所有應(yīng)用的全程語音操控體驗(yàn),但這距離理想中的“智能語音”還有很大差異。用戶真正期待的是和智能終端之間形成“對話”,真正完成人性化的智能處理,而不只是簡單的操作。這一點(diǎn),還需要更強(qiáng)的計(jì)算能力和人工智能的發(fā)展來支持。
無論如何,語音之門已經(jīng)打開,作為人機(jī)交互發(fā)展的重要方向,它必將真正融入消費(fèi)者生活,帶來整個(gè)行業(yè)的變革。誰能率先破局,就能沖入價(jià)值鏈的制高點(diǎn),成為新一輪的信息產(chǎn)業(yè)革命的領(lǐng)導(dǎo)者。
版權(quán)所有:優(yōu)軟科技有限公司版權(quán)所有 Copyright © 2003-2012