91高清在线视频,天堂va在线观看,成人h动漫精品一区二区器材,超碰在线成人,国产日本欧美在线,男人的天堂伊人网,影音先锋美女

每日經(jīng)濟(jì)新聞
今日?qǐng)?bào)紙

每經(jīng)網(wǎng)首頁(yè) > 今日?qǐng)?bào)紙 > 正文

搜狗打造多形態(tài)的人機(jī)交互 推“唇語(yǔ)識(shí)別”技術(shù)提高精準(zhǔn)識(shí)別

每日經(jīng)濟(jì)新聞 2017-12-15 00:13:39

  動(dòng)動(dòng)嘴就知道你在說(shuō)什么,國(guó)內(nèi)知名互聯(lián)網(wǎng)公司搜狗推出的中文“唇語(yǔ)識(shí)別”技術(shù)近期在烏鎮(zhèn)引起廣泛關(guān)注,秒殺一眾黑科技。筆者通過(guò)搜狗方面了解到,搜狗推出的這種人機(jī)交互新技術(shù)——“唇語(yǔ)識(shí)別”,是業(yè)內(nèi)首個(gè)公開(kāi)演示的“唇語(yǔ)識(shí)別”系統(tǒng),通過(guò)機(jī)器視覺(jué)識(shí)別,不用聽(tīng)聲音,僅靠識(shí)別說(shuō)話(huà)人唇部動(dòng)作,就能解讀說(shuō)話(huà)者所說(shuō)的內(nèi)容。

在談到為什么要推出這項(xiàng)技術(shù)時(shí),搜狗方面表示,搜狗研發(fā)唇語(yǔ)識(shí)別的初衷是因?yàn)樗压匪阉骱洼斎敕ㄆ鋵?shí)都是在和語(yǔ)言打交道。一方面是幫助人們用語(yǔ)音表達(dá),另一方面是通過(guò)語(yǔ)言獲取互聯(lián)網(wǎng)上的信息。語(yǔ)音正逐漸成為主流的人機(jī)交互方式,但是在一些嘈雜,甚至無(wú)聲的環(huán)境里,語(yǔ)音所能發(fā)揮的作用是有限的,這種情況下,我們就需要發(fā)展基于視覺(jué)的識(shí)別能力。

業(yè)內(nèi)認(rèn)為,上市后的搜狗,隨著其不斷地深耕人工智能領(lǐng)域的技術(shù)研發(fā),會(huì)逐漸形成差異化競(jìng)爭(zhēng),而搜狗在人工智能上的探索也并不會(huì)止步于此,圍繞著語(yǔ)音交互入口等多形態(tài)的人機(jī)交互方式,搜狗會(huì)在更多領(lǐng)域有進(jìn)一步的進(jìn)展。目前搜狗技術(shù)落地的產(chǎn)品主要包括搜狗輸入法、搜狗同傳、搜狗聽(tīng)寫(xiě)等產(chǎn)品。

垂直場(chǎng)景下達(dá)到90%準(zhǔn)確率

從鍵盤(pán)打字到觸控屏,再到現(xiàn)在的語(yǔ)音交互和手勢(shì)交互,人工智能技術(shù)的發(fā)展,正在促使人機(jī)交互方式向更加多元化方向變革。據(jù)了解,與語(yǔ)音識(shí)別不同,“唇語(yǔ)識(shí)別”是一項(xiàng)基于機(jī)器視覺(jué)與自然語(yǔ)言處理于一體的技術(shù),因此在研發(fā)難度上比語(yǔ)音識(shí)別大得多。

經(jīng)過(guò)一年多的研發(fā)和反復(fù)修改,目前,在非特定人開(kāi)放口語(yǔ)測(cè)試上,搜狗唇語(yǔ)識(shí)別系統(tǒng)已經(jīng)達(dá)到60%以上的準(zhǔn)確率,超過(guò)google發(fā)布的英文唇語(yǔ)系統(tǒng)50%以上的準(zhǔn)確率,在垂直場(chǎng)景如車(chē)載、智能家居等場(chǎng)景下甚至已經(jīng)達(dá)到90%的準(zhǔn)確率。

據(jù)悉,搜狗首創(chuàng)了復(fù)雜端到端深度神經(jīng)網(wǎng)絡(luò)技術(shù)進(jìn)行中文唇語(yǔ)序列建模,通過(guò)數(shù)千小時(shí)的真實(shí)唇語(yǔ)數(shù)據(jù)訓(xùn)練。陳偉介紹,搜狗“唇語(yǔ)識(shí)別”技術(shù)通過(guò)10萬(wàn)以上的中文詞訓(xùn)練數(shù)據(jù),而google英文唇語(yǔ)系統(tǒng)只有1萬(wàn)7000多詞匯。另外,還得益于搜狗在自然語(yǔ)言處理方面的強(qiáng)大優(yōu)勢(shì),最終取得了業(yè)界領(lǐng)先的唇語(yǔ)識(shí)別效果。

在剛結(jié)束不久的烏鎮(zhèn)世界互聯(lián)網(wǎng)大會(huì)上,搜狗唇語(yǔ)識(shí)別技術(shù)亮相,在業(yè)內(nèi)大多數(shù)唇語(yǔ)識(shí)別技術(shù)實(shí)用性尚待考證的環(huán)境下,成功完成了業(yè)內(nèi)首個(gè)中文唇語(yǔ)識(shí)別系統(tǒng)的公開(kāi)演示,引起廣泛關(guān)注。

AI發(fā)展助推多元交互方式

當(dāng)國(guó)內(nèi)大部分企業(yè)都扎堆聚集在智能語(yǔ)音、圖像識(shí)別等領(lǐng)域時(shí),搜狗唇語(yǔ)識(shí)別技術(shù)的推出無(wú)疑將引領(lǐng)整個(gè)行業(yè)進(jìn)入一個(gè)全新的發(fā)展方向。

作為人機(jī)交互的形式之一,未來(lái)唇語(yǔ)識(shí)別技術(shù)可以輔助語(yǔ)音交互及圖像識(shí)別,在日常生活、安防、公益等各個(gè)領(lǐng)域?qū)崿F(xiàn)廣泛應(yīng)用。比如在車(chē)載場(chǎng)景下,周?chē)胍暨^(guò)大時(shí)會(huì)對(duì)語(yǔ)音指令產(chǎn)生干擾,通過(guò)唇語(yǔ)識(shí)別技術(shù)則可以規(guī)避干擾,保證人車(chē)交互的準(zhǔn)確性和穩(wěn)定性,日常不便發(fā)聲的公共場(chǎng)所也可以保證說(shuō)話(huà)內(nèi)容的私密性。

而在安防領(lǐng)域,“唇語(yǔ)識(shí)別”更能發(fā)揮價(jià)值,尤其是在攝像頭場(chǎng)景下的語(yǔ)音獲取存在盲區(qū)的情況下。據(jù)陳偉介紹,由于目前多數(shù)監(jiān)控只有攝像頭沒(méi)有麥克風(fēng),攝像頭獲取數(shù)據(jù)單一,沒(méi)有音頻錄入,往往只能看清嘴型卻不知道在說(shuō)什么,給案情分析帶來(lái)很多難題?,F(xiàn)在技術(shù)多集中于圖像分析,集中于人臉或者行人檢測(cè)、監(jiān)控等,也缺乏對(duì)用戶(hù)信息直接獲取的方式,而唇語(yǔ)識(shí)別技術(shù)可以幫助公安人員獲取重要的講話(huà)信息,為公共安全提供有效支持。

除此之外,唇語(yǔ)識(shí)別技術(shù)還能發(fā)揮巨大的公益價(jià)值,幫助先天性聽(tīng)障人群或老年人,讓他們更好地理解和表達(dá)自己。

作為一家技術(shù)驅(qū)動(dòng)型的企業(yè),近年來(lái)搜狗一直致力于自然語(yǔ)言的研究,目前在語(yǔ)音識(shí)別、語(yǔ)義理解、機(jī)器翻譯等方面均取得了行業(yè)領(lǐng)先的成果并實(shí)現(xiàn)產(chǎn)品落地,此次推出唇語(yǔ)識(shí)別技術(shù),不僅會(huì)推動(dòng)整個(gè)AI行業(yè)的技術(shù)革新,也意味著搜狗在AI領(lǐng)域的技術(shù)實(shí)力達(dá)到了更高的發(fā)展水平。

此前,人工智能專(zhuān)家搜狗CEO王小川在烏鎮(zhèn)的演講中論述了人工智能與連接的關(guān)系。他指出,人工智能目前的核心價(jià)值,是幫助人們進(jìn)行決策。加入了人工智能的決策,人和人、人和信息、人和交易以及人和服務(wù)都能夠更加精準(zhǔn)地連接。

時(shí)至今日,人工智能的發(fā)展速度已經(jīng)完全超出了我們的想象,那些電影里的炫酷黑科技正在一步步成為現(xiàn)實(shí),出現(xiàn)在我們的生活中。隨著AI技術(shù)的發(fā)展,相信在不遠(yuǎn)的將來(lái),唇語(yǔ)識(shí)別也能像語(yǔ)音識(shí)別、圖像識(shí)別一樣成為我們生活中隨處可見(jiàn)的一部分。

如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。

讀者熱線(xiàn):4008890008

特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。

歡迎關(guān)注每日經(jīng)濟(jì)新聞APP

每經(jīng)經(jīng)濟(jì)新聞官方APP

0

0