在很多武俠小說中,經常會看到一些武林高手雖然站在遠處,卻能通過讀唇語知曉別人說了什麼。然而時至今日,這項“特異功能”不再只是武俠小說中擁有的情節,下面就讓我們來認識一下這項神奇的唇語識別技術吧。
2017年12月4日,觀眾在體驗搜狗推出的中文唇語識別系統。
(龍巍/人民圖片)
(聲明:凡帶有“人民圖片”字樣圖片,系版權圖片,受法律保護,使用(含轉載)需付費,歡迎致電購買:010-65368384或021-63519288。)
“唇語識別技術是一項集機器視覺與自然語言處理於一體的技術”,海雲數據CEO馮一村在接受光明網採訪時介紹,唇語識別技術通過機器視覺技術,從圖像中連續識別出人臉,並提取此人連續的口型變化特征,隨即將連續變化的特征輸入到唇語識別模型中,識別出講話人口型對應的發音,從而計算出可能性最大的表達語句。此外,馮一村介紹,唇語識別技術的精確度研發基於1萬小時新聞式的唇語節目,目前英文准確度已經達到80%,中文准確度已經達到71%。
唇語識別技術在噪音太大或隻有攝像頭等無法准確捕捉聲音的場合中具有很強的實用性。據中國網報道,在馬路、會議室、商場等噪音較大的場景裡,唇語識別技術可以規避噪聲對用戶說話內容獲取的影響,確保語音輸入的准確率,保証交互的穩定性﹔此外,目前在電梯、馬路等監控場景中隻有攝像頭,並沒有麥克風,通過唇語識別技術,可以獲取指定用戶的講話信息,為公共安全提供有效支持。
唇語識別技術又可以應用於哪些領域呢?據《北京日報》報道,場景教育、身份識別、公共安全、移動支付、軍事情報等領域中都可以應用唇語識別技術。比如,通過唇語識別技術支持下的口型支付密碼,消費者動動嘴就能進行支付﹔而在軍事情報領域中,唇語識別技術則讓遠距離獲取情報成為可能﹔若在公安系統中加入唇語識別技術,公安人員則可通過平台獲取視頻中犯罪嫌疑人的語言信息,這將極大助力犯罪緝查工作的開展。(趙鵬)
本文由中科院物理所副研究員羅會仟進行科學性把關,專家主要研究領域為超導、電子、電磁、半導體、自動化、中子散射等。