AI“讀唇術(shù)”,靠什么讓“失語者”重新“開口”?
[釘科技編譯]不出聲,僅僅通過喉嚨和下顎的皮膚震動就能知道想說什么。說道這,首先想到的可能是“古老的讀唇術(shù)”?,F(xiàn)在,人工智能可能會讓這門顯得頗神秘的“技藝”被更多人掌握。之前,有科研人員研發(fā)AI唇語識別:運用機器視覺技術(shù)從視頻中識別出說話人的人臉,提取此人連續(xù)說話時口型變化的特征。通過機器視覺識別,不用聽聲音,僅靠識別說話人的唇部動作,解讀說話者所說的內(nèi)容。近日,不同于運用機器視覺技術(shù)識別說話人的
原創(chuàng)
2020-04-06 07:30:49
來源:釘科技??

[釘科技編譯]不出聲,僅僅通過喉嚨和下顎的皮膚震動就能知道想說什么。說道這,首先想到的可能是“古老的讀唇術(shù)”?,F(xiàn)在,人工智能可能會讓這門顯得頗神秘的“技藝”被更多人掌握。

之前,有科研人員研發(fā)AI唇語識別:運用機器視覺技術(shù)從視頻中識別出說話人的人臉,提取此人連續(xù)說話時口型變化的特征。通過機器視覺識別,不用聽聲音,僅靠識別說話人的唇部動作,解讀說話者所說的內(nèi)容。近日,不同于運用機器視覺技術(shù)識別說話人的唇部動作的的技術(shù),一種僅靠檢測喉嚨運動的“讀唇術(shù)”據(jù)說也被研發(fā)出來了。

圖片 1.png

據(jù)《itmedia》網(wǎng)站消息,近日,東京大學(xué)和索尼計算機科學(xué)研究所共同研發(fā)出的AI系統(tǒng)“Derma”,通過將傳感器貼合在喉嚨周圍的皮膚上,就能成功實現(xiàn)從口形(無聲說話)到語音的轉(zhuǎn)化。

研究靈感最初來源于視聽障礙者的觸診唇讀法,他們會用手指觸摸說話者的嘴唇和下巴周圍,以此讀取說話內(nèi)容。也就是說,他們通過觸摸障礙者嘴唇周圍的皮膚得知他們的說話內(nèi)容。

AI系統(tǒng)“Derma”應(yīng)用時,在下顎皮膚的兩個位置安裝加速度計和角速度傳感器,輔之機器學(xué)習(xí),通過隨著說話發(fā)生的下顎運動和舌肌運動引起的從下顎到喉嚨的皮膚顫動,進行無聲“語音識別”。(釘科技編譯,消息來源: https://www.itmedia.co.jp/news/articles/2003/18/news046.html)

原創(chuàng)文章
最新文章
1
次元漫游,沉浸娛樂——Sony Expo 2025于 Bilibili World舉辦
2
《2025智慧生活科技好物以舊換新選購指南》正式發(fā)布
3
解鎖2025CIC中國智慧生活大會五大亮點,暢享未來生活新范式
4
助力文化傳承 快手推出國內(nèi)首檔二次元IP非遺跨界綜藝《IP中國行》
5
快手電商618“星成長主播”案例合集:好方法 好內(nèi)容 引爆增長
6
北京網(wǎng)絡(luò)視聽藝術(shù)大會主題打卡活動超3000萬人次觀看,全面賦能城市副中心文旅發(fā)展
7
錨定行業(yè)發(fā)展方向,2025中國家電健康趨勢高峰論壇在京舉辦
8
海信視像榮獲“中國卓越管理公司”大獎,以長期主義詮釋中國企業(yè)成長范式
9
空調(diào)線上市場半年觀察:價格戰(zhàn)兇猛 美的格力小米居銷量前三
10
三星Galaxy Z Flip7正式發(fā)布:AI賦能輕巧機身 智能外屏煥新升級
11
三星Galaxy Z Fold7正式發(fā)布:樹立Galaxy智能手機新標(biāo)桿
12
央視探訪海信空調(diào)實驗室,揭秘賽場外的黑科技
13
1-2nm 水分子革命:華帝如何用技術(shù)重構(gòu)沐浴邏輯
14
2025年“灣區(qū)杯”網(wǎng)絡(luò)安全大賽啟航 面向全國開放報名 ——守護智慧安全未來城市
15
華潤入主康佳,半導(dǎo)體和消費電子起飛在即?
16
快手集中整治“虛假回收”類違規(guī)行為,保護用戶權(quán)益免遭損失
17
快手直播大舞臺遍地開花,打造現(xiàn)象級文旅新爆款
18
科技副總裁宋婷婷:數(shù)字技術(shù)賦能女性發(fā)展,繁榮生態(tài)綻放“她力量”
19
第三屆北京網(wǎng)絡(luò)視聽藝術(shù)大會成功舉辦,“新大眾文藝”主題研討引熱議
20
美的格力海爾都布局的廚房空調(diào),雞肋還是剛需?
關(guān)于我們

微信掃一掃,加關(guān)注

商務(wù)合作
  • QQ:61149512