微軟的新圖像字幕算法,準(zhǔn)確性或超人類
[釘科技編譯] 綜合《thesouthafrican》和《theverge》消息:微軟開發(fā)了一種新的圖像字幕算法,該算法在某些有限的測試中準(zhǔn)確性超過了人類,據(jù)稱其將被合并到該公司用于視力障礙者的應(yīng)用程序“Seeing AI”及其更大的Office產(chǎn)品系列中。圖像字幕技術(shù)滿足了諸如為圖像創(chuàng)建替換文本的任務(wù),該功能對于增加可訪問性特別重要。微軟AI團(tuán)隊的軟件工程經(jīng)理Saqib Shaikh在新聞發(fā)布會
原創(chuàng)
2020-10-18 09:46:38
來源:釘科技??

[釘科技編譯] 綜合《thesouthafrican》和《theverge》消息:微軟開發(fā)了一種新的圖像字幕算法,該算法在某些有限的測試中準(zhǔn)確性超過了人類,據(jù)稱其將被合并到該公司用于視力障礙者的應(yīng)用程序“Seeing AI”及其更大的Office產(chǎn)品系列中。

image.png

圖像字幕技術(shù)滿足了諸如為圖像創(chuàng)建替換文本的任務(wù),該功能對于增加可訪問性特別重要。微軟AI團(tuán)隊的軟件工程經(jīng)理Saqib Shaikh在新聞發(fā)布會上說:“理想情況下,每個人都將在文檔、網(wǎng)絡(luò)、社交媒體中為所有圖像添加替代文本,因為這使盲人可以訪問內(nèi)容并參與互動。但是,人們沒有。因此,有一些應(yīng)用程序使用圖像標(biāo)題作為替代文本的方式”。

微軟表示,新算法效果是當(dāng)前算法的兩倍,對于使用諸如微軟 Seeing AI之類的應(yīng)用的用戶來說,這將意味著極大改善用戶體驗。

Seeing AI利用計算機(jī)視覺為視障人士描述通過智能手機(jī)攝像頭看到的世界。微軟算法不僅能夠識別人和物體,還能夠識別物體之間的關(guān)系,這意味著該算法能夠?qū)⒛橙嗣枋鰹椤白谝巫由匣蜃x書”。

在9月份的一篇論文中,新算法在一個被稱為 "nocaps "的圖像字幕基準(zhǔn)測試上取得了有史以來最高的分?jǐn)?shù)。nocaps基準(zhǔn)測試由超過166000個人類生成的字幕組成,描述了從Open Images Dataset中提取的約15100張圖片,這些圖片涵蓋了從運(yùn)動到假日抓拍,再到美食攝影等等的一系列場景。 (釘科技綜合《thesouthafrican》和《theverge》消息編譯)

原創(chuàng)文章
最新文章
1
1-2nm 水分子革命:華帝如何用技術(shù)重構(gòu)沐浴邏輯
2
2025年“灣區(qū)杯”網(wǎng)絡(luò)安全大賽啟航 面向全國開放報名 ——守護(hù)智慧安全未來城市
3
華潤入主康佳,半導(dǎo)體和消費(fèi)電子起飛在即?
4
快手集中整治“虛假回收”類違規(guī)行為,保護(hù)用戶權(quán)益免遭損失
5
快手直播大舞臺遍地開花,打造現(xiàn)象級文旅新爆款
6
科技副總裁宋婷婷:數(shù)字技術(shù)賦能女性發(fā)展,繁榮生態(tài)綻放“她力量”
7
第三屆北京網(wǎng)絡(luò)視聽藝術(shù)大會成功舉辦,“新大眾文藝”主題研討引熱議
8
美的格力海爾都布局的廚房空調(diào),雞肋還是剛需?
9
電商行業(yè)破局重構(gòu),"618"大促展現(xiàn)六大新趨勢
10
5G-A時代,“大上行”的含金量還在上升
11
新型儲能海外訂單爆增400%,專家提示潛在風(fēng)險
12
蘋果Mac全家桶下半年登場:首發(fā)M5芯片
13
業(yè)界唯一!榮耀Magic V5免費(fèi)送內(nèi)屏寶
14
618中國電視市場“量額”齊增,品質(zhì)提升成未來主旋律
15
關(guān)稅沖擊下 家電出口的短期承壓與長期破局
16
美越貿(mào)易協(xié)議落地,中國企業(yè)供應(yīng)鏈面臨重塑挑戰(zhàn)
17
vivo X Fold5亮點總結(jié):做蘋果最好搭子?
18
618智能手機(jī)市場:蘋果、小米、華為位列前三,價格戰(zhàn)致市場下行
19
鎖定暑期檔“上頭”時刻,快手內(nèi)容消費(fèi)系列沖量指南來襲
20
第九屆平遙國際電影展產(chǎn)業(yè)板塊新設(shè)“快手聚光短劇計劃”
關(guān)于我們

微信掃一掃,加關(guān)注

商務(wù)合作
  • QQ:61149512