Facebook開源新AI語言模型,“可對100種語言實現(xiàn)一對一翻譯”
根據(jù)《siliconangle》消息:Facebook表示其利用AI技術在不依賴英語數(shù)據(jù)的情況下翻譯任意兩種語言的嘗試,已經(jīng)取得了實質性進展。Facebook正在開源一種名為M2M-100的新AI語言模型,該模型可以在100種語言中的任何一對之間進行翻譯。據(jù)稱,以前的多語言模型嚴重依賴英語作為中介,例如,中文譯成法文的步驟通常是從中文譯成英文,然后再從英文譯成法文。在大多數(shù)情況下,這種模型都可以很
原創(chuàng)
2020-10-21 13:08:12
來源:釘科技??

根據(jù)《siliconangle》消息:Facebook表示其利用AI技術在不依賴英語數(shù)據(jù)的情況下翻譯任意兩種語言的嘗試,已經(jīng)取得了實質性進展。Facebook正在開源一種名為M2M-100的新AI語言模型,該模型可以在100種語言中的任何一對之間進行翻譯。

【201020】Facebook開源新AI語言模型,可對100中語言實現(xiàn)一對一翻譯168_副本.png

據(jù)稱,以前的多語言模型嚴重依賴英語作為中介,例如,中文譯成法文的步驟通常是從中文譯成英文,然后再從英文譯成法文。在大多數(shù)情況下,這種模型都可以很好地工作,但是在涉及更復雜的句子和短語時通常不準確。

Facebook表示,M2M-100可以直接從中文翻譯成法語,或者在100多種語言對之間進行翻譯,從而更好地保留含義,而無需使用英語作為中介。

在這么多不同的語言對之間進行翻譯不是一件容易的事,因為模型需要訪問海量的高質量訓練數(shù)據(jù)。Facebook人工智能研究員Angela Fan在一篇博客文章中解釋了她和她的團隊如何著手創(chuàng)建一個龐大的“多對多”數(shù)據(jù)集,其中包含100多種不同語言的超過75億個句子。

這些數(shù)據(jù)根據(jù)諸如語言分類、地理和文化相似性等參數(shù)分為14種不同的語言組。然后,在每個語言組中,F(xiàn)acebook為每個語言標識一到三種“過渡語言”,作為將其翻譯成不同語言的基礎。

M2M-100模型比Facebook當前使用的以英語為中心的多語言模型準確度更高。該公司聲稱,M2M -100在評估機器翻譯的BLEU度量標準上比之前模型高出“10分”。

Facebook最終希望用M2M-100替換之前的翻譯模型,以提高其翻譯質量。(釘科技根據(jù)《siliconangle》消息編譯)

最新文章
1
Vidda三色激光投影618開門紅戰(zhàn)報:C3 Ultra/Pro包攬高端投影銷冠
2
云米發(fā)布昆侖4礦泉凈水器,讓家庭飲水進入礦泉時代
3
女廚神開啟涅槃路,快手星芒短劇《廚神小福星》詮釋美食真諦
4
磁力聚星釋放達人營銷勢能,激活大促生意新增量
5
雙女主攜手復仇,快手星芒短劇《少女的審判》見證璀璨新生
6
快手磁力引擎“出游裝備節(jié)”引爆五一出行消費,超2.4億曝光助力商家生意增長
7
百商聚首·萬品齊放:第36屆慧聰家電交易會電商新渠道選品會邀您鏈通全渠道
8
移動愛家推出“515移動愛家日”活動,詮釋千萬家的愛家智慧
9
蘋果正在開發(fā)新的“HomePad”,具備以下五個功能
10
雷軍最新發(fā)聲:小米自研手機系統(tǒng)級芯片即將發(fā)布
11
壁掛爐市場降幅收窄,存量爭奪戰(zhàn)將去向何方?
12
電視行業(yè)大尺寸化的趨勢下,智能投影將迎來發(fā)展機遇
13
“以舊換新”首次深度綁定618,家電行業(yè)熱增長與冷思考
14
創(chuàng)維A6F Pro解決了影音發(fā)燒友哪些痛點?
15
小米Civi 5 Pro內部代號小15 盧偉冰:全面對標iPhone
16
雷軍最新內部演講全文曝光:小米要成為同檔最安全的車 要做行業(yè)的領導者
17
榮耀400系列代言人官宣:就是肖戰(zhàn)
18
出貨量從“國內第一”到“跌出前五”,榮耀手機亟待“重生”
19
中國移動“三大回饋計劃”暨515移動愛家日重磅發(fā)布
20
磁力方舟推出618全周期投放指南,智算精投,高效撬動大促新增量
關于我們

微信掃一掃,加關注

商務合作
  • QQ:61149512