当前位置: 极速时时彩 > 极速时时彩 >

Facebook的'Rosetta'AI可以每天从十亿张图片中提取文字

2018-09-19 12:21 作者:极速时时彩 来源:极速时时彩 次阅读
电脑

在线人士不仅要与文字交流,还要与图像交流。对于像Facebook这样每月活跃用户超过20亿的平台,这意味着每天都会发布大量图片,包括模因。为了在相关的照片搜索结果中包含带有文本的图像,为屏幕阅读器提供一种方式来阅读在其上写的内容,并确保它们不包含仇恨言论和其他违反网站内容政策的词语,Facebook已经创建了部署了一个名为“Rosetta”的大型机器学习系统。

 

Facebook需要一个可以定期处理大量内容的光学字符识别系统,因此它必须让人联想到自己的技术。根据社交网络,Rosetta每天实时从各种语言中提取超过十亿个图像和视频帧的文本。

 

在一篇新的博客文章中,该公司解释了Rosetta的工作原理:它首先检测可能包含文本的图像中的矩形区域。然后它使用卷积神经网络来识别和转录在该区域中写的内容,甚至是非英语单词或非拉丁字母表,例如阿拉伯语和印地语。为了训练这个系统,Facebook使用了人机和机器注释的公共图像。

 

Facebook和Instagram中的各种团队已经在使用Rosetta来展示更多内容并监管他们的平台。该公司计划继续增加它可以理解的语言数量,并使其更好地从视频帧中提取文本。

 

说到语言,Facebook还为其自动翻译服务增加了24种新语言,包括塞尔维亚语,白俄罗斯语,马拉地语,僧伽罗语,泰卢固语,尼泊尔语,卡纳达语,乌尔都语,旁遮普语,柬埔寨语,普什图语,蒙古语,祖鲁语,科萨语和索马里语。 Facebook承认这些语言的翻译处于早期阶段,因此它们仍然会有很多错误。不过,它计划继续改进它们,并在未来推出更多语言。

极速时时彩