Molet

内容安全产业任重道远,网易易盾内容安全智能体系升级

Molet 安全防护 2022-11-27 343浏览 0

日前,网易易盾举办了一场2019内容安全智能体系发布会,分享易盾对内容安全体系建设的前瞻思考,并正式发布了面向智能时代的审核管理系统。中国人工智能产业发展联盟办公室主任、网信技术委员会秘书长石霖、央视网网络安全部副总监黄乐受邀发表主题演讲,现场一百多位企业内容风控人员全程参与了本次活动,共同研讨内容安全体系建设和实践。在会后,网易易盾CTO朱浩齐和网易易盾产品总监饶晓艳还共同接受了媒体的采访,分享了网易易盾内容安全体系的创新之处和应用价值。

  内容识别产业初见雏形 三大困局待破解

  石霖表示,在互联网飞速发达的时代,大量的有害信息也相伴相生,文字、图片、音视频不仅是传递互联网信息的有效载体,也成为了色情、暴、恐等有害信息传播的载体。

  他透露了一个专网通报数据,仅在2019年11月,各级网信部门就受理了970多万件有害信息的举报,几乎每位网民都曾经受到有害信息的侵扰。国家一直在出台各种相关管理规定,今年10月网络音视频管理规定中,明确要求相应的媒体、网络音视频提供者,在传播发布视频时要具有相应的检测手段。而很多厂商也在积极参与,落地使用人工智能等技术来识别和处理文字、语音、图像、视频中存在的有害信息。

  石霖还指出内容识别产业仍然处于起步阶段,还有三大问题亟待解决:一是标准的缺失,二是训练数据的缺失,三是传播形式愈加复杂。

  智能做抓手,网易易盾一直在创新突破

内容安全产业任重道远,网易易盾内容安全智能体系升级

网易易盾CTO朱浩齐

  对于内容安全当下的现状,网易易盾CTO朱浩齐表示,为此易盾构建了面向未来的内容安全体系,希望通过智能驱动、统一联动、个性定制、共建众治的体系,能够全面高效地解决内容安全治理中的一些难题。

  朱浩齐告诉记者,随着法律法规越来越完善,再加上企业社区氛围调性建设,以及企业积极承担起社会责任,需要内容安全服务的企业也越来越多。他以苹果应用商店为例,AppStore有40多个应用类型的分类,每个分类都有上千款App,而这里面绝大部分App都有内容安全的需求。不仅如此,像不少传统行业也开始需要内容安全技术的帮助,例如金融行业,为了增加用户黏性,也开始做互动评论,这也使得他们的产品/社区必然遭受有害信息的侵扰。“内容安全正在上升期,到了2025年预计智能终端设备将上升到80亿规模,这些终端产生的信息将达到惊人的程度,一些有害信息的规模也可想而知。所以必须从眼下就着手内容安全生态的建设,而人工智能就是非常好的一个抓手。”

  据了解,本次网易易盾升级的内容安全智能体系就是利用智能驱动:目前99.8%以上的海量实时多媒体内容都可以被智能技术精准识别过滤。自然语义、图像识别、声纹识别等都在内容安全领域有成熟彻底的落地。而这,背后是网易易盾在技术上的持续打磨和迭代,光今年仅在图片检测能力升级上,就新增40+细分类模型,重要更新50次,性能提升30%,召回和精确度提升10%……

  据朱浩齐透露,智能驱动更加高效,漏判率远低于纯人工审核,智能指标模型精确度非常高,这得益于网易拥有海量的训练数据,能够搜集到大量的误判数据,从而帮助机器提升误判基线。他告诉记者,传统的内容审核往往是依赖关键词,但是网易易盾建立了智能关键词模型,能够进行上下文的语义理解,从而结合整篇文章的语句进行判断,准确率高。更重要的是,还节省了大量的人力成本,将人工审核的工作量至少降低80%,这也就意味着用户如果采用网易的内容安全技术,仅需很少的人力成本就可以实现内容安全高度控制。

内容安全产业任重道远,网易易盾内容安全智能体系升级

网易易盾产品总监饶晓艳

  饶晓艳坦言,其实灰黑产也一直紧跟新兴科技发展步伐,不断尝试用更新的手段隐藏自己。例如过去不法分子将关键信息隐藏在文本中,看似是无意义的字符串,传统内容安全技术识别不出问题,但是现在通过网易易盾的技术做文本内容聚类,就可以真正识别出这些隐藏的非法信息。再以图像信息为例,灰黑产在不同图片的不同位置放置二维码,试图瞒天过海,一般的内容安全技术的确识别出来,但是通过图像聚类就可以火眼金睛识别出来。“虽然灰黑产一直都没有停止扩充的步伐,但我们的技术一直在进步,研发创新也一直在突破,遏制他们发展势头。”

  面向智能时代设计的审核管理系统

  在本次发布会上,网易易盾还发布了面向智能时代设计的审核管理系统。之所以推出这套审核管理系统,是因为传统审核长久一直缺乏相应通用规范,操作后台长期得不到研发支持,大多数审核管理系统存在操作繁琐、设计陈旧、功能落后,甚至有些操作需要在多个后台跳转处理的问题。

  饶晓艳表示,相比较爆发式的内容增长和日趋严格的监管要求,审核管理系统已成为企业内容安全的最大短板,严重影响了审核效率和安全要求。而网易易盾此次发布的审核管理系统是面向智能时代的审核机制而设计,具有功能丰富、智能高效、轻量灵活、交互友好四大优势。“审核人员是企业内容安全的重要保障力量,为公司健康发展付出了很多,非常高兴可以为审核人员设计一套友好有温度的管理系统,让他们的工作更加轻松快捷。”

  网易易盾脱胎于网易安全部,扎根内容安全领域已超过20年,2016年对外商用以来,已服务数千家企业,其中不乏OPPO/VIVO、B站、一直播等知名客户,每日过滤有害信息超过十亿条,目前已是国内领先的内容安全和业务安全服务商。

继续浏览有关 安全 的文章
发表评论