鱼羊 发自 凹非寺
量子位 报道 | 公众号 QbitAI
10万美元奖金,却有不少场景因为使用了人脸识别而被叫停。“人脸识别是否被‘滥用’”是业界一直在讨论的话题。7月28日,花落双鸭山!
4个月来备受瞩目的2021腾讯广告算法赛,法院发布《法院关于审理使用人脸识别技术处理个人信息相关民事案件适用法律若干问题的规定》(以下简称“规定”),如今结果出炉。
来自中山学的两位选手,对滥用人脸识别问题作出了司法统一规定,以远超其他队伍的精度成绩,该规定自8月1日起施行。图源:法院《规定》显示,最终从来自华科、复旦等上千家高校和企事业单位的4335位参赛者中脱颖而出,商场、宾馆、车站等经营场所、公共场所违反法律、行政法规的规定,摘下奖。
这场决赛虽然在线上进行,使用人脸识别技术进行人脸验证、辨识或者分析,但百万奖金池+腾讯牛镇场这样的组合,应当认定属于侵害自然人人格权益的行为;物业也不得将“刷脸”作为进出社区的唯一验证方式;此外,仍然吸引了不少来自学界、产业界的关注。
从场外的加油助威声中,信息处理者必须就人脸信息处理活动单独取得个人同意,便可见一斑。
话说回来,而不能与其他信息捆绑授权。如此,奖励丰富,被滥用的人脸识别会“踩刹车”吗?01供应商暂停提供人脸识别方案20多平方米的万科上海一售楼处内,自然是腾讯广告算法赛吸引关注的重要原因之一。
但最终能吸引各路高手踊跃报名参与角逐,比赛背后腾讯提供的独家资源,和双双入选2021年ACM Multimedia Grand Challenge(ACM多媒体挑战赛)的高含金量赛题,同样起到了重要的作用。
就有不少选手表示,此番有关视频广告内容理解的赛题“够难,够有挑战性”。还真别小看它们,其中,“视频广告秒级语义解析”作为最早被提出的赛题,最初还曾因难度太差点被组委会“放弃”。
赛题背后的故事
仔细说来,此次腾讯广告算法赛的赛题共分两路:
视频广告秒级语义解析
多模态视频广告标签
不难看出,紧紧围绕的都是AI对视频内容的理解,只是在时序精度的要求上有难易之分。
回忆起年初设定这道赛题的初衷,腾讯广告多媒体AI中心高级算法研究员芦清林博士说,“秒级语义解析一直是视频理解亟待解决的问题”。
为什么?
随着5G时代的到来,以视频为载体的内容越来越受到用户欢迎。视频广告自然也乘风起势,呈现出爆发式的增长。
以腾讯广告为例,一年前视频创意的日增量在10万条左右,到今年6月则已突破50万条。
如此一来,随着广告的原生化、内容化和个性化,面对腾讯丰富的流量场景,效果广告主和服务商要提供与之匹配的创意产能,事实上面临着非常的挑战——
随着视频广告量的爆发,用户也会更快地产生视觉疲劳。所以在提升生产效率之外还要考虑创意质量。
腾讯广告平台产品技术创意中心总监杨秀金,在和效果广告主的沟通中,就对他们的痛点深有感触:
其一,视频产量,头服务商周生产视频产量已超3000条。其二,创意跑量效果不确定,造成运营成本高。
如何通过技术手段降低运营成本?两个方向:帮助客户进行创意工业化生产,以及创意科学化度量。
但要实现这两点,都离不开对视频内容的深度理解。也就是说要在现有的视频基础理解技术之上,增加对视频时序和语义的理解。
所以在年初腾讯广告算法赛启动命题工作时,“视频秒级语义解析”几乎第一时间就进入到出题组的视线范围中。
视频秒级语义解析的核心点,简单说就是让AI能搞清楚视频的镜头与片段语义表达。
“比如视频的前3秒画面中,一桌人在一起吃烤鸭,正吃着,鸭子飞了。算法不仅要识别出画面中人和鸭子的特点,还要从语义层面理解到‘煮熟的鸭子飞了’这一层意思。”杨秀金解释说,“只有深度理解视频内容,才能精准制作和分析用户感兴趣的内容特征,为用户推荐精准原生广告内容。”
如此看来,“视频广告秒级语义解析”这道赛题,不正符合腾讯广告算法赛一贯以来紧贴行业趋势,又能扣住前沿算法的命题标准吗?
但命题组却犹豫了。
这道赛题,难度有点高了。
事实上,不要说对于高校里的学生,对于整个行业来说,秒级解析在实际业务中都是个难题。
一方面,随着内容推荐的进一步精细化和实时化,秒级内容的深度解析,会直接决定广告点击率的量级,业界需求越来越旺盛。
但另一方面,这样的算法技术却面临着三方面的困难:
用于训练、测试的数据集难得。学术界虽然有一些类似于行为分析这样的公开数据集,但这些数据集适用的场景与广告场景千差万别,训练出的模型在广告业务场景中的应用效果往往打折扣。
学术界、产业界尚未有相关的benchmark可作为评估标准。
秒级解析涉及到的实验计算量很庞。
杨秀金、芦清林和腾讯广告多媒体AI中心总监刘威也曾经考虑过选择其他赛题,但兜兜转转,还是觉得“视频广告秒级语义解析”这个题目最符合行业趋势、行业痛点,也跟实际广告业务结合最紧密。
有难度,其实也代表着有更高的行业价值。
最后,基于腾讯广告算法赛探索前沿难题,实现算法交流的初心,命题组还是拍了板:克服困难,坚持采用“视频广告秒级语义解析”这道题,为业界贡献出第一个视频广告理解的baseline。
当然,为了扩参与度,平衡难度,他们又选择了“多媒体视频广告标签”这一在视频时序上技术门槛要求更低的赛题,组成了相互配合的双赛道。
AI如何改变广告系统
连赛题的选择都如此慎之又慎,既要考虑商业应用,又要考虑学术价值,腾讯广告对这样一场算法赛的重视可见一斑。
而事实上,这样的高度重视,与腾讯广告自身的业务逻辑是分不开的:
AI已经改变了广告系统。
如今,AI已经渗透到了广告制作投放的方方面面,涵盖广告创意、智能制作、智能投放、定向、排序、策略、诊断分析等诸多环节。
结合自身在上下游数据、业务方面的优势,目前,腾讯广告多媒体AI中心在更底层的广告算法技术上,已经有了深入的探索和研究,积累下不少AI研究成果。
比如FaceChart人脸技术,基于人脸关键点定位、特征提取等基本模块,可以对人脸属性(性别、年龄、姿态、质量、表情等)进行识别,从而对广告内容进行深度解析。
FaceChart还首次提出了残差孪神经网络、去相关性学等技术,以提升人脸识别的准确率和鲁棒性。
而在顶会论文、国际赛事、专利等学术成就上,腾讯广告多媒体AI中心其实也已低调斩获不少荣耀:OCR技术在国际顶尖竞赛ICDAR上连续三届(2017~2021)排名世界第一,累计获得14项冠军;视频/图像技术获得北京市科技进步一等奖;在CVPR、ICML、PAMI、IJCV等顶会顶刊上发表相关论文25篇……
更重要的是,这些技术能力,已经扎扎实实落地到了腾讯广告的实际业务中。
比如广告智能审核平台,支持文本、图片、视频、落地页等所有广告素材类型,依靠CV、NLP、语音、深度学等技术,能够实现百毫秒级识别。目前支撑广告请求量3000万条/月,元素级请求近1亿次/天。
智能创作引擎,覆盖创意理解-分析-创作-投放全链路,在游戏、电商、金融、教育、网服等多行业,都能实现从视频预处理,到视频元素识别,再到生成预测、成片渲染的全流程一站式处理。
广告内容理解平台,能够对图片进行元素化理解,对视频进行秒级化理解,输出100+维度、几十万量级的标签,在广告投放、广告推荐、创意分析的各个环节中均可应用。
杨秀金就透露,在腾讯广告,目前已经有30%的创意是由AI生成的。
举一个简单的例子, 现在,依托于腾讯广告的平台,广告主在投放视频广告时,无需手动去调整各种16:9、4:3的视频尺寸,一键交给AI就可以搞定。
不仅如此,通过对关键帧的截取分析,系统还能更精准地判断、填充广告中的利益点,提升广告整体的点击率、转化率。
如此一来,在广告创意生产到投放的各个环节中,量重复的工作都被AI智能化接管了,广告主们自然无需再去堆叠人力应付低价值的工作,而是能把更多时间精力投入到让广告变得更好看这件事上。
并且在AI的辅助下,创意生产这一环节本身的效率也能提升。
难怪外界一直有这样的评价:
腾讯广告,可能是一个被低估的腾讯AI业务。
如何评价腾讯广告算法赛?
实际上,腾讯广告算法赛能有如今这样的影响力,背后离不开腾讯广告自身的场景优势、资源优势、技术优势。
正如腾讯公司裁蒋杰所说,“在这五年里,腾讯广告算法赛始终秉持着不变的初心,为全世界的技术人才提供产、学、研交流平台;同时,集结来自高校和企业的优秀算法人才,让家在共同的竞技与交流中,探索前沿技术解决方案。”
从真实场景的数据,到结合实际业务的赛题,腾讯广告算法赛既是腾讯广告的一个输出窗口,更在成为前沿技术方向的产学研交流平台:
腾讯广告提供学术界缺少的应用场景、一线数据,反过来,学术界的技术新突破、新思潮、新人才也能促进腾讯广告在技术上不断精进,保持领先。
这种双赢还在腾讯广告算法赛的5年中被不断加强。
首先,是资源支持力度的逐年增加。
到今年,赛官方在资源等方面的投入,说得上是集结腾讯全公司之力:有归属CSIG云与智慧产业事业群的腾讯云智能钛机器学平台(TI-One),提供AI算法平台支持;有来自TEG技术工程事业群的腾讯数据团队,提供自研、开源的高性能分布式机器学框架Angel,在算法资源方面给予选手支援;还有腾讯高校资源、腾讯招聘为比赛加码。
其次,是参赛选手资格的进一步。
现在,不仅高校学生可以参与腾讯广告算法赛,腾讯内员工,甚至是其他同行业公司的技术人员,都可以通过不同的赛道报名参赛。
今年,腾讯广告算法赛还和多媒体顶会ACM Multimedia达成了合作,且两道赛题均入选ACM Grand Challenge。
ACM多媒体挑战赛李锡荣是这样评价的:
过往,广告视频是业界相对研究比较少的领域,无论是从研究界的相关发文情况,还是当下公共数据集来说,都是比较稀缺的。
同时广告内容的理解此次分成了两个不同的Track,每个Track各有特点,比如视频标注任务,它和以往任务的不同之处在于它的标签结合是分类型的,其中涉及到场景的类型,也涉及到视频风格的类型,这种不同类型、不同概念之间相互结合影响的情况,正是学术界最为关心的议题。
同时,李锡荣也对本次腾讯广告算法赛寄予了厚望:
希望腾讯广告的挑战赛能够成为学术界和工业界良性互动的一个典范,成为行业的标杆。
同时,当技术能够在实际的产品中落地应用,乃至全球网民,都能够从这种多媒体智能处理技术的进步中实实在在地受益。
广告,不仅是互联网技术的重要商业模式,也是数字化经济进程中的关键组成,其体验的优劣又与我们每个人息息相关。
而腾讯广告孜孜不倦追求的,是要用最前沿的技术,促进整个行业更加向上地发展。
或许,这些前沿技术已经悄无声息地在你我的日常生活中体现。
— 完 —