首页 > 实时讯息 >

揭秘算法如何帮助用户打破“信息茧房”:抖音开放日公开算法原理

4月15日,抖音在北京举办“安全与信任中心开放日”活动,相关业务负责人就抖音算法原理、平台治理体系以及社会关切的问题,展开了详细介绍。

据现场介绍,推荐算法作为人工智能机器学习技术的重要应用场景,本质上是一套高效的信息过滤系统。在抖音的实际应用中,推荐系统采取“人工+机器”协同的方式进行风险治理,始终有人工运营和治理体系为算法导航;同时多目标体系算法能主动打破 “信息茧房”,为用户带来更丰富多元、实用可靠的推荐结果。

目前,抖音安全与信任中心网站(95152.douyin.com)处于试运行阶段,正广泛向用户、创作者、社会各界征集意见。此次开放日活动,旨在鼓励广大公众体验抖音安全与信任中心,了解算法原理、机制和治理政策,共建平等友善、记录美好的社区。

抖音算法揭秘:以用户长期价值为目标,主动多样化推荐

推荐算法的出现,得益于人工智能技术。近二十年来,机器学习尤其是深度学习的进步,让人工智能大规模应用于信息分发成为可能。在信息爆炸时代,推荐算法成为人类与巨量信息相处的主流解决方案。

开放日上,抖音算法工程师刘畅讲解了算法原理和抖音算法的特点。刘畅介绍,抖音的推荐算法与国内外大部分内容推荐平台相似,包含召回、过滤、排序等环节,重点是学习用户行为。

抖音算法工程师刘畅介绍算法原理

抖音基于用户行为的推荐方法包含多种技术模型,如协同过滤、双塔召回、Wide&Deep模型等。算法可以在完全“不理解内容”的情况下,找到兴趣相似的用户,把其他人感兴趣的内容推荐给该用户。目前,抖音算法已几乎不依赖对内容和用户打标签,而是通过神经网络计算,预估用户行为,计算用户观看这条内容获得的价值总和,把排名靠前的内容推给用户。

算法基于用户行为推荐,对可能发生的用户行为预测打分

“用户长期价值,是抖音推荐算法的‘北极星指标’,也就是我们最核心的业务目标。”刘畅表示,抖音更关注用户长期价值,而非追求平台的短期数据。为此,抖音算法考虑了众多目标,如完播、评论、点赞、对作者长期消费、分享、跟拍等,力图计算出更符合用户长期价值的目标。

为引导算法打破“信息茧房”,抖音算法在多目标建模体系下,设置了专门的探索维度。一是对用户在平台上已经表现出的兴趣,尽可能推荐更多样的内容,通过多样性打散、多兴趣召回、扶持小众(长尾)兴趣等方法控制相似内容出现的频次。二是帮助用户探索更多新兴趣,采用随机推荐、基于用户社交关系拓展兴趣、搜索推荐联动、“不感兴趣”不再展现等多种方式,让用户的主动行为影响推荐系统,使推荐更加个性化和多样化。

抖音算法主动打破“茧房”:推荐给朋友、不感兴趣、屏蔽关键词页面

平台治理体系:人工运营为算法护航,守护内容生态安全

算法能学习、预估用户行为,但因其无法理解内容语义,对内容的理解存在不足,可能导致违法违规、不良内容被推荐传播。因此,算法在真实使用场景中,必须由平台治理对其进行约束和规范。

以抖音为例,据抖音生态运营经理陈丹丹介绍,抖音的内容治理体系是“人工参与+机器学习”相结合的模式,并组建了专门的平台治理团队为算法设置“护栏”。

抖音生态运营经理陈丹丹介绍平台治理体系

抖音平台治理体系包括异常感知、标准定义、机器识别、人工研判、风险处置等过程。治理流程秉持两大准则:1)所有在平台发布的内容都会经过评估,流量越高的内容评估次数越多,标准也越严格;2)抖音内容审核采用“人工+机器”相互配合的模式,“机器”负责“宽度”评估所有投稿,“人工”负责“深度”,确保专业、敏感或疑难等问题尽可能精准研判。

抖音内容治理采取“人工参与+机器学习”相结合的模式

创作者将内容上传至抖音后,首先进入机器识别环节。如果内容被识别出含有高危特征,将被直接拦截;若未命中高危特征但模型判断有问题,则会送至人工审核;若问题概率较低,则获得基础流量进入下一环节。视频被举报、评论区出现集中质疑、流量激增等情况出现,均可能触发“人工+机器”审核。一旦内容在任一环节被处置,系统会立即停止进一步推荐和分发。

针对社会普遍关心的、对用户造成较多困扰的焦点问题,抖音成立了数个专项治理团队,针对诈骗、网暴、虚假摆拍、未成年人保护、网络水军、AIGC技术滥用等一系列重大专项风险进行治理。例如,在不实信息治理方面,抖音于近日上线了辟谣卡,遏制不实信息的传播。

除了阐释算法、治理等议题,抖音安全与信任中心网站也公布了平台倡导的社区价值,以及对优质内容的定义。对于让用户有收获、有惊喜、有共鸣的优质内容,抖音增加了专门的推荐子链路,这些标记为优质内容子品牌“抖音精选”的内容,均有机会获得流量扶持。

未来,抖音将坚定推进各项举措,让算法更透明、治理更完善、服务更到位,并以安全与信任中心为依托,持续增加算法和治理透明度,回应社会关切的议题,主动公示违规案例治理情况,接受公众监督。