抖音-推荐算法原理全文详解-高级优化师推荐

合集下载

抖音背后的算法和推荐系统的剖析

抖音背后的算法和推荐系统的剖析

抖音背后的算法和推荐系统的剖析抖音是一款风靡全球的短视频应用,据统计,截止2021年1月,抖音全球用户已达到10亿,其中海外用户占比超过三分之一。

抖音的火爆背后离不开其强大的算法和推荐系统。

本文将对抖音背后的算法和推荐系统进行剖析。

一、抖音的算法和推荐系统抖音的算法和推荐系统主要包括两个核心组成部分:内容分发和用户洞察。

1. 内容分发内容分发是指如何将内容分发到用户的视野中。

抖音的内容分发主要采用基于大数据和机器学习的推荐算法,其核心是用户行为分析和视频的标签、特征提取。

具体流程如下:(1) 数据采集:抖音每天会收集数十亿条用户的视频浏览、点赞、评论等数据,同时还会收集视频的标签、特征等数据。

(2) 数据预处理:抖音会对采集到的数据进行清洗、去重等预处理工作。

(3) 特征提取:基于采集到的数据,抖音会提取视频的标签、特征等数据,如:颜色、长度、背景音乐、文字、物体等。

(4) 模型训练:抖音会基于机器学习算法,如深度学习、卷积神经网络等,训练一个个性化推荐模型,该模型可以根据用户的历史行为和当前视频的标签、特征等信息,预测用户是否会喜欢该视频,然后将合适的内容推荐给用户。

(5) 推荐评估:为了评估推荐算法的效果,抖音会采用AB测试等多种方式,对不同的推荐算法进行评估,较好的算法可以优先竞争资源。

2. 用户洞察用户洞察是指通过收集、分析和理解用户行为,了解用户需求和喜好,从而提供个性化的推荐服务。

用户洞察主要分为两种方式:一种是用户行为分析,通过分析用户的点击、播放、点赞、评论等行为,了解用户的兴趣和行为习惯;另一种是用户画像分析,通过分析用户的年龄、性别、地域、职业等信息,深入了解用户需求和偏好。

抖音通过这两种方式,不断优化其算法和推荐系统。

二、抖音算法和推荐系统的特点1. 大数据支撑抖音的算法和推荐系统离不开大数据的支撑,其每天收集的数据量达到十亿级别。

只有通过大数据处理和分析,才能了解用户行为和提取视频特征,同时也需要大数据的支持来训练算法模型。

从抖音推荐算法来转变运营思维,抖音终极玩法指南

从抖音推荐算法来转变运营思维,抖音终极玩法指南

从抖音推荐算法来转变运营思维,抖音终极玩法指南抖音【扫盲】抖音赚钱的背后操作步骤揭秘,3步骤战略,轻松实现月入5万第一阶段养号破播放1.做出来一个10万+浏览量的抖音热门视频(掌握热门元素)第二阶段利用平台变现1.一个月赚一万块钱第三阶段自己变现【扫盲】告别抖音小白,拒绝被割韭菜1.一般4个视频会出现1个广告位2.抖音常用功能3.抖音账号如何授权4.抖音开通抖音小店【扫盲】如何掌握玩转抖音必备知识点?从此走上抖音赚钱之路?1.什么是DOU+ GD1.DOU+上热门一般6个小时就可以了选择智能投放不一定会把钱花完2.速推版3.DOU+GD 针对企业账号(高度分类)4.抖音禁入行业(密码:ax0a)跳转5.抖音是一个红利期的产品(5G没铺开)6.泛娱乐vs垂直类2.1.三把钥匙算法思维智能推荐综合因素一、抖音推荐原理与算法1.推荐基本逻辑:断物识人知道内容的属性和受众的喜好,才做算法匹配。

在图文时代,识别图文内容通过文本分析和图片识别的方式辨别,加上文章作者的属性,做出大概判定。

对于用户,通过其基本信息和他的阅读习惯判断。

完成了内容语义的识别和用户兴趣的判断,把内容推荐到指定用户面前就行了,为了判断内容的价值和优化推荐的准确性,头条会分级别推荐,这就是大家常说的500、1000流量池概念。

2.推荐原理:以人为本,协调过滤字节跳动曾经用一个30多页的PPT公开过他们的算法原理,非常清晰的讲了今日头条的分发逻辑,推荐大家去了解一下。

本公众号内回复“字节算法”即可获得源文件要做到精准高效的分发需要更多算法原理结合。

对于头条系的产品来说,协同过滤是其中非常重要的一个推荐原理。

协同过滤分为基于人的协同过滤和基于物的协同过滤,对于抖音来说,视频内容识别比图文更难,所以基于人(用户)的协同过滤占比更大。

也就是说让用户参与的“以人为本”协同过滤。

举个例子:A和B有相同的喜好,系统会把A喜欢的视频推荐给B,从“人以群分”这个角度来说,B应该也会喜欢。

抖音上热门算法怎么算?抖音平台的流量法则是什么?「精华分享」

抖音上热门算法怎么算?抖音平台的流量法则是什么?「精华分享」

抖音上热门算法怎么算?抖音平台的流量法则是什么?「精华分享」很多人在玩抖音的时候总是希望自己的抖音能火起来,但是自己的视频迟迟没有火起来,常常只是几十或几百的播放量这是为什么呢?那是因为你自己不了解抖音的算法。

抖音上热门算法完播率也就是说,你的视频在给推荐的用户中,看完的人有多少,占多大比率。

这个完播率越高,你的视频就会越被推荐。

点赞率也就是说,你的视频在给推荐的用户中,点赞的人有多少,占多大比率。

抖音系统计算的优质视频的点赞率是3%,如果你的视频点赞率越高于3%,抖音算法机制会给你更多推荐量。

互动率也就是说,你的视频在给推荐的用户中,评论的人有多少,占多大比率。

视频评论互动是账号活跃度、质量度检测的一个重要指标,跟抖音算法推荐机制直接挂钩。

转发率也就是说,你的视频在给推荐的用户中,转发的人有多少,占多大比率。

视频的转发率越高,抖音算法那推荐越高。

一般推荐到首页的,转发量都不低。

复播率也就是说,你的视频在给推荐的用户中,重复看的人有多少,占多大比率。

视频重复播放,代表着用户对视频的肯定,抖音推荐机制也会相应的增加推荐。

抖音平台的流量法则抖音平台是一个巨大的流量池,抖音推荐机制是一个渔网,视频内容是鱼饵。

抖音的流量池有它的法则。

第一个流量池是冷启动池,流量是300-500。

一般抖音你发布的作品,抖音推荐到第一个流量池,给你的朋友,同城的人看看,看看怎么样。

第二个流量池是热启动池,流量是1000-5000。

第三个流量池是待推荐池,流量是10000以上的播放量。

这三个流量池是基础的。

当你的视频,到冷启动池有3%-5%点赞评论,平台就会上第二个池。

记住3%-5%,视频要上到上一个流量池要有3%-5%的点赞评论。

这个3%-5%我们就可以自己操作下。

自己做点文章。

真的想要自己的视频火起来的话需要提前了解一下抖音上热门算法怎么算以及抖音平台的流量法则。

图解抖音推荐算法

图解抖音推荐算法

图解抖音推荐算法抖音推荐算法究竟如何是做抖音短视频运营的同学非常关心的问题,抖音官方并没有披露正式的算法,但凭借着民间的智慧和官方披露的部分信息中,网友已经总结出抖音推荐算法的秘密。

这里整理资料如下:首先看短视频发布后抖音一般会进行的一系列推荐流程第0步:双重审核在抖音,每天有数量庞大的新作品上传,纯靠机器审核容易被钻空子,纯靠人工审核又不太现实。

因此,双重审核成为抖音算法筛选视频内容的第一道门槛。

机器审核:一般是通过提前设置好的人工智能模型来识别你的视频画面和关键词,它主要有两个关键作用:其一,审核作品、文案中是否存在违规行为,如果疑似存在,就会被机器拦截,通过飘黄、标红等提示人工注意;其二,通过抽取视频中的画面、关键帧,与抖音大数据库中已存在的海量作品进行匹配消重,内容重复的作品进行低流量推荐,或者降权推荐(仅粉丝可见、仅自己可见)。

人工审核:主要集中在3块:视频标题、封面截图和视频关键帧。

针对机器审核筛选出疑似违规作品,以及容易出现违规领域的作品,抖音审核人员进行逐个细致审核。

如果确定违规,将根据违规账号进行删除视频、降权通告、封禁账号等处罚。

第一步:冷启动抖音的推荐算法机制是著名的信息流漏斗算法,也是今日头条的核心算法。

通过审核后,第一步叫冷启动流量池曝光,比如你今天上传一个视频,通过双重审核的作品,系统将会分配给你一个初始流量池:200-300在线用户(也可能有上千个曝光)。

不论你是不是大号,只要你有能力产出优质内容,就有机会跟大号竞争。

第二步:数据加权抖音会根据这1000次曝光所产出的数据,结合你账号分值来分析是否给你加权,比如完播率、点赞、关注、评论、转发、转粉、游览深度等。

以上这些都会对你的短视频数据造成影响,以及对你的短视频作出是否要加权的判断,然后会挑选前10%的视频,再增加1万次曝光。

第三步:加大推荐。

抖音热门机制算法详解百万粉丝背后的逻辑

抖音热门机制算法详解百万粉丝背后的逻辑

抖音热门机制算法详解今天这节分享抖音热门机制算法,我们首先来看抖音算法的原理图(打个比方:)一个新视频发布后,会先系统检测是否违规,如果违规,就会做删除视频,或者封号处理、是否封号主要看你账号的违规程度,一般情况下只是删除视频。

如果没有违规,作品上传成功之后,会同时推荐给300个在线用户推荐,这300个就是初始的流量池,这300人产生的点赞、评论、完播(把视频看完)、分享的数量达标之后,就会进入代推荐列表,进行人工审核。

如果人工审核有问题,就会将作品屏蔽只能自己看到或者删除。

如果人工审核也没有违规,就会进一步往更大的流量池推荐,比如说,同时给3000人推荐,达标后再进一步推荐给1万人,以此类推抖音的推荐机制,前面的课程也说了,是给你的作品打上标签,给用户打上标签,然后把合适的内容,推荐给对应的人,比如你的作品是服装搭配的分享,系统就会把你的作品推荐给喜欢看服装搭配的人。

接下来我们继续讲抖音账号权重的算法。

通常来说新注册的一个账号,她的前五个作品非常重要,她能够决定你这个账号初始的权重和你账号的标签,因为你新账号没有发布过作品,开始是没有标签的,所以最初你发布的这几个作品会给你的账号打上标签,然后才能把你的作品推荐给相应标签的人根据他们的反馈再一级一级的往更大的流量池去推荐,当然如果你不能进入到下一个流量池那就直接刷掉,所以说如果你前5个视频发布出来以后比较受粉丝欢迎,同时内容也是比较垂直的就非常容易上热门了下面继续说一下热门账号的标准,权重区间是如何划分的首先我们来说第一种,僵尸号账号连续发布一周作品,她的播放量一直都在100以下,基本可以判定这个账号是僵尸号了,僵尸号基本可以判定是个废号,一般我们建议直接换号,出现这样的情况一般是我们没有做好养号的步骤,也可能是账号本身或者你的手机号各方面的原因造成的!第二种最低权重号最低权重号怎么判定呢?如果你的账号连续一周的作品播放量都在在100-200之间就属于最低的权重号,最低的权重号她只会被推荐到D级的流量池,如果说你连续半个月的作品播放量都没有突破的话,她就会被降为僵尸号,也就会变为废号。

抖音推荐机制

抖音推荐机制

根据首波用户的转发 评论、点赞以及完播 率达到系统设定的算法 进入下一级推荐池
根据系统热门推荐算法 择优质内容,经由人工 审核进热门推荐。
抖抖音涨粉原理——推荐机制(算法推荐)
账号维度指标
账号
是否达人认证
完播率
头像、昵称、签名、性别、其他资料
完播率
视屏的完整播放率
进入蓄池
二点次赞推荐
点赞数、点赞率
上传抖音视屏
机器 检测
视频、画面 标题、关键词
发布违规
人工检测
抖抖音涨粉原来-从发布到推荐流程介绍
发布违规
用户 反馈
反馈差
停止推荐、删除视频
推荐用户不精准
未通过
视屏质量打分 内容不重复进入蓄池
二次推荐
画面消在重此 输 入 您 的 封 面 副视屏标差题
关键词匹配
进入蓄池 爆款带动 二次推荐
作者申诉 人工审核 被举报
2、背 景: 第一:价值放大效应 第二:第一光环效应
3、个性签名: 控制在9个字,最多不超20个字、不能有敏感词
2、新旧对比法:和同行区分对比
进入蓄原则池一:高清像素,不用景色,不用杂乱场景,不用动物。 二次推荐
原则二:避免硬性广告植入,避免国家机关制服,避免各类遮挡。
1、头 像:
原则三:个人形象要简洁,建议使用商务证件照,尽量避免使用远景全身照。
原则四:如果用文字做头像,字体要清晰,最好不要超过六个字。
原则五:头像可以和名字关联。增加辨识度。

删除视频、限流
违 规
停止推荐
反 叠加推荐 馈

ቤተ መጻሕፍቲ ባይዱ
更高流量池 二次推荐
确认违规
反馈差

抖音算法揭秘,百万粉丝的背后逻辑

抖音算法揭秘,百万粉丝的背后逻辑

抖音算法揭秘,百万粉丝的背后逻辑百度有百度的算法、微信有微信的算法、头条也头条的算法,算法是任何平台必不可少的机制,今天就来分享一下抖音的算法机制。

一、科普算法是什么?简单通俗的讲,算法就是一套评判机制。

这套机制对平台的所有用户都有效,无论是内容生产者(拍视频的人)或内容消费者(看视频的人),很多时候我们既是生产者也是消费者。

我们在平台上的每一个动作都像是一个清晰的指令,平台根据这些指令来判断我们的性质。

并将我们分为优质用户、沉默用户、流失用户、可挽回用户等;除此之外,它还会判断我们是否为营销号,有没有违规操作。

如果是平台就会将我们的账号关进小黑屋;相反如果判断出我们是一个优质的用户,平台就会给予我们一定扶持。

算法有什么用?算法对于平台最大的用处是管理自己平台上的用户数据,并且根据用户的一系列反馈行为来改进平台功能,提高用户体验从而使平台吸引更多用户、留住更多用户,最终使平台形成一个可循环的良性生态。

算法有什么好处?算法对内容生产者的好处:我们既然想在别人的地盘为自己吸粉,就一定要明白别人的规则。

就像追一个女孩子你得明白女孩子的喜恶,才有机会见缝插针地进入她的心。

更何况,读懂平台比读懂女孩子容易的多!只要我们意识到平台的推荐机制,我们便可以有意识的设计自己的行为,引导平台判定我们是优质用户从而分配给我们更多、更精准的流与更高的权限。

算法对内容消费者的好处:大家刷淘宝、抖音或者头条刷的某一类内容多了,下次再打开APP时是否觉得很多推荐的内容都是自己比较喜欢比较有兴趣看的?其实平台为了提升用户体验为了留住你。

它会根据你的行为来分析你的兴趣,然后给你打上一个标签再将同类标签的内容生产者的内容推荐给你,你们便是一个池子里的人。

总之,推荐算法会为我们匹配到我们想要的东西。

为内容生产者匹配到精准的用户,为内容消费者匹配到感兴趣的内容。

明白了算法是什么以及它的重要性以后去任何平台引流的第一件事就是先了解平台的算法,而不是傻兮兮的去引流,这样只会被平台判断为营销号然后被封杀。

抖音推荐算法原理全文详解

抖音推荐算法原理全文详解

抖音让每个人都有机会爆红,可为什么别人玩抖音,就能轻松获得10w+点赞,而你怒拍几十上百就是不热门。

抖音的游戏规则是什么,推荐算法怎样的!那么这就必须了解算法背后的逻辑:流量池,叠加推荐,热度加权及用户心理追求。

我们只需要知晓抖音的推荐算法,然后我们围绕着算法制作优质的15秒视频内容即可,不断的去优化15秒内容即可,流量会越来越大。

在讲解抖音推荐算法之前,先说说抖音推荐算法的好处,明白了好处,你就清楚抖音15秒内容应该朝着哪些方向去制作。

在抖音平台,哪怕你没有任何名气,没有一个粉丝,完全零流量,也可以在很短的时间内打造出一个100万精准粉丝的大号。

只要你做出了视频,抖音平台都会自动分配精准流量给你,为我们带来大量的曝光度,收割大量的粉丝和关注度。

抖音推荐算法的好处:①让每一个有能力做出优质视频的抖音创作者,得到了跟百万粉丝、千万粉丝大号公平竞争的机会,不会因为你刚来,就遏制你。

②遏制了垃圾视频的发展(搬运+用户不喜欢的),要么限流,要么直接干掉。

③放任优质视频的传播(原创+用户喜欢),尤其是垂直定位的抖音号更受用户欢迎,受到平台的优待。

④帮助真正想玩抖音的人优化视频,获得更大的曝光量,想办法帮助优质作者涨粉、赚钱,各种福利政策奖励给抖音作者。

那抖音是如何推荐作品的,也就是我们作品上热门的原理是什么,这里给大家讲解一下:①流量池②层层推③时间性这个是我自己总结的经验,后面会随着我们的实战测试,不断的总结抖音推荐算法,到时候我们都会写出文章、做出视频。

①流量池不知道我们玩过抖音的朋友发现没,刚刚发布的作品都会有那么几百个播放量,这个是抖音自动为我们的作品分配的流量,所以不管你发布作品的好坏,只要不违规,通过了,多少都会有人观看(播放量),这个我们就叫做流量池。

要想让我们的流量池的流量越来越大,说白了,核心就是15秒抖音内容,这个我们在后面单独一篇文章为大家讲解抖音15秒内容运营。

很多粉丝发现,自己的作品最开始是几百个播放量,后面越来越少,甚至没有,这个要么是我们作品违规,要么作品质量太差,慢慢可能就会降低推荐,缩小流量池,甚至是0播放量。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
因为整个模型是打通的,子频道探索空间较小,更容易满足用户需求。只通过单一信道反馈提高推荐准确率难度会比较大,子频道做的好很重要。而这也需要好的内容分析。
上图是今日头条的一个实际文本case。可以看到,这篇文章有分类、关键词、topic、实体词等文本特征。
当然不是没有文本特征,推荐系统就不能工作,推荐系统最早期应用在Amazon,甚至沃尔玛时代就有,包括Netfilx做视频推荐也没有文本特征直接协同过滤推荐。
召回策略种类有很多,我们主要用的是倒排的思路。离线维护一个倒排,这个倒排的key可以是分类,topic,实体,来源等。
排序考虑热度、新鲜度、动作等。线上召回可以迅速从倒排中根据用户兴趣标签对内容做截断,高效的从很大的内容库中筛选比较靠谱的一小部分内容。
二、内容分析
内容分析包括文本分析,图片分析和视频分析。头条一开始主要做资讯,今天我们主要讲一下文本分析。文本分析在推荐系统中一个很重要的作用是用户兴趣建模。
此外,平台出于内容生态和社会责任的考量,像低俗内容的打压,标题党、低质内容的打压,重要新闻的置顶、加权、强插,低级别账号内容降权都是算法本身无法完成,需要进一步对内容进行干预。
下面我将简单介绍在上述算法目标的基础上如何对其实现。
前面提到的公式y = F(Xi ,Xu ,Xc),是一个很经典的监督学习问题。可实现的方法有很多,比如传统的协同过滤模型,监督学习算法Logistic Regression模型,基于深度学习的模型,Factorization Machine和GBDT等。
这个过程中主要的延迟在用户的动作反馈延时,因为文章推荐后用户不一定马上看,不考虑这部分时间,整个系统是几乎实时的。
但因为头条目前的内容量非常大,加上小视频内容有千万级别,推荐系统不可能所有内容全部由模型预估。
所以需要设计一些召回策略,每次推荐时从海量内容中筛选出千级别的内容库。召回策略最重要的要求是性能要极致,一般超时不能超过50毫秒。
模型之后再看一下典型的推荐特征,主要有四类特征会对推荐起到比较重要的作用。
第一类是相关性特征,就是评估内容的属性和与用户是否匹配。显性的匹配包括关键词匹配、分类匹配、来源匹配、主题匹配等。像FM模型中也有一些隐性匹配,从用户向量与内容向量的距离可以得出。
第二类是环境特征,包括地理位置、时间。这些既是bias特征,也能以此构建一些匹配特征。
模型的训练上,头条系大部分推荐产品采用实时训练。实时训练省资源并且反馈快,这对信息流产品非常重要。用户需要行为信息可以被模型快速捕捉并反馈至下一刷的推荐效果。
我们线上目前基于storm集群实时处理样本数据,包括点击、展现、收藏、分享等动作类型。
模型参数服务器是内部开发的一套高性能的系统,因为头条数据规模增长太快,类似的开源系统稳定性和性能无法满足,而我们自研的系统底层做了很多针对性的优化,提供了完善运维工具,更适配现有的业务场景。
目前,头条的推荐算法模型在世界范围内也是比较大的,包含几百亿原始特征和数十亿向量特征。
整体的训练过程是线上服务器记录实时特征,导入到Kafka文件队列中,然后进一步导入Storm集群消费Kafka数据,客户端回传推荐的label构造训练样本,随后根据最新样本进行在线训练更新模型参数,最终线上模型得到更新。
但对资讯类产品而言,大部分是消费当天内容,没有文本特征新内容冷启动非常困难,协同类特征无法解决文章冷启动问题。
一个优秀的工业级推荐系统需要非常灵活的算法实验平台,可以支持多种算法组合,包括模型结构调整。因为很难有一套通用的模型架构适用于所有的推荐场景。
现在很流行将LR和DNN结合,前几年Facebook也将LR和GBDT算法做结合。今日头条旗下几款产品都在沿用同一套强大的算法推荐系统,但根据业务场景不同,模型架构会有所调整。
这里还有一个问题,如何引入无法直接衡量的目标?
推荐模型中,点击率、阅读时间、点赞、评论、转发包括点赞都是可以量化的目标,能够用模型直接拟合做预估,看线上提升情况可以知道做的好不好。
但一个大体量的推荐系统,服务用户众多,不能完全由指标评估,引入数据指标以外的要素也很重要。
比如广告和特型内容频控。像问答卡片就是比较特殊的内容形式,其推荐的目标不完全是让用户浏览,还要考虑吸引用户回答为社区贡献内容。这些内容和普通内容如何混排,怎样控制频控都需要考虑。
第三类是热度特征。包括全局热度、分类热度,主题热度,以及关键词热度等。内容热度信息在大的推荐系统特别在用户冷启动的时候非常有效。
第四类是协同特征,它可以在部分程度上帮助解决所谓算法越推越窄的问题。
协同特征并非考虑用户已有历史。而是通过用户行为分析不同用户间相似性,比如点击相似、兴趣分类相似、主题相似、兴趣词相似,甚至向量相似,从而扩展模型的探索能力。
没有内容及文本标签,无法得到用户兴趣标签。举个例子,只有知道文章标签是互联网,用户看了互联网标签的文章,才能知道用户有互联网标签,其他关键词也一样。
另一方面,文本内容的标签可以直接帮助推荐特征,比如魅族的内容可以推荐给关注魅族的用户,这是用户标签的匹配。
如果某段时间推荐主频道效果不理想,出现推荐窄化,用户会发现到具体的频道推荐(如科技、体育、娱乐、军事等)中阅读后,再回主feed,推荐效果会更好。
第二个维度是用户特征。包括各种兴趣标签,职业、年龄、性别等,还有很多模型刻划出的隐式用户兴趣等。
第三个维度是环境特征。这是移动互联网时代推荐的特点,用户随时随地移动,在工作场合、通勤、旅游等不同的场景,信息偏好有所偏移。
结合合适。
抖音推荐算法原理全文详解
本次分享将主要介绍今日头条推荐系统概览以及内容分析、用户标签、评估分析,内容安全等原理。
一、系统概览
推荐系统,如果用形式化的方式去描述实际上是拟合一个用户对内容满意度的函数,这个函数需要输入三个维度的变量。
第一个维度是内容。头条现在已经是一个综合内容平台,图文、视频、UGC小视频、问答、微头条,每种内容有很多自己的特征,需要考虑怎样提取不同内容类型的特征做好推荐。
相关文档
最新文档