百科狗-知识改变命运!
--

如何用爬虫技术分析抖音视频数据?

一语惊醒梦中人1年前 (2023-12-06)阅读数 5#抖音技巧
文章标签数据时间段

之前某大神用爬虫把抖音一天所有短视频的数据都扒出来了,总共2万多条的数据,拿到数据之后,用这份数据洗出我们想要的几个关键点。

洗出人群的标签,标签包括爱好,关注点,时间点。

对2万数据经过清洗,经过描述做分词词频统计,排除无效词,统计出高频词“喜欢”“自己”“真的”“可以”“教程”“发型”“思域”“化妆”等,这里我们之后引出可以干嘛。

如何用爬虫技术分析抖音视频数据?

接着是时间段,这个主要是为了统计用户的习惯,客观是可以看出用户在什么时间段比较活跃。

再根据上面用户发布时间段的时间统计出这个时间段用户的点赞转发量做为参考,最终得到下图。这样可以得到比较准确的时间段。

可以明显在时间段看出效果的差别,下午13:00和晚上18:00是点赞高峰期。

在统计的2万条数据里面再进行一次点赞的分布曲线的清洗,大概的出的数据分布,大部分的短视频点赞在700以下,上万的短视频占比并不大,这个是抖音的数据造成的,按照之前做今日头条的算法都是计算你前面1000个推荐量,你所获得的点赞率与转发量。这个时候你的转发量点赞量(比例)高的话再会推送下一批流量给你。

所以前面1000个点赞量很关键。

上面用工具干完数据清洗最大的一个版块是人肉再清洗,人肉清洗是为了得到热门短视频的标签。参考这部分数据是为了之后做短视频的时候去靠这个方向。大概类型有几大块!

1、舞蹈

2、高效段子

3、才艺

4、模仿

5、励志鸡汤

6、特色景点

7、恶搞

8、撩**姐撩小哥哥

9、正能量

10、炫技能

11、挑战

从这些热门内容标签统计出来最终满足热门的背后人性属性,因为属性才可以复用,内容不能模仿。

这里祭出大杀器,满足疯传的触发器。公式:社交货币、诱因、情绪、公共性、实用价值=传播。

在你去看所有这类短视频的时候,你去思考背后哪些关键点触发了你的行动,去点赞转发了。

二次传播的核心点,一种里利益上面的驱动,这个驱动的方式也很多比如在微信里面点赞送礼品,转发送产品,这个抖音里面也有一批这样玩的,尤其年前的时候点赞送手机疯了一段时间。这个就是典型的利益驱动。

除了这个物上面的利益驱动,还可以调动的就是社交货币的价值的六个维度。

鹏仔微信 15129739599 鹏仔QQ344225443 鹏仔前端 pjxi.com 共享博客 sharedbk.com

免责声明:我们致力于保护作者版权,注重分享,当前被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自自研大数据AI进行生成,内容摘自(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供学习参考,不准确地方联系删除处理!邮箱:344225443@qq.com)

图片声明:本站部分配图来自网络。本站只作为美观性配图使用,无任何非法侵犯第三方意图,一切解释权归图片著作权方,本站不承担任何责任。如有恶意碰瓷者,必当奉陪到底严惩不贷!

内容声明:本文中引用的各种信息及资料(包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主体(包括但不限于公司、媒体、协会等机构)的官方网站或公开发表的信息。部分内容参考包括:(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供参考使用,不准确地方联系删除处理!本站为非盈利性质站点,本着为中国教育事业出一份力,发布内容不收取任何费用也不接任何广告!)