来源 | Python爱好者社区(ID:python_shequ)
作者 | 书生婉悠
写这篇文章,最主要是想说明数据和数据分析在工作和生活中的实用性和重要性,顺便说一说我眼中的咪蒙。
很早之前就听过关于咪蒙的各种传说,其中,最让人羡慕的就是她坐拥千万微信公众号粉丝、单篇软文收入近 70 万、员工月薪 6 万、几乎篇篇文章 10 万+,这样的成就对于新媒体乃至整个内容行业来说都是神一样的存在。更夸张的是,当时见到稍微跟新媒体沾边的朋友,张口就问我对咪蒙怎么看,当时就特别好奇她到底是怎么做到的。
鉴于微信公众号粉丝数据很难获取,因此这篇文章的数据主要来源于 2 个:一是抓取咪蒙微博评论下的活跃粉丝数据,一共是 78429 条;二是,采集咪蒙全部文章数据。
咪蒙粉丝男女比例
在新媒体江湖中流传着“咪蒙的粉丝娶不起”这句话,虽然是调侃,但是从下图可以看出咪蒙的活跃粉丝女性占比达到78.58%,而男性只有21.42%。嗯,瞬间希望刚刚那句话不要成真。
咪蒙粉丝年龄分布
从年龄层面来看,咪蒙粉丝出生年份大都在1989- 1999 年之间,也就是年龄区间集中在18- 28 岁之间,其中最人数多的是处在23、24、 25 岁年龄层中。也就是说,咪蒙粉丝基本上是高中、大学、大学刚毕业未进入社会、缺乏家庭婚姻历练的“生活小白”。
咪蒙粉丝区域分布
从分布区域来看,咪蒙的广东粉丝占比最大,其次是上海和北京。从大范围看,东部沿海城市分布较为集中。
接下来的第二部分主要通过抓取咪蒙的微信公众号文章,通过对文章标题和内容做结巴分词和词频分析处理,得到咪蒙选题方向、文章内容主题的数据支撑。
从总体上看
对标题和标题分词后,再对分词做聚类分析,得到下图。从图上可以明显看到,特征点非常集中地分布在一起,突出反应了具有很明显的一致性。也就是说,从语义上和情感上,都具有数据分析的价值。
从整体词频来看,最为经常出现的关键词有:我们、喜欢、为什么、如何、男人、爱情、女生等,这也就是说咪蒙是非常擅长用这些关键词做标题,我们通过具体的标题来分析这些关键词。
1.出现频率最高的是“我们”,有下面这些标题:
咪蒙在她的文章中极其频繁地使用“我们”这个词。非常显而易见的是,她试图通过转换角色,让读者感同身受、产生共鸣。咪蒙非常懂得如何讨好她的重度读者,她的忠实粉丝是人生阅历和社会阅历几乎空白的少女,对未来的恐惧、成功、暴力、性、家庭、婚姻认知非常浅薄。因此她塑造的是一个恐惧失败、渴望成功、义愤填膺、粗暴直接的形象,这是她和她的读者想要代入的形象。
2.其次频次出现的就是“爱”、“我爱你”、“喜欢”这类情感倾向明显的词:
情感,马斯洛理论中最为直接的需求。此类文章,在数据分析中通常都是阅读量最高的文章。尤其是在高中、大学等刚开始接触感情、谈恋爱的时候,情感问题困扰着很多人。而咪蒙很擅长写这样的文章,她更厉害的是很了解读者的心里所想,能通过种种手法让读者感同身受、让读者分不清“文里文外”。
3.第三个频繁出现的词是“如何”:
咪蒙的定位,是为年轻女性代言,试图以高于重度粉丝的年龄和阅历的视角,来扮演粉丝群体的旗手。你会发现很多文章就是与这个群体谈心、八卦, 为她们呐喊、讲出心声。而这些包含“如何”的文章中,咪蒙就是要教你很多东西,例如教育、婚姻、情感、交际等。
文章评论 本文章有个评论