成都专业网络服务联系028-81876590


如今,对于社会化网络和内容分享,社会化媒体已经变得非常普遍和重要。但这些网站产生的内容仍未被广泛利用。在这篇论文中,我们阐释了如何用社会化媒体的内容预测真实的结果。具体地,我们利用twitter.com的评论预测电影的票房收入。我们展示了一个简单的模型,这个模型基于某一话题的tweets(twitter上的言论)的产生率,我们的这个的预测要强于基于市场的预测结果。进一步,我们阐释了如何利用twitter中提取的情感因素提升社会化媒体预测能力。
A. 发行前关注度
电影上映前期,厂商会用各种方式(视频、报纸、博客、图片)产生促销信息。我们(作者)认为上映前期的tweets主要包括这些促销活动信息,以促使大范围的口碑传播。在twitter上,这些信息可以分为两类tweets:包括url的tweets(链接到电影预告、海报等)和retweets(关于电影的转帖评论)。这两种tweets对电影上映的传播都很重要。
如上图,我们发现影片上映前包括url的tweets的比例多于上映后,这和我们的预期一致。我们发现retweet的数量在三周内基本持平。总的来说,我们发现retweets是电影评论tweets中重要的少数派。其中一个原因可能是人们更愿意描述自己的预期和经历,这些不必是宣传的内容。
我们试着验证是否具有更佳公共性(指包含url的tweets的数量)的影片会获得良好的票房收入。但我们发现带url的tweets和retweets与票房表现只是中等相关(相关性不强)。我们本以为促销信息会对票房收入贡献巨大,这使我们感到惊讶。
B. 上映第一周票房收入预测
接下来我们看看社会化媒体中提炼出的信息能否准确预测真实世界中的结果。看看我们能否用影片上映前的tweets预测影片上映后第一周的票房收入。
我们定义了一个变量twitter rate(微博率):每小时tweet数量。我们用average twitter rate(平均微博率)和24部电影的票房收入作了相关性研究,结果是两者之间存在强的线性相关(相关系数达到0.9)。
A. 主观性
我们预计相较于上映前,电影上映后应该有更多主观性的tweets。上映后主观的tweets可视为推荐,看过电影的人们更可能去影响别人。为了捕捉主观性,我们定义了一个公式:
主观性=(正面+负面评论)/中性评论。
通过计算发现,主观性评论在电影上映后呈现增长。
B. 流行度
正面评论多于负面评论的电影显然更可能成功。
流行度=正面tweets数量/负面tweets数量
我们发现在所有电影的关键期(上映前一周到上映后两周),正面言论都多于负面言论。