基于数据挖掘的电影票房分析

合集下载

基于大数据的电影票房预测研究

基于大数据的电影票房预测研究

基于大数据的电影票房预测研究随着大数据技术的日益发展和推广应用,人们开始有了利用大数据来预测电影票房的想法。

虽然电影行业和票房收入的涵盖面很广,但是我们可以通过收集和分析大量的电影数据以及它们对观众的吸引力和接受度来推断出将来某部电影可能的票房收入。

本文将从数据来源、数据分析、预测模型和案例研究四个方面分别阐述基于大数据的电影票房预测研究。

一、数据来源数据是进行票房预测的基础。

数据来源通常可以分为两类:定量数据和定性数据,其中定量数据是指可以进行量化分析的数据,如电影的上映时间、票价、制片费用等等;而定性数据则是较为主观的,例如演员的知名度、电影风格等。

相信大家都能想到,电影评分、豆瓣评分等都是影响票房的重要因素,这些评价指标将会是我们收集数据时最为关注的方面。

其次可以关注的是导演和演员的知名度,包括粉丝人数及社交媒体关注度等指标,这些指标也能推测出电影的口碑和推广效果。

二、数据分析数据分析工具基本上应该是基于数据的特点,包括时间维度、空间维度、基于分类的维度、关系维度等等。

数据的可视化分析是一种直观的分析方式。

此外,还有回归分析、聚类分析等多种分析手段,需要根据数据特点进行选择。

数据的特征工程是对电影数据做一个更深入的分析和挖掘,以发现电影的一些隐藏特征。

如对电影类型的一个更深入的分析,分析各类型电影的收益率、市场份额等等。

三、预测模型据分析提供了大量的电影数据,但如何将这些数据转成对票房收入的预测就需要借助于合适的模型了。

当然,当初选择的特征及数据源对于模型的预测优劣也大有关系。

目前最为常见的是以多元线性回归模型为基础的电影票房预测模型。

线性回归模型可以适用于任何类型的数据,是一种简单而有效的模型选择。

由于线性回归模型假定数据间的关系是线性的,我们需要对数据做一些类似于标准化和正态分布处理的预处理工作,以保证数据分布符合线性假定的要求。

四、案例研究作为应用大数据技术预测票房收入的一种典型例子,电影《黑豹》的票房预测值每日自04年3月开始随之飙升,而对比实际收入值,只有在很少的一些时段内达到它所预测值的高度。

数据挖掘技术在电影票房预测中的应用

数据挖掘技术在电影票房预测中的应用

数据挖掘技术在电影票房预测中的应用随着互联网的不断普及和全球化的发展,电影产业也在迅速发展壮大。

每年都有数以万计的电影面世,每一部电影都希望能够赚到更多的票房收益。

但是,如何预测一部电影的票房成为了电影制作公司所面临的难题之一。

在此背景下,数据挖掘技术的应用为电影票房预测提供了一种新的方法。

一、数据挖掘技术的概念及其应用数据挖掘(Data mining)是指从大量的数据中挖掘出潜在的、有价值的信息。

它是数据分析的一种,强调发现数据中潜在的规律、模式和关系。

数据挖掘技术广泛应用于各个领域,如金融、医疗、生产、销售、电信等。

在电影行业中,数据挖掘技术可以应用于如下几个方面:1、人口调查:电影制作公司可以通过对人口普查数据的挖掘,了解某些地区的人口构成、收入水平等信息,可以根据不同地区和人群的需求,有针对性地制作和宣传电影。

2、市场营销:电影制作公司可以通过对社交网络、电影评论网站和电影票房数据的挖掘来研究和分析观众的兴趣爱好,以便更好地制定营销策略。

3、票房预测:数据挖掘技术可以通过对各种因素(如电影类型、演员阵容、发行日期、前一周票房等)的分析,来预测一部电影的票房情况。

二、电影票房预测中的数据挖掘技术电影票房预测通常是指根据历史数据、电影制作成本、推广费用等因素进行预测。

数据挖掘技术可以通过对这些因素进行分析,来预测出一部电影的票房情况。

以下是几个通常使用的数据挖掘技术。

1、决策树决策树是一种常见的数据挖掘技术,它可以通过对历史数据进行学习,得到一棵树形结构的决策模型。

在电影票房预测中,决策树可以用来预测电影类型、演员阵容、发行日期等因素对电影票房的影响。

2、神经网络神经网络是一种模拟人类神经系统结构和功能的计算模型。

在电影票房预测中,可以通过神经网络来预测电影票房的数值,根据历史数据建立神经网络模型,通过输入电影类型、演员阵容、发行日期等因素的值,得出电影票房的预测结果。

3、朴素贝叶斯算法朴素贝叶斯算法是一种基于贝叶斯定理的分类算法,它可以通过对历史数据的学习,预测电影类型、演员阵容、发行日期等因素对电影票房的影响。

基于大数据分析的电影票房预测与推荐

基于大数据分析的电影票房预测与推荐

基于大数据分析的电影票房预测与推荐电影票房一直以来都是电影行业的重要指标之一。

对于电影制片方和投资者来说,准确预测电影票房并提供精准的推荐至关重要。

随着大数据和人工智能的快速发展,基于大数据分析的电影票房预测和推荐成为可能。

本文将探讨基于大数据分析的电影票房预测与推荐的方法和挑战。

首先,我们需要了解大数据分析在电影行业中的应用。

大数据分析可以通过收集和分析大量的电影数据,如观众评分、上座率、社交媒体评论等,来揭示电影票房的潜力和趋势。

通过挖掘这些数据,我们可以发现观众的喜好和趋势,从而更好地预测电影的票房和成功概率。

但是,基于大数据分析的电影票房预测和推荐也面临一些挑战。

首先,数据的质量和真实性是一个重要的问题。

由于社交媒体的兴起和评论的泛滥,大量的虚假评论和不准确的数据可能会干扰预测的准确性。

因此,在分析大数据时,我们需要对数据进行严格的筛选和验证,确保数据的真实可靠。

其次,电影票房的预测还受到其他因素的影响,如市场竞争、宣传效果和口碑影响等。

这些因素不仅与观众的偏好相关,还与制片方的营销策略和推广手段有关。

因此,在进行基于大数据的电影票房预测时,我们需要综合考虑多个因素,建立复杂的模型和算法,以获得更准确的结果。

在实际应用中,可以采用以下方法来进行基于大数据的电影票房预测和推荐。

首先,构建一个包含多个影响因素的模型,如社交媒体数据、观众评分、导演和演员的知名度等。

通过对这些因素进行综合分析和权重调整,可以得出相对准确的票房预测结果。

其次,可以采用机器学习算法来进行电影票房预测和推荐。

机器学习算法可以通过对大数据进行训练和学习,提取出数据中的隐藏模式和规律,并根据这些规律进行预测和推荐。

例如,可以使用基于协同过滤的推荐算法来为用户推荐其可能喜欢的电影,从而提高票房。

此外,还可以利用文本挖掘和情感分析的方法来分析观众的评论和反馈。

通过对评论的情感倾向进行分析,可以评估观众对电影的喜爱程度和票房潜力。

基于大数据的电影票房预测与分析

基于大数据的电影票房预测与分析

基于大数据的电影票房预测与分析随着大数据技术的发展和应用,越来越多的领域开始利用大数据来做预测和分析。

电影票房是个典型的例子,利用大数据分析电影票房成为了一种趋势。

本文将基于大数据的电影票房预测与分析进行探讨。

电影票房是衡量一部电影在市场上的受欢迎程度和经济价值的重要指标。

传统上,电影制片方和院线依靠经验和感觉来预测电影票房,但这种方法的准确性往往有限。

而利用大数据技术来进行电影票房预测和分析,可以从更客观的角度给出更准确的预测结果。

首先,大数据可以提供海量的历史数据和相关指标,如电影类型、导演、演员阵容、上映时间等。

通过对这些数据的分析和挖掘,可以发现一些对电影票房影响较大的因素。

比如,电影类型和观众群体的偏好密切相关,喜剧片通常具有更广泛的观众群体,而科幻片往往具有较高的票价和较大的票房潜力。

同时,导演和演员的知名度和口碑也是影响票房的重要因素,一些著名导演和演员的作品往往有较高的关注度和口碑,从而带来更大的票房。

其次,大数据还可以通过对社交媒体和网上评论的分析来获取观众的意见和反馈。

观众的反馈往往能够反映出电影的质量和口碑,进而影响票房的表现。

通过对社交媒体上的大数据进行情感分析和主题分析,可以了解观众对电影的喜好和评价,并据此调整市场营销和宣传策略,进而提升电影的票房。

此外,大数据还可以通过对影院数据和观众行为的分析来了解观众的消费习惯和偏好。

比如,通过对观众的观影时间、购票渠道、票价等数据的分析,可以了解观众的消费行为和购票偏好,进而制定更精准的市场推广策略。

此外,通过对观众的地理位置以及社会经济特征的分析,可以进一步细分观众群体,并了解不同观众群体的消费能力和偏好,从而开展更有针对性的市场推广活动。

在大数据的支持下,电影制片方和院线可以利用先进的数据分析工具和算法,对以上的相关因素和数据进行综合分析和预测,从而准确预测电影的票房表现。

这将有助于制片方在电影制作前做出更准确的预测和决策,并为院线提供更准确的观众需求分析,从而提高整个电影产业链的效益。

基于数据挖掘的电影票房分析

基于数据挖掘的电影票房分析

基于数据挖掘的电影票房分析随着电影产业的不断发展,电影票房已经成为判断一部电影质量和成功与否的重要标准之一。

因此,对电影票房的分析和预测已经成为电影产业中重要的一环。

数据挖掘技术可以对海量电影数据进行深度挖掘和分析,为电影票房预测和电影产业的决策提供有力支持。

一、电影票房的意义1. 电影票房能够反映电影的实际市场表现,是电影是否受欢迎和成功的重要标志。

2. 电影票房可以帮助制片方和发行方进行决策,如预测电影的收益和选择电影发行时间等。

3. 电影票房可以影响电影产业的全局形势,如票房高的电影会吸引更多的观众,从而推动电影市场的发展。

二、数据挖掘在电影票房分析中的应用1. 数据收集与清洗电影产业的数据很多,如电影发行时间、电影类型、演员阵容、广告推广、预售票房等。

在进行数据处理之前,需要将这些数据进行采集、清洗和预处理。

清洗之后,才能进行数据挖掘任务。

2. 特征选择与转化对电影产业中的数据进行特征选择和转换,可以减少数据噪声和干扰,同时提取有意义的数据特征。

例如,可以对电影类型这一特征进行二进制转换,将每一种类型设为一个二元变量,从而保留电影类型的信息,避免类别之间的干扰。

3. 数据建模在得到清洗和转换后的数据之后,需要通过机器学习算法,进行模型的构建和训练。

对于电影市场的数据分析,经典的分类算法,如朴素贝叶斯(Naïve Bayes)、支持向量机(SVM)、逻辑回归等均可以被应用在其中,以期得到合理的分析结果。

4. 工具选择在对电影票房进行数据分析时,需要选择适合的工具进行数据挖掘。

主流的数据挖掘工具包括R语言、Python等,这些工具可以帮助分析人员快速、高效地完成数据建模、分析和可视化等任务。

三、电影票房分析的关键指标1. 票房票房是电影市场的核心指标之一,用于表示某一部电影的实际市场表现。

票房信息包括总票房、首周末票房、日均票房等数据类型。

2. 净利润净利润是指制片方和发行方从电影上获取的实际经济利润。

基于大数据分析的电影票房预测与影片推荐系统设计

基于大数据分析的电影票房预测与影片推荐系统设计

基于大数据分析的电影票房预测与影片推荐系统设计随着电影产业的蓬勃发展,电影票房的预测和影片推荐系统的设计成为了电影行业中非常重要的环节。

基于大数据分析的电影票房预测和影片推荐系统的设计,可以帮助电影制片方和观众做出更加准确的决策,提高电影市场的运作效益。

本文将从数据分析的角度,探讨如何基于大数据分析来预测电影票房以及设计影片推荐系统。

首先,基于大数据分析的电影票房预测是指通过收集和分析大量的历史数据,来预测未来电影的票房表现。

这项任务的关键在于如何选择合适的数据来源和建立有效的模型。

对于数据来源,我们可以利用各大票务平台、电影评论网站和社交媒体等渠道收集到的相关数据。

这些数据可以包括电影的上映时间、票房数据、评分、评论等。

通过对这些数据进行处理和分析,我们可以建立起一个相对准确的电影票房预测模型。

在模型的建立过程中,可以采用机器学习的方法。

首先,我们可以使用回归模型,将电影的上映时间、评分、评论等作为自变量,将电影的票房作为因变量,通过训练这个模型,来得到一个预测电影票房的函数。

其次,我们还可以通过时间序列分析的方法,来探索电影票房随时间的变化规律。

这样可以更加准确地预测电影的票房。

除了电影票房预测,影片推荐系统的设计也是基于大数据分析的重要任务之一。

影片推荐系统可以根据用户的个人兴趣和偏好,向用户推荐合适的电影。

在设计影片推荐系统时,我们可以利用大数据分析的方法,根据用户的历史浏览记录、评分以及与其他用户的关系等多个维度的数据进行分析和挖掘。

在影片推荐系统中,协同过滤是一种常用的推荐方法。

该方法可以通过分析用户行为数据,找到和目标用户兴趣相似的其他用户,并推荐这些用户喜欢的电影给目标用户。

此外,我们还可以使用内容过滤的方法,通过分析电影的内容特征和用户的偏好,来推荐符合用户口味的影片。

同时,也可以使用混合推荐的方法,综合利用协同过滤和内容过滤的结果,获得更好的推荐效果。

为了提高推荐系统的准确性,我们还可以采用机器学习的方法来训练推荐模型。

基于大数据分析的电影票房预测

基于大数据分析的电影票房预测

基于大数据分析的电影票房预测随着人们对电影的需求不断增加,电影行业的发展逐渐成为了一个具有巨大潜力和吸引力的行业。

然而,电影制作和发行的过程中存在很大的不确定性,导致票房预测成为了电影工业界重要的问题之一。

基于大数据分析的电影票房预测成为了一个热门研究方向,因为它可以提供有关电影成功与否的有价值信息,为电影制作和市场推广提供有效的指导。

在本文中,我们将讨论基于大数据分析的电影票房预测的方法和挑战。

首先,大数据分析是基于大量的电影相关数据进行统计和模型构建,从而揭示出电影票房成功的关键因素。

这些因素可以包括电影类型、演员阵容、导演声誉、发行商和制作成本等。

通过分析历史数据,我们可以建立统计模型,并使用机器学习算法进行训练和预测。

这些模型可以根据电影的属性特征和历史票房数据,给出一定的预测准确度。

然而,由于电影行业的复杂性和不确定性,电影的票房预测仍然存在一些挑战。

首先,电影行业的竞争激烈,市场环境和观众口味不断变化。

这意味着历史数据可能无法完全反映当前电影市场的动态变化。

因此,仅仅依靠历史票房数据进行预测可能会导致预测结果的不准确。

为了解决这个问题,我们可以考虑使用更多的数据源,如社交媒体数据、观众评论和反馈等。

这些数据可以反映观众对电影的喜好和反应,进一步提高预测准确度。

其次,电影行业的成功与否不仅仅取决于电影本身的质量,还受到市场推广、口碑传播等因素的影响。

传统的基于数据分析的预测方法往往忽视了这些因素的重要性。

为了更准确地预测票房,我们需要将电影的推广活动、宣传策略和市场竞争情况纳入考虑。

这可能需要整合更多的外部数据,并开发新的模型和算法来分析这些数据。

另外,电影市场在不同国家和地区有着差异性,因此预测模型需要针对不同的市场进行调整和个性化。

比如,中国电影市场的快速发展给电影票房预测带来了很大的挑战。

中国观众对电影的偏好和品味与其他国家和地区有所不同,因此不能简单地将国际市场的模型直接应用于中国市场。

运用数据挖掘方法进行电影票房预测与分析研究

运用数据挖掘方法进行电影票房预测与分析研究

运用数据挖掘方法进行电影票房预测与分析研究电影票房一直以来都是电影产业中最关注的指标之一,对电影制片方、发行方、影院以及整个行业来说都具有重要意义。

准确地预测电影票房能够对市场推广、制作成本、放映安排等方面起到积极的指导作用,因此,运用数据挖掘方法进行电影票房预测与分析研究具有重要的实际意义。

数据挖掘是一种通过从大量数据中挖掘有用信息的技术。

在电影票房预测与分析研究中,数据挖掘方法可以帮助我们识别影响电影票房的关键因素,从而进行准确的预测和分析。

下面将介绍几种常用的数据挖掘方法以及它们在电影票房预测与分析中的应用。

首先,我们可以使用回归分析方法来预测电影票房。

回归分析能够通过建立一个数学模型来描述影响票房的各种因素。

例如,我们可以收集电影的制作成本、演员的知名度、导演的经验等数据作为自变量,电影票房作为因变量,然后使用回归分析来建立一个模型,通过输入各个自变量的数据,即可预测电影的票房。

这种方法对于探究各个因素对电影票房的影响具有一定的可行性。

其次,我们可以使用决策树算法来进行电影票房预测与分析。

决策树算法是一种通过观察多个特征值来推断目标变量的方法。

在电影票房预测与分析中,我们可以将电影的各种特征作为输入,例如电影类型、上映时间、口碑评价等,然后使用决策树算法来构建一个决策树模型。

通过输入各个特征的数据,即可根据决策树模型预测电影的票房。

这种方法对于挖掘各个特征对电影票房的影响具有一定的适用性。

另外,我们还可以使用聚类分析方法来进行电影票房预测与分析。

聚类分析是一种通过将样本分为若干个互不相交的簇来进行分析的方法。

在电影票房预测与分析中,我们可以将电影按照其特征进行分类,例如根据电影类型、制作成本、导演知名度等进行分类。

然后,我们可以使用聚类分析方法将电影划分为不同的簇,并分析同一簇内的电影票房情况,以此来寻找规律和发现关键因素。

此外,我们还可以运用关联规则挖掘方法进行电影票房预测与分析。

关联规则挖掘是一种通过发现数据集中不同项之间的关联关系的方法。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2019年3月基于数据挖掘的电影票房分析席稼玮(陕西省西安市高新唐南中学,陕西省西安市710000)【摘要】在电影产业迅猛发展的今天,票房直接反映了一部电影所带来的经济效益,也是衡量一部电影成功与否的重要指标,因而对电影票房进行分析和预测来辅助电影投资和排片十分必要。

本文选取了2015~2017年三年的电影数据,通过建立C5.0决策树模型,分析了类型、档期、发行公司、国家地区等八个重要因素对电影票房高低的影响,构建了电影票房预测模型。

在此基础上,本文也对这些影响因素进行了关联规则分析。

通过实验分析,得出了诸多有意义的结论,如制式是影响票房的关键因素。

此外,结果表明,本文构建的预测模型效果良好,可将其用于电影票房预测。

【关键词】电影票房;数据挖掘;分类预测;决策树;关联分析【中图分类号】TP311.13【文献标识码】A【文章编号】1006-4222(2019)03-0317-031引言随着人们生活水平不断提高,我国影视行业发展迅速,成为全球第二大电影市场,同时也是增长最快的市场之一。

据中国新闻出版广电总局调查显示,2017年全国电影总票房已经超过550亿[1],这说明中国电影产业有着良好的发展前景。

然而,电影行业本身的高风险性和社会环境的多样性也为电影票房带来许多不确定因素,高投入低票房低收益的电影案例也屡见不鲜,如2016年上映的《封神传奇》斥资5亿,却只收获2.84亿的票房。

因而,研究电影票房的预测模型和相关影响因素对电影投资和排片的决策有着至关重要的指导性作用。

电影作为一种特殊的生存期短的商品,对其票房的预测难度非常大。

然而,电影在制作和宣传过程中的高成本、高风险使得对电影票房的预测至关重要。

吴发翔等[2]选取了2015年上映的200部国产电影作为实验数据,通过观众期待度、电影自身影响度、同期竞争力等作为预测因变量,提出了基于决策树C5.0的票房预测模型。

郑坚等[3]选取2008~2010年之间192部国产电影作为数据集,提出了一种基于多层反馈神经网络的票房预测模型。

王炼等[4]选取了2011年上映的211部电影进行分析,提出了基于网络搜索的票房预测模型。

对比这些现有的票房预测研究[5],他们选取的数据集多为2016年之前,缺乏时效性。

此外,他们并未将电影制式作为影响票房的因变量因素进行分析。

基于此,本文将2015~2017三年间在中国内地上映的所有电影票房数据作为实验数据,选取了类型、档期、发行公司、国家地区、制式、导演影响力、主演影响力、同期竞争力八个影响因素,对电影票房进行了分类分析和关联规则分析,建立了电影票房预测模型。

本文选取的实验数据具备很强的时效性,覆盖度广,同时创新性地选取了电影制式作为因变量影响因素,对电影票房预测模型的研究具有非常重要的意义。

2数据选择和处理数据的选择和处理作为数据分析的重要组成步骤,会直接影响到数据分析的结果。

2.1数据选择本文选取了2015~2017三年的电影票房数据,与其他已有的电影票房预测模型相比,具备很强的时效性和适用性。

本文抓取的电影数据来源于中国票房网(/),中国票房网是电影票房统计官方网站,提供详细的电影相关信息,保证了数据的权威性、准确性和完整性。

本文预测的目标变量为电影票房,预测的因变量为电影票房的八个影响因素(详见第3章)。

2.2数据处理本文的数据预处理分三个部分:异常处理,如,对空数据通过其他途径得到并进行填充或者直接剔除;数据去重,对重复数据进行删除;字段处理,统一每个字段的格式和类型,仅保留有效字段。

3电影票房的重要影响因素电影票房预测对于降低电影的投资风险至关重要。

电影票房预测模型的好坏很大程度上取决于电影票房影响因素的选择。

电影自身的影响力决定了这部电影的质量和口碑,而质量和口碑影响着电影的后期票房。

主创团队影响力影响的则是观众对电影的期待度,这会影响电影的前期票房。

基于此,本文主要从电影自身影响力和主创团队影响力这两方面出发,研究了类型、档期、发行公司、国家地区、制式、导演影响力、主演影响力和同期竞争力对电影票房的影响。

3.1类型不同类型的电影有不同的受众群体,不同的群体又具有不同的消费水平。

例如动画类电影,观影人群大多为儿童,相对其他群体来说人数较少,且消费水平较低,因此会对票房产生一定影响。

本文将电影的类型通过离散化分为12类,分别为爱情、灾难、艺术、恐怖、战争、记录、动画、喜剧、科幻、奇幻、动作、剧情,分析了类型对票房的影响。

3.2档期从某种程度上来说,档期是电影的纵向市场。

一年中的不同时段,人们的观影需求和消费能力有明显差异,比如节假日通常会比非节假日的观影需求要大得多,进而影响票房。

本文将数据进行了离散化处理,将档期分为5类,分别为五一档(4.27-5.10)、暑期档(7.1-9.1)、国庆档(9.27-10.10)、贺岁档(12.26-次年2.1)和其他。

3.3发行公司好的电影发行公司一般具有专业的制作团队,先进的技术条件和雄厚的资本积累,是电影票房的潜在保障。

本文对数据进行了离散化,通过调研和总结,将制片公司分为3类:好莱坞八大电影公司、中国十大电影公司和其他。

其中,好莱坞八大电影发行公司包括:华纳兄弟公司、米高梅电影公司、派拉蒙影业公司、哥伦比亚影业公司、环球影片公司、联美电影公司、20世纪福克斯电影公司、迪士尼电影公司,而中国八大电影发行公司包括:中影CFGC(中国电影集团公司)、光线传媒(北京光线传媒股份有限公司)、华谊兄弟(华谊兄弟传媒股份有限公司)、博纳影业BONA(博纳影业集团股份有限公司)、上影(上海电影(集团)有限公司)、万达影业(大连万达集团股份有限公司)、乐视影业(乐视网信息技术(北京)股份有限公司)、寰亚(香港寰亚综艺集团有限公司)、论述3172019年3月安乐EDKO(安乐影片有限公司)、嘉映影业(北京嘉映文化传媒有限公司)。

3.4国家地区各个国家和地区的电影风格各具特色,因此也会受到人们不同程度的喜爱,所以国家地区也是要考虑的因素之一。

本文通过对数据进行离散化,结合不同国家和区域的电影出品特点,将国家地区分为5类:中国大陆(中国)、港台(香港、台湾)、欧美(美国、英国、法国、意大利)、日韩(日本、韩国)和其他。

3.5制式近年引入的电影制式,如3D、IMAX等,其具备的立体动画和巨型屏幕会比2D电影的代入感更强,会带给观众更好的观影体验,所以被不少观众青睐。

通过分析抓取到的电影详情数据,发现很多电影有多种制式,如2D和3D并存。

本文选取一部电影最先进的制式(IMAX制式>3D制式>2D制式)作为离散化标准,将电影制式离散化为四类:2D、3D、IMAX和其他。

3.6导演影响力如果一名导演自身有很高的知名度,则通常他导演的电影也将被大众所期待,对电影票房起着积极作用。

本文将导演影响力作为影响电影票房的因素之一。

具体地,某部电影的导演影响力可通过计算该电影的导演在此之前导过的两部电影票房总和得到。

通过分析2015~2017年三年来每部电影的导演影响力,本文将导演影响力离散化为5类:很低(<100)、较低(100-1000)、一般(1000-5000)、较高(5000-10000)和很高(>10000)。

3.7主演影响力主演是电影的主角,是电影表现力和票房号召力不可或缺的一部分。

如果参演人员本身具有表演实力和一定知名度且受人们喜爱,则电影的受期待程度通常较高,对电影票房有着积极影响。

本文将主演影响力作为影响电影票房的因素之一。

具体地,某部电影的主演影响力可选取该电影排名前三的主演进行分析,即分别计算每位主演在此之前作为排名前三的主演参与演出的前三部电影票房总和,最后将其求和作为该电影的主演影响力。

通过分析计算出的结果,本文将主演影响力离散化为4类:很低(<1000)、较低(1000-80000)、较高(80000-300000)和很高(>300000)。

3.8同期竞争力因为观众通常会选择质量好、话题度高且性价比高的电影,因此同期其他电影的上映情况会间接对该电影票房产生影响。

本文将同期竞争力作为影响电影票房的重要因素之一。

本文通过计算某部电影上映前后一周(共两周)的电影票房总和得到同期竞争力,对其离散化后分为4类:很低(<50000)、较低(50000-120000)、较高(120000-200000)、很高(>200000)。

4实验与分析本文采用IBMSPSSModeler对2015~2017三年的电影票房进行分析:用C5.0决策树[2,5,6]分析影响电影票房的因素,用Apriori算法[5,6]分析各影响因素之间存在的关联规则。

4.1分类分析为了降低电影投资的风险,帮助投资者做出相关决策,本文对电影票房进行了预测与分析。

4.1.1决策树的构建本文采用C5.0决策树对票房预测模型进行构建。

C5.0决策树是基于C4.5开发的分类算法。

由于国家地区和发行公司间存在关联性,而贝叶斯分类算法需要各因素间相互独立,因此并不适用于电影票房预测模型。

此外,线性回归和神经网络预测模型适用于连续的因变量预测,且不易理解和部署,因此C5.0决策树算法更为适合电影票房的预测分析。

决策树是一种树形的数据结构,其中每个非叶子节点表示一个属性,每个叶子节点代表一种分类结果。

C5.0决策树算法[6]是目前最经典的决策树算法之一,根据能带来最大信息增益的特征属性来拆分样本,经过数次迭代,可生成决策树或规则集以完成分类和预测。

本文采用IBMSPSSModeler数据分析软件,首先将类型、档期、发行公司等八个电影票房的重要影响因素(详见本文第3章)进行离散化,作为决策树的输入变量,同时将票房通过离散化分为5类:非常低(<1000=、较低(1000-5000)、一般(5000-10000)、较高(10000-50000)和非常高(>50000)作为决策树的目标变量,采用C5.0算法建立了决策树模型。

4.1.2实验结果与分析决策树分析的实验结果如图1所示,该模型的准确率为76.06%,通过分析实验结果可知,电影制式对票房的影响最大,预测变量重要性高达0.39。

其次是主演影响力和国家地区。

而同期竞争力、发行公司是重要性最低的两个因素。

在此基础上,本文将实验结果分析如下:(1)由于3D、IMAX等技术相对先进,制作成本高,因此票价比一般2D电影贵,导致票房普遍较高,这可能是制式影响票房的主要原因。

其次,观众对3D、IMAX电影更有新鲜感,同时这些电影也会给观众带来好的观影体验,观影人数较多,所以票房较高。

(2)除制式外,国家地区也是影响票房的关键因素之一,原因可能是大多在中国内地能够上映的国外电影,都已经在该地区内上映,并且取得了良好成绩,电影质量、口碑也相对较好。

相关文档
最新文档