基于网络数据预测电影票房的多元线性回归方程构建
基于神经网络的电影票房预测建模

基于神经网络的电影票房预测建模基于神经网络的电影票房预测建模引言随着现代科技的不断进步,人们对于数据的使用和处理方式也发生了革命性的变化。
神经网络作为一种强大的分析工具,被广泛应用于许多领域,其中包括电影产业。
电影票房预测一直是电影行业中一个重要的课题,因为对电影票房的准确预测可以对制片方和投资者做出明智的决策。
本文将介绍如何利用神经网络来建立电影票房预测模型,并探讨该模型在实际应用中的可行性和准确性。
一、电影票房预测的重要性1.1 电影产业的商业化趋势电影产业正变得越来越商业化。
投资者希望通过投资于电影项目获得丰厚的利润回报,而制片方则希望通过制作和宣传一部电影来获取较高的利润。
然而,电影的制作和宣传都需要巨额的资金投入,因此,对电影票房的准确预测对于投资者和制片方而言至关重要。
1.2 电影票房与影片质量的关系电影票房与影片质量之间虽然并非完全正相关,但高票房往往基于一个好的电影基础,包括内容的吸引力、演员的表演和市场宣传等。
因此,通过对电影票房进行准确预测,可以有助于选择优质的电影项目,提高投资回报率。
二、神经网络在电影票房预测中的应用2.1 神经网络简介神经网络是一种模仿生物神经网络结构和功能的数学模型。
它至少包含一个输入层、一个隐层和一个输出层。
每个层中的神经元与下一层的神经元相连,通过权重和偏置参数实现信息传递和加权求和的计算过程,最终通过激活函数将输出结果映射到合适的范围。
2.2 数据收集和准备在建立电影票房预测模型之前,首先需要收集和准备相关数据,包括电影的各种特征,如导演、演员、上映日期、预告片点击量、市场竞争等。
这些数据将作为神经网络的输入。
2.3 模型训练和优化通过收集到的数据,可以将其划分为训练集和测试集,并将其输入神经网络进行训练。
训练过程中,需要选择合适的网络结构、激活函数和损失函数,并进行参数的调优。
常用的优化算法有梯度下降法、Adam算法等。
2.4 模型验证和评估训练完成后,将测试集输入训练好的神经网络,得到预测结果。
利用线性回归分析中国电影票房

利用线性回归分析中国电影票房中国电影产业中国电影产业正处于高歌猛进的快车道。
据中国电影产业网数据显示,2016年中国电影票房达457亿元,略超2015年的440亿元票房。
I P电影的出现为中国电影市场增加了不少票房收益,如《同桌的你》《栀子花开》《十二公民》等电影未映先火。
作为观影者,如果没听说过IP电影就out了。
数据来源和说明本案例使用的是中国电影发行放映协会统计的某年度年票房过千万元的电影数据,共275个样本,数据包括电影票房、影片类型、发行方等13 个变量。
数据说明如表1所示。
表1数据说明票房收入本案例的因变量Y是票房收入,其直方图呈现右偏分布(见图1)。
票房最高为127168.1万元,是影片《人再囧途之泰囧》,导演:徐峥;票房最低为1010.16万元,是影片《举起手来(之二)追击阿多丸》,导演:冯小宁。
不过,电影票房过2亿元的影片数量较少。
由于低票房的影片数量较多,从而降低了整体影片票房的平均水平。
图1 票房收入直方图描述性分析首先,对月份进行分组描述,重新定义影片上映档期,即贺岁档、暑期档、普通档、黄金档1期(含“五一”)、黄金档2期(含“十一”)。
从图2中可以清晰看到贺岁档的平均票房比其他档期的平均票房要高,而黄金档期的平均票房却很不理想。
图2再来考察IP电影。
简单来说,IP就是知识产权,可以是一首歌、一部网络小说、一部广播剧、一台话剧,或者某个经典的人物形象,哪怕只是一个字、一个短语,把它们改编成电影,就可以称作I P电影,比如《栀子花开》《狼图腾》《十二公民》等都是I P电影。
通过描述性分析(见图3),可以看到IP因素将电影的平均票房推向了新的高度,即改编的真人真事、翻拍以及有(是)续集的电影票房都高于虚构的、非翻拍的电影。
比如样本中的《人再冏途之泰囧》《将爱情进行到底》《叶问2:宗师传奇》《武林外传》等均是IP电影。
图3最后看导演因素。
导演是一部电影中最核心的元素,实力派导演丰富的拍摄经验会为影片增色不少,有一些观众会因为导演的声望而去关注其更多的作品。
《2024年基于多元线性回归模型的电影票房预测系统设计与实现》范文

《基于多元线性回归模型的电影票房预测系统设计与实现》篇一一、引言电影行业是一个高度竞争且快速发展的领域,电影票房预测对于制片方、发行方和投资者来说具有极其重要的意义。
为了更准确地预测电影票房,本文提出了一种基于多元线性回归模型的电影票房预测系统设计与实现。
该系统通过收集和分析多种影响因素的数据,建立多元线性回归模型,以实现对电影票房的预测。
二、系统设计1. 数据收集与处理本系统需要收集的数据包括电影基本信息(如导演、演员、类型、宣传投入等)、上映时间、同期竞争情况、观众群体特征等。
数据收集后,需进行清洗、整理和标准化处理,以满足建模需求。
2. 模型选择本系统选择多元线性回归模型作为核心算法。
多元线性回归模型能够反映多个因素对电影票房的共同影响,具有一定的解释性和预测性。
3. 模型构建根据收集的数据和模型选择,构建多元线性回归模型。
模型的因变量为电影票房,自变量为电影基本信息、上映时间、同期竞争情况、观众群体特征等。
通过统计分析方法,确定自变量的权重和系数,建立回归方程。
4. 系统架构系统采用C/S架构,包括数据采集模块、数据处理模块、模型训练模块、预测模块和用户交互模块。
数据采集模块负责收集数据,数据处理模块负责数据清洗、整理和标准化处理,模型训练模块负责建立多元线性回归模型,预测模块负责根据模型进行票房预测,用户交互模块负责与用户进行交互,展示预测结果。
三、系统实现1. 数据预处理使用Python等编程语言对数据进行预处理,包括数据清洗、整理、标准化等。
数据清洗主要去除无效、重复和异常数据,数据整理将数据整理成适合建模的格式,数据标准化将数据转换为统一的量纲。
2. 模型训练使用统计学软件或编程语言进行模型训练。
根据多元线性回归模型的原理和步骤,确定自变量的权重和系数,建立回归方程。
3. 系统开发根据系统架构,使用合适的编程语言和开发工具进行系统开发。
开发过程中需注意代码的可读性、可维护性和性能等方面。
基于线性规划的电影院排片问题

基于线性规划的电影院排片问题作为训练数据集。
选取xxx年新上世的国产商业电影作为测试数据集。
训练数抵集与坝测双'表网个部分的数据完全分离,没有重复样本。
输入向量为:喜剧、爱情、惊悚、动作、剧情、魔幻、IP改编、是否续集、明星、导演、制作技术、口碑评分、口碑评论数量、片花及预告片统计量、想看指数、点映票房、档期、发行公司、竞争力量。
电影最终票房作为输出变量。
首先,将整体回归模型分为制作方面、营销万闻、具他方面三部分进行逐步分析。
先将制作方面的变量放入回归模型,主要包括影片质量、影片长度、跑片时间、拷贝数量、黄金时间、观众喜好、影厅大小、影厅数量、人员安排、通道使用。
最后放入其他方面的变量,主要包括网络热度、地理位置、交通、天气、风俗习惯、语言类别作息规律、重大节日、重大活动、消费人群、特殊要求等。
采用逐步分析不仅可对整体模型的拟合优度进行检验,还可以通过对比模型间R2更改的显著性来分别评估各部分变量组合对因变量的贡献作用。
在加入主要自变量后,模型R2变化非常显著电影院线对上线电影的排片对于电影票房的成败起着至关重要的作用,而院线对于电影排片的依据正是电影的市场反应度,院线排片以市场需求为首要决定因素。
本文通过综合考虑分析,建立基于多元线性回归——神经网络预测的影院排片模型。
首先,考虑可能影响排片的因素,建立排片模型指标,利用多元线性回归分析后建立多元线性回归模型,将整体回归模型分为制作方面、营销方面、其他方面三部分进行逐步分析,通过显著性检验后,从标准化系数来看,影片质量为xxx,观众喜好为xxx,网络热度为xxx,其中观众喜好得分最高,网络热度和影片质量对排片也具有显著影响。
然后以电影票房为输出变量,选取影响票房的多个输入变量,建立神经网络预测模型,得出标准化后的自变量得分,通过对比后发现,神经网络分析自变量的标准化重要性排名前五的依次为口碑评论数量、想看指数、喜剧、剧情、动作、片花及预告片播放统计。
电影票房预测的多元回归模型研究

电影票房预测的多元回归模型研究电影行业已成为全球最为热门的行业之一,每年都会诞生不少票房大片。
对于电影制片方来说,一部电影的票房收益是评价其质量和影响力的重要指标。
但究竟哪些因素决定了一部电影的票房呢?这成为了不少电影爱好者和制片方所关注的问题。
本文将探讨电影票房预测的多元回归模型研究。
一、多元回归模型简介多元回归模型是统计学中常用的一种建模方法,除了因变量和自变量之间的线性关系外,还考虑了多个自变量对因变量的影响。
在电影票房预测研究中,多元回归模型可以将多个可能影响票房的因素纳入考虑,从而提高预测的准确性。
二、多元回归模型在电影行业中的应用在电影票房预测研究中,多元回归模型通常采用如下公式:y = β0 + β1x1 + β2x2 + ... + βnxn + ε其中,y代表因变量(电影票房收益),x1~xn代表自变量(影片类型、演员阵容、片长、上映时间等),β1~βn代表自变量的系数,ε表示误差项。
各自变量的系数可以通过样本回归方程估计得到,从而得出模型的可靠性。
在电影行业中,影片类型、演员阵容、制片公司、上映时间、评价等因素都会影响电影票房收益。
因此,多元回归模型也常被用于预测电影票房收益。
三、历史上的预测模型案例在电影行业中,多元回归模型也有不少经典的应用案例。
例如,1997年,罗格斯大学教授Timothy M. Schmidle在《以数据为基础的电影票房预测》一文中,利用多元回归模型研究了1991年到1994年间的450部电影的票房收益和13个自变量之间的关系。
结果发现,影片类型、演员阵容、影片预算、广告投入和上映时间等因素对票房收益都有影响。
另外,2013年,美国耶鲁大学的一项研究也利用多元回归模型研究了北美11,806部电影的票房收益和18个自变量之间的关系。
研究得出的结论是,影片类型、导演、演员阵容、预算、上映时间和IMDb评分等因素对票房收益影响最大。
四、现阶段的预测模型研究随着数据技术的不断发展,电影票房预测的多元回归模型也越来越高效准确。
基于多元线性回归模型的电影票房预测系统设计与实现

基于多元线性回归模型的电影票房预测系统设计与实现基于多元线性回归模型的电影票房预测系统设计与实现第一章:引言1.1 背景和意义电影作为一种重要的文化娱乐产品,受到了广大观众的喜爱和关注。
而对于电影制片商和发行商来说,准确预测电影的票房收入对于制定合理的推广和发行策略至关重要。
然而,预测电影票房是一个复杂的任务,受到诸多因素的影响,如电影的演员阵容、导演水平、宣传力度等。
因此,设计并实现一个基于多元线性回归模型的电影票房预测系统,可以帮助影片制作商更准确地预测电影票房,提高决策的科学性和准确性。
1.2 研究目的本文旨在设计和实现一个基于多元线性回归模型的电影票房预测系统,通过收集和分析与电影票房相关的数据,建立相应的预测模型,为影片制作商提供科学的决策支持。
第二章:相关理论及方法2.1 线性回归模型2.1.1 单变量线性回归模型2.1.2 多元线性回归模型2.2 数据收集与预处理2.2.1 数据源2.2.2 数据预处理方法2.3 多元线性回归模型的建立与评估2.3.1 模型建立2.3.2 模型评估第三章:系统设计与实现3.1 系统需求分析3.2 系统框架设计3.3 数据库设计3.4 系统功能设计3.4.1 数据收集功能3.4.2 数据预处理功能3.4.3 模型建立与评估功能3.4.4 预测结果展示功能第四章:系统测试与评估4.1 测试数据准备4.2 系统测试4.2.1 数据收集测试4.2.2 数据预处理测试4.2.3 模型建立与评估测试4.2.4 预测结果展示测试4.3 系统评估与优化第五章:总结与展望5.1 研究总结5.2 问题与挑战5.3 进一步工作展望在这个电影行业竞争激烈的时代,准确预测电影票房成为了不可或缺的一部分。
本文通过设计和实现一个基于多元线性回归模型的电影票房预测系统,为影片制作商提供了有效的决策支持。
通过收集和分析大量的电影数据,并运用合适的数据预处理方法,建立了多元线性回归模型。
基于数据挖掘的电影票房预测方法研究

基于数据挖掘的电影票房预测方法研究近年来,电影产业的发展越来越迅速,电影票房成为了观测一个电影是否成功的重要指标之一。
如何通过数据挖掘的方法预测电影的票房,成为了电影业者们的关注焦点。
本文从数据挖掘的角度出发,探究对于电影票房预测的方法研究。
一、电影票房数据采集与清洗数据的质量对于预测的准确性至关重要。
为了得到更好的预测结果,我们需要对电影票房数据进行采集和清洗。
最初,我们需要从多个数据源中采集相关数据,包括电影类型、主演阵容、发行日期等等。
通过数据的采集,我们可以得到更加丰富、全面的数据集,以便于后续的数据挖掘和预测。
在得到数据集后,数据的清洗也是非常重要的环节。
通常采集到的数据存在各种缺陷,包括缺少数据、格式不规范等等。
我们需要通过数据清洗的过程,将缺失的数据补全,规范化不规范的数据,以保证后续的模型训练和预测的效果。
二、电影票房预测模型的构建在得到清洗后的数据集后,我们需要构建一个机器学习模型以实现票房的预测。
常见的模型包括线性回归模型、决策树模型等等。
在实际的电影票房预测过程中,我们通常采用深度学习模型进行预测。
例如,通过神经网络中的循环神经网络(RNN)模型,可以更为准确地预测电影票房。
同时,我们还可以通过提取电影的特征来优化预测模型。
例如,通过提取电影的导演、主演等特征,可以提高预测的准确性。
三、常见电影票房影响因素分析在构建预测模型之前,我们需要分析电影票房的影响因素。
电影类型、电影主演、国家地区以及发布时间等等,这些都是影响电影票房的关键因素。
通过对这些因素进行分析,我们可以建立更加完备的电影票房预测模型。
四、电影票房预测方法研究的意义与挑战在当今经济快速发展和科技不断进步的时代,不仅电影行业越来越多元化,同时观众的需求也越来越多样化。
电影票房预测的方法研究,对于电影行业的发展具有重要意义。
通过有效的票房预测,影片公司可以提前制定合理的市场营销策略,从而提高影片的收益,同时也可以降低影片投资的风险。
基于多元线性回归模型的电影票房预测系统设计与实现

基于多元线性回归模型的电影票房预测系统设计与实现基于多元线性回归模型的电影票房预测系统设计与实现摘要:本文基于多元线性回归模型,设计并实现了一个电影票房预测系统。
该系统可根据电影的相关特征,如导演、演员、类型、评分等,对电影的票房进行预测。
系统使用Python编程语言和相关库实现了数据处理、模型训练和预测功能。
实验结果表明,该系统能够较准确地预测电影的票房情况,对电影产业具有重要的指导意义。
关键词:多元线性回归模型;电影票房预测;特征选择;数据处理;模型训练;预测功能1. 引言随着电影产业的快速发展,电影票房成为评估电影质量和市场潜力的重要指标。
然而,要准确地预测电影的票房情况并非易事,涉及到众多因素的综合考量。
因此,设计一个基于多元线性回归模型的电影票房预测系统,对电影产业的发展具有重要的理论和实践意义。
2. 数据收集与处理为了构建可靠的电影票房预测系统,首先需要收集包含各种特征信息的电影数据集。
这些特征可以包括电影的导演、演员、类型、评分、上映时间等。
通过数据爬取或从已有电影数据库中提取数据,我们得到了一个包含多个电影样本的数据集。
然后,对原始数据进行预处理,包括数据清洗、缺失值处理、特征编码等。
3. 特征选择特征选择是建立多元线性回归模型的重要步骤。
我们使用相关性分析和特征筛选算法,选择对电影票房具有较高影响力的特征。
这些被选出的特征将作为模型的自变量。
4. 模型训练使用选定的特征作为自变量,电影票房作为因变量,通过多元线性回归模型的训练,建立了一个了解特征与票房之间关系的数学模型。
在模型训练过程中,我们使用了梯度下降算法来拟合模型参数,使得模型能够较准确地预测电影票房。
5. 预测功能实现在模型训练完成后,我们实现了电影票房的预测功能。
用户输入待预测的电影特征,系统通过已训练好的模型计算该电影的预测票房。
预测结果将在界面中显示给用户,并根据预测结果提供一些参考建议,如是否适合投资、推荐的市场定位等。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
基于网络数据预测电影票房的多元线性回归方程构建作者:何晓雪毕圆梦姜绳来源:《新媒体研究》2018年第05期摘要随着经济实力的不断增长和人民生活水平的日益提高,我国电影市场得到了蓬勃发展,对国民经济的贡献率不断上升。
对电影票房进行科学的预测,不仅能够对电影本身的投资有所帮助,同时也可以促进电影产业进行科学合理的资源配置。
文章利用多元线性回归方程,通过采集近年来的电影票房数据样本,从豆瓣评分、微博想看人数、M1905电影网的相关新闻数量及电影首映日票房等多个角度构建了票房预测模型,并确定了最终影响实际票房的三大因素,最后构建了电影的票房预测模型并得出了预测票房结论。
关键词多元线性回归方程;电影;票房预测中图分类号 G2 文献标识码 A 文章编号 2096-0360(2018)05-0041-081 研究背景随着我国经济实力不断增长,人民生活水平日益提高,消费能力也在逐步提升。
人们更加重视对美好生活的追求,其尤为突出的一个侧面便是休闲娱乐投资所占比例越来越大。
特别是近些年来,我国电影市场蓬勃发展,围观中提供了无数银幕佳作,人们的观影热情也随之越发高涨,又进一步推动了电影市场对经济贡献率的不断上升。
这种相互递进的经济效应,使得人们对于新生电影能否带来理想票房愈发重视。
2017年,著名导演冯小刚的新片《芳华》宣布退出国庆黄金档,无疑掀起一阵巨浪,更激起我们对于其撤档背后是否与票房密切相关这一点产生了长久的思考。
为研究此问题,需要一个合适的票房预测模型。
2013年Google发布了一篇名为《Quantifying, movie magic with Google Search》的论文,里面提出一种基于多元线性回归方程的电影票房预测模型,通过其能在电影上映前1个月得到该电影的首周票房,并且预测成功率高达94%。
由于一部电影涉及众多环节,其票房的影响因素也纷繁复杂,而且程度有大有小,不同类型电影可以考察的参数亦不同。
1.1 多元线性回归方程预测票房的可行性多元线性回归方程正是考虑到多方因素作用来计算的一种常用数学模型。
它可以采用多个变量组合来预估某一变量,较单一变量预测更符合实际,误差更小,结果更有效,具有广泛的适用性,更符合现代社会的实际情况,而且实现简单,易于人们理解和操作。
因此,我们决定沿用这一模型对电影《芳华》票房进行预测分析,进而为电影行业的发展产生一些实际借鉴意义。
1.2 国内外研究历史及经验随着互联网时代的高速发展,网民在线生成人数爆炸式增长,信息交互传递的速度越来越快。
2006年,Gilad Mishne和Natalie Glance通过分析博客中有关电影的数据,构建了基于博客的电影票房预测模型,研究关于电影的口碑声量和口碑的情感分析对票房的影响程度,最终揭示了口碑声量的影响力更大。
2010年,itaram Asur和Bernardo A.Huberman通过实验得到了在推特中的电影声量与票房呈线性相关,并且其数据的正负情感分析对票房也有很大影响的结论。
在2013年,Chong Oh等利用推特里关于电影的口碑数据和的电影票房数据分析,得出口碑能直接影响电影票房的结论,而且观影用户反馈及片方的前期推广信息也间接影响整体的票房成绩。
2 研究过程2.1 影响电影票房的因素猜测根据前人的研究与实验成果,我们可以看出,用户口碑、关注度以及新闻宣传对电影票房有积极影响。
自商品经济发展以来,口碑便是极为重要的影响因素。
而在社交媒体盛行的当下,海量数据的挖掘无疑要从这一领域开始。
其中,微博,作为一种通过关注机制分享简短实时信息的广播式的社交网络平台,截至2016年,月平均活跃人数达到2.97亿。
庞大的用户覆盖面使其在新闻舆论、综艺娱乐等方面继续保持绝对影响力,而对于电影行业的发展推动力也不容小觑。
知名大V,各种营销号的前期推广,即时性的用户反馈与信息传递,无时无刻不在影响着一部电影的票房走势。
豆瓣,作为老牌书影音交流社区,凭借优质的用户评论和较为客观的电影评分,也成为我们本次研究的数据参考之一。
此外,我们还选取了电影网站的新闻数据,进一步思考前期宣传与票房的关系,综合探究口碑这一宏观概念对于票房方面的影响。
在这些数据中,口碑数量与产品营销成正相关关系。
同时,电影票房也是自相关的,前期宣传力度大、关注度高、近期票房高的电影总票房就会比较高。
因此,我们分别针对豆瓣评分、微博中表示“想看”某部电影的人数、M1905电影网相关资讯及首映日票房与电影总票房的关系进行了研究探索。
表1为搜集的近年电影样本数据表,表2为数据采集来源表。
2.2 影像电影票房因素的确定方法上文提到“豆瓣评分”、微博表示“想看”人数、M1905电影网相关影视新闻和电影首映日票房与电影实际票房的情况看起来似乎都有极大的关系。
为了验证这4个因素是否有关系,有什么样的关系,我们采用单个元素分析,最后整合的方式进行试探。
第一,分别将上述元素作为唯一自变量,将两年内所找到的电影实际票房作为因变量,分别利用SPSS统计软件进行线性回归探索。
在线性回归探索中,如果R2的数值越接近1,那么这个与票房的关系越紧密。
第二,再对自变量、因变量进行显著性分析,在得出的结果中看显著性。
显著性的临界值是0.05,即超过这个值,因变量与自变量的线性关系无法建立,应当舍弃。
第三,对于符合上述两个条件的自变量与因变量关系再此进行验证,并用软件自动建立线性回归公式。
这个公式暂时不具有参考意义,只是对于自变量与因变量关系的存在进行证明。
第四,当确定与实际票房有线性关系的因素后,将这些因素全部作为自变量,将实际票房作为因变量,再次利用SPSS软件,重复上述三个步骤,建立多元线性回归方程,这个方程就是所得的票房预测方程。
第五,利用所得方程,将电影《芳华》的自变量数据带入,经计算得出最终结论。
2.3 猜测因素与票房关系探索2.3.1 豆瓣评分与票房关系探索基于之前的假设,首先对豆瓣评分与实际票房之间的关系做分析。
通过运用SPSS统计软件,将表1中2017年芳华类电影的豆瓣评分作为自变量,实际票房作为因变量输入软件,进行了线性回归分析,探索二者之间的关系。
结果如表3所示。
在这个表中,R2的数值是0.083,远远小于1,这表示电影实际票房的8.3%可由豆瓣评分来解释。
鉴于在R²的值越接近1,其拟合效果越好的这个规律,可以初步判定豆瓣评分与电影实际票房之间的关系不大。
为了确定这个结论,再将豆瓣评分与票房关系显著性进行分析,结果如表4所示。
在显著性分析中,当结果值大于0.05时说明模型受误差因素干扰太大不能接受。
由表4可以看出,这里的显著性为0.115,远远超过了0.05,也就是由自变量“豆瓣评分”和因变量“电影实际票房”建立的线性关系回归模型没有显著的统计学意义。
所以再次证明,豆瓣评分不能作为我们预测电影票房的依据。
2.3.2 微博表示“想看”电影人数与电影实际票房关系探索与探索豆瓣评分与票房关系的方法相同,将2016年和2017年芳华类电影的微博“想看”人数作为自变量,实际票房数据作为因变量,进行了线性回归分析,结果如表5所示。
在表格中,可以R²是0.424,大于可作为参考因素的临界值0.3,表示电影票房的42.5%可以通过电影的微博“想看”人数来解释,所以微博“想看”人数是可以作为我们预测电影票房的一个重要依据的。
同样,再次进行微博“想看”人数与票房关系显著性分析,以验证上述猜想,结果如表6、表7所示。
这里得到了结果的显著性为0.000,因为精确值的关系,软件并未显示具体数值,但可以明确看出这个数值远小于临界值0.05,这表明由自变量“电影的微博‘想看’人数”和因变量“电影实际票房”建立的线性回归模型具有极显著的统计学意义。
为了确定微博“想看”人数与票房关系的线性关系,我们再次将二者通过SPSS软件进行显著性分析,并试图得出结论。
如表7所示。
从系数这一栏中我们可以得到建模的直接结果,并且系数的显著性也是0.000,说明该线性回归方程是有意义的。
根据软件所给结论,某电影微博“想看”人数(X)与电影实际票房(Y)的模型表达式为:Y=0.598X+2 418.659。
2.3.3 M1905电影网相关影视新闻数量与电影实际票房的关系探索M1905电影网也是一个十分具有影响力的网站。
在这个网站中,我们主要选择2016年和2017年芳华类电影在M1905上的新闻资讯的数量和实际票房,用同样的方法进行了线性回归分析,结果如表8所示。
我们看到R2是0.461,说明电影票房的46.1%可以用M1905的新闻资讯数量解释。
再对M1905相关影视新闻数量与票房关系显著性进行分析,结果如表9、表10所示。
显著性为0.000,根据前面的经验,这里的实际数值应当是小于0.01的一个值,远小于0.05,表明由自变量“M1905的相关新闻资讯数量”和因变量“电影实际票房”建立的线性回归模型具有极显著的统计学意义。
再次对M1905电影网相关影视新闻数量与票房关系进行线性方程的建立。
分析结果如表10。
从系数这一栏中我们可以得到建模的直接结果,所以M1905的相关新闻数量与电影实际票房的模型表达式为:Y=402.470X-3732.455。
2.3.4 电影首映日票房与电影实际票房的关系探索探讨电影首映日票房与实际票房的关系,我们同样用2016年和2017年芳华类电影的首映日票房和实际票房的数值进行了线性回归分析,分析结果如表11所示。
我们看到R²是0.575,表示电影票房的57.5%可以通过电影的首映日票房来解释,所以电影的首映日票房应当是预测电影票房的一个重要依据。
再对电影首映日票房与实际票房关系进行显著性分析,结果如表12、表13所示。
从这个结果中,我们可以看到,显著性为0.000,应当是小于0.01中的某个值,远小于0.05,表明由自变量“电影的首映日票房”和因变量“电影实际票房”建立的线性回归模型具有极显著的统计学意义。
从系数这一栏中我们可以得到建模的直接结果,所以电影首映日票房与电影实际票房的模型表达式为:Y=8.841X-76.196。
2.4 多元线性回归方程的确定基于前面的分析,可以确定最终一个电影在其微博上表示“想看”人数、电影首映日票房以及M1905电影网网站上电影相关新闻的数量有着线性关系。
把这三个作为自变量,电影实际票房作为因变量构建多元线性回归模型,进行可行性探索,结果如表14所示。
在这个表中,我们看到R²是0.675,表示电影票房的67.5%可以通过这三个变量来解释,也就是说我们预测模型的准确率在67.5%左右。
继续分析三要素与电影实际票房关系显著性。
结果如表15、表16所示。
在表15中,我们看到,自变量与因变量关系的显著性为0.000,即小于0.01的某个值,远小于0.05,表明由这三个自变量和因变量“电影实际票房”建立的多元线性回归模型具有极显著的统计学意义。