首页 > 购物 > 正文

高中生真的懂电影票房吗?

2022-12-06 21:15:55来源:36kr

为什么在中国预测票房更难?

如果一个行业能被一个中学生就带偏了节奏,那这个行业本身也就极不健康。


(资料图片)

最近,浙江三名高中生在国际核心期刊发文的消息被媒体广泛报道。虽然此前就曾经有多个类似的案例,但是这篇论文题目还是吸引了我们的兴趣——《基于人机协同特征处理的电影票房预测算法》。

在分析这篇论文之前,这个新闻事件本身已经受到了不少网友的质疑。

首先,这三位高中生并不是独自撰文,而是作为这篇论文的第3、4、5作者。这篇正文只有12页的论文,字数和研究量也并不多,第一作者是浙江大学的一名博士,有顺水推舟带人情之嫌。

其次,论文本身影响力也确实有限。根据其他网友探究,这个期刊有一名主编和六名编委,全部来自中东地区。其中主编和三名编委来自科威特大学,QS排名1000+。剩下三名编委来自埃及、卡塔尔和沙特,所属学校排名最高在200+。这篇来自四区的论文影响因子仅有0.4。

最后,我们也发挥一下我们的专业,分析一下这篇研究电影票房预测的论文,究竟有多少有价值的内容。

论文表达了什么?

首先我们来看论文的摘要和论文结论,内容通过有道翻译进行译制,略有修改。

摘要:提高票房预测的准确性,有利于刺激电影市场的创作、市场投资、基础设施建设和公共资源的合理配置,促进社会福利和文化繁荣。由于现有的票房收入预测算法没有考虑电影产业结构,预测精度不理想。

本文首先构建了两阶段人机协同特征处理框架。第一阶段以票房数据为基础,利用回归决策树算法对所有票房特征进行初步处理,自动删除不重要的特征;第二阶段将特征处理与建立的人工神经网络(ANN)相结合。在这一阶段,机器处理的特征被手动分类,多个不兼容的特征集被划分。设计了不相容集网络修剪算法,对神经网络进行了修剪。我们用从四个平台上抓取的7098部电影构建了数据集。数值实验结果表明,两阶段算法的平均绝对误差(Mean Absolute Error, MAE)明显优于基线模型,可以有效地直接降低不兼容特征之间编码引起的噪声,提高人工神经网络的预测精度,加快人工神经网络的正向推理速度,减少计算资源的消耗。

结论:借鉴“人在回路”的人机协作设计思想,提出了“特征筛选-神经网络构建-人工修剪”的预测算法。它结合了传统机器学习和深度学习理论,首次应用于电影票房预测领域。该算法在基于数据的传统机器学习特征处理的决策树算法基础上,引入人类先验知识,对构建的深度学习神经网络进行人工修剪,然后对修剪后的神经网络进行训练,得到预测参数模型。实验结果表明,与业界常用的线性回归、决策树、支持向量机等传统算法相比,本文算法在预测精度上有明显提高。这证明了本文方法的有效性。即人在回路是通过结合人和机器的优点来实现的。

作为第一篇将人机协作的思想引入电影票房预测算法设计过程的文章,本文也揭示了基于人机协作的AI算法设计在各个领域有着广阔的应用前景。后续工作将探索非结构化数据集下的人在环预测方法,并尝试在电影票房收益管理中进行实践。否则,我们将继续探索在其他应用背景下预测和分类任务的特定问题结构,分析人类所发挥的独特作用,并相应地设计更高精度的人机协作机器学习算法。

首先,这篇论文的研究方向是根据北美电影市场的测算,因为所有票房以及评分数据比较全面,机器也相对方便抓取。

简单来说,这篇论文就是设计了一个机器算法,这个算法是用来预测电影票房的。这个算法独特之处,就在于该算法是在机器学习中引用了“人在回路”,提高了预测的精准度。就是运用海量数据进行计算和判断,人工进行干预。机器就在此循环中不断学习,变得更聪明更准确。

另外,论文当中预测票房的公式,主要是七个参数。分别是1.影片导演指数;2.影片演员指数;3.影片出品/制片公司指数;4.影片发行公司指数;5.影片预告片热度指数;6.影片话题热度指数;7.影片档期指数。

通过这一点看,影片的票房预测研究理论也算基本合理,没有太过于业余。

根据情报君了解,所谓AI、机器学习、人机交互等大数据测算技术,无论是在国内还是国外,都早就已经运用在了电影市场票房预测这一行当中,本文并不是首创。不过也因为预测准确率较差,目前仍然没有对外开放,人机合作仍然是预测票房的最主要方式。不过无论是好莱坞每年100亿美元+的市场,还是中国四五百亿人民币的市场,在AI、ML(机器学习)等业务范围内,实在是属于很小很小的一块蛋糕。而对于中国市场来说,机器的准确性就更低了。

为什么在中国预测票房更难?

相比已经成熟的北美电影市场,中国电影市场的预测才是最难的课题。

虽然在好莱坞预测票房准确率一直不算太高,但是至少95%以上的电影,提前一周进行预测的话,误差范围能够控制在50%以内。这也是基于北美以及海外发达的市场机制,但是国内并不是这样。

电影票房预测是电影行业较为关注的一个研究方向,尤其是能否尽早给出准确的票房预测。如果能尽早的对票房做出预测,影片的制作方和发行方可以根据票房预测的数据,对影片的制作和发行做出适当的调整,更合理的使用预算,以获得更高的利润。预测的越早,越有实用的价值,但是目前无论是中国的票房预测,都基本集中在定档之后的宣发期。

可以说,目前中国票房预测的意义,也许重要的不是最终预测出来的那个简单的数值,而是预测过程中,对影片多元影响因素的分析从而调整对应的宣发策略以达到收益最大化。

不过市场畸形,加上观众盲目,也很容易导致爆款频出、炮灰扎堆的现象,不利于中等体量影片的稳定发挥,市场上,除了回报率2-3倍的超级爆款,就是赔的连宣发费用都收不回的扑街影片,缺少了中间影片的填充。而影片档期选择、宣发策略的一招失误,就可能导致整个影片的票房成几倍的误差,这也导致了对国产片的票房预测充满了极大的不确定性。

很多的票房预测人士表示,只要看过片,就已经能对这部片的内地表现做一个八九不离十的预估,但是现如今,主流观众的口碑愈发难以捉摸,业内、影评人有时候甚至无法想到一部平庸的电影在主流观众面前会那么受欢迎,抑或是本来一部良心制作的影片会因为体裁限制而无人问津。

大数据没有原罪,有的只是用大数据造假和轻信假数据的人。作为票房预测者,只有不断的学习,面对数据造假见招拆招,更进一步理解市场,不断的修改预测,不怕打脸。不要因为票房预测失灵,就否定大数据对于电影业的价值。

至少在未来5年内,在中国进行票房预测还没有机器能够做到。

关键词: 机器学习 神经网络 研究方向

责任编辑:hnmd004