烂番茄、IMDb、Metacritic的评分都是怎么出来的?

话说,一部新片要来的时候,大家都会不自觉地先查查烂番茄、Metacritic(MTC)、IMDb、豆瓣的评分吧,不说全信,但至少是很多人决定是否去电影院花钱以及调整期待值高低的重要参考。

最近有不少朋友通过后台留言问我烂番茄、MTC、IMDb这些国外“权威”电影评分网站是如何计算电影分数的,目前这三个评分究竟哪个更靠谱。这个话题之前给大家推送过,今天就再翻出来给大家讲讲清楚。

天天泡在微博微信上的大家应该有这种体会——这是最崇尚个性的时代,也是最没主见的时代。这是去权威去精英化的时代,也是大号儿网红们主宰意见的时代。

而当面对“电影好不好,谁说了算?这种问题,相信一部分朋友会脱口而出——听自己的就好,管他呢?

《纽约时报》影评人A·O·斯科特这样描述自己的工作——

往往当人们为一件东西付出的金钱和时间成本越多,就越会倚重专业的意见和大家的反馈。

但在电子游戏领域,专业媒体的评论和打分依然很受重视。原来,一款游戏不仅售价是电影票的几倍,需要玩家花费的时间也动辄几十个小时,谁也不想白白为烂作浪费光阴吧?

评论家不仅负责品头论足,实际上他们同样是创造者,是推动艺术车轮不断滚动的力量之一。

还得引用A·O·斯科特的妙论——

“我们(评论家)有能力,甚至是有义务,去判断世人所创造的作品,去争论究竟是什么使我们感动、困惑、喝彩或烦闷。至少从潜在意义上说,我们都是艺术家。”

再者,这是一个文化产品空前泛滥的世界,工业流水线生产出来的不可能全都是良品,总得有人去筛选过滤。可惜,社交网络固然为每个人带来了发声的平台,却也是从众心理的温床,对言论的自由度和包容性都在削减。

其实,现在谁说了都不算,唯评论家马首是瞻的时代早就过去了。如今我们更看重的是分数——大家每天的衣食住行都要与形形色色的分数打交道,而在众多“点评类”网站中,给电影打分的又走在了最前列。这就要请出我们今天要讨论的重点——

“影迷三大神器”

第一大神器当然非IMDb莫属。这家网站由英国人柯尔·尼达姆成立于1990年,那时候互联网还没普及呢!

无论电影数据还是评分,对影迷来说,IMDb的权威性无需多言。这里,我只简单讲讲IMDb的计分系统。

IMDb的分数从1到10,10为最高,只要是用户就可以自由打分,而注册过程很简单,也没有任何限制。

每位用户的打分都会被计算到一部电影(电视节目)的最终得分中去——但可不是加总然后计算平均值这么简单。

网络上流传着一个IMDb计算分数的复杂公式,不过,那只是为“IMDb Top 250”所专设的。

通用公式则一直严格保密。官方解释称“显示在影片界面的,并非算术平均数,而是加权平均数”。不必去搜刮脑子里所剩无几的数学知识了,这个概念简单来说就是——

按照IMDb的计算规则,来自“资深用户”的打分权重更大,更能影响到最终得分,不活跃或新用户则相反。至于“资深用户”的判定同样有一套规则,也同样是秘密。

IMDb之所以把打分机制搞得这么神秘,主要是为确保更多有效、真实的评分被计入,避免“水军”、“刷分”、“恶意差评”等现象,这种做法在打分网站里也很普遍。

其实,IMDb还提供了更详细的评分细节。只要点击分数下边的链接,就可以看到目前的总打分数量、分数分布状况,甚至不同性别、年龄、国别给出的平均分,仔细研究下能发现不少有趣细节。

IMDb详细展示了不同性别、年龄用户的打分分布,从上图中我们可以看到,男性观众的平均打分比女性低了将近1分,29岁以下的女性观众远比30—44岁的女性观众喜欢这部片子。

而“IMDb员工打分”和“Top 1000名用户打分”则是两个很有参考价值的类目。

答案:2016年的《BJ单身日记3》。

第二大神器是成立于1998年,国内俗称“烂番茄”的Rotten Tomatoes。

如果说IMDb崇尚的是人人参与,给出的是大众评分,那么烂番茄体现的就是专家意见。

这家网站由越南裔美国人杨生(Senh Duong,音译)始创,他的初衷就是“让人们可以方便地阅读到美国各家媒体的评论”——有趣的是,他还是成龙的粉丝,正是在收集了成龙电影的所有美国影评之后,才萌生了建立网站的念头。

烂番茄的打分群体严格限定在专业影评人范围里。只有供稿于媒体,或身为影评人协会注册成员的人,才有资格打分。说打分也不确切,因为烂番茄并没有“分数”这个概念。

工作人员在阅读影评人就一部电影发表的评论后,判断整篇影评的态度是正面还是负面,然后把好评计为“新鲜”(fresh),差评计为“烂”(rotten),最后统计出给好评者占总人数的百分比——即“新鲜度”(Tomatometer)。

比如一部电影的新鲜度是80%,意味着有80%的影评人认为这片子好。按照烂番茄的标准,如果影片新鲜度低于60%,那就是烂片无疑,可以丢他一脸烂西红柿了。

可是还有人觉得百分比不够直观。于是1999年,“第三大神器”Metacritic诞生了,创始人是马克·道伊尔和他的妹妹朱莉、同学杰森·迭茨。

当时烂番茄已经问世一年多并且非常成功,但他们还是看到了市场的空隙,把评分范围从电影扩展到了图书(后来取消)、音乐和电子游戏。

如今,Metacritic的电子游戏评分是电玩界最重要、最受玩家信赖的分数,甚至足以影响一款游戏的销售成绩。

与烂番茄相同, Metacritic同样请专业评论家来打分。不同的是,分数采用从1到100的数字来表示,被称为“Metascore”。

如何把影评转化成分数呢?他们的方法是,如果原评论者给出了具体评分,不论10分最高还是5分最高,不论按星级还是字母A到F,都可以转化成百分制分数。

比如,若“A”是最高评价,相当于100分,那么“A-”则相当于91分,“F”则相当于0分。如果影评人根本没打分?那就只能像烂番茄一样,由网站编辑读完他们的影评之后再想办法。

在最终分数的计算上,Metascore又跟IMDb挺像,是个加权平均值。

最后,Metascore采用很显眼的三种颜色来体现优劣:绿色(61-100分)为佳,黄色一般(40-60),红色(0-39)差劲,让人一目了然。

显然,“三大神器”之中,代表专业意见的烂番茄和Metascore,与反应大众口味的IMDb恰好形成互补。

IMDb既显示本网站评分,也显示Metascore分数,省去了大家来回查找的麻烦;

Metacritic比较“狡猾”,普通用户也能打分,但你看不见。

“神器”虽好,可惜人家毕竟面向以英语为主的欧美用户。假如你想去IMDb上搜一部并未在美国上映的华语片,很可能会空手而归——就算有收录,那少得可怜的评分样本数量,也不足以作为参考。

不过我们也有自己的“影迷神器”。就拿最著名的“豆瓣电影”来说,它的机制与IMDb接近,都是由普通用户来打分。

对比一下不难发现,很多外国电影的豆瓣评分与IMDb比较接近,这说明全世界的影迷不分国别,眼光都差不多。

而国产片的评分,总体上也能很靠谱地体现大众的态度——某些摆烂坑钱的电影,任主创们吹得天花乱坠,哪怕票房一路奏凯,分数可就那么一直没羞没臊地挂着呢。

在一些“差评风波”中,豆瓣创始人、CEO阿北曾有一篇发表于2015年12月的旧文《豆瓣电影评分八问》被大量转载。文中提到:“比方说一部电影有42万用户打分。我们的程序把这42万个一到五星换算成零到十分,加起来除以 42 万,就得到了豆瓣评分。”

如果真像这位创始人所说,那么豆瓣采用的“总分/总人数”算法未免太简单粗暴——这不正是被IMDb和Metacritic从一开始就摒弃掉的“算术平均数”嘛!前文也曾提到,这很容易让虚假分数干扰真实评分,偏偏我国还是“网络水军”的重灾区。

“注册/收购帐号刷分的,注册/收购帐号刷低分的,明星粉丝团‘进攻豆瓣’的,铁杆用户‘捍卫豆瓣评分公正’反水行动的。”

他认为这些现象对分数影响不大,也透露网站的技术人员一直在与刷分者“搏斗”,比如发现异常行为就删除帐号之类。然而,比起被动的攻防战来,一个更科学准确的算法岂不一劳永逸?

事实上,豆瓣的老用户早已在无奈中摸索出一套经验,比如一部电影在豆瓣上,打1星的和打5星的人数居然接近,评分分布图呈“C”型,那么多半是水军在行动——但这种最典型的刷分案例已经越来越少见,要么是豆瓣应对有效,要么就是水军更狡猾了。

介绍了这么多,其实别人的评分毕竟只是参考,最终判断还得由你自己来下。正所谓“不可不信也不可全信”,影评人有看走眼的地方,IMDb也有不靠谱的时候。

以下这些我的心得,也许能在你困惑乃至愤怒的时候帮上忙。

1、电影这东西,好就是好,不好就是不好,跟爱国无关。

2、为什么明明票房很好,自己也觉得很好的片子,烂番茄评价那么差?

不是影评人耍清高故意跟观众过不去,而是同样套路的片子他可能已经看过500部了,而你才看了5部。

3、为什么你觉得不怎么样的片子,影评人都说好?

4、即便在IMDb上,剧集的打分也比电影高很多,8分剧一大把,所以9分往上才算真正的“神剧”。

5、在IMDb上,大家对恐怖片和喜剧也更为苛刻。一部6分恐怖片便算佳作,7分足以进入经典之列,而5.5到6分这个档,笑死人不偿命的喜剧也挺多。

6、即便在IMDb上,也有刷分现象。

不过参与其中的往往是“自来水”,他们不为赚钱,只为表示对影片的支持或憎恶。

2016年,《超能敢死队》用几乎全女班底翻拍了80年代的经典喜剧,这种明显迎合女权风潮的做法惹得很多“直男癌”老影迷不快,纷纷在IMDb上恶意刷低分,影片评分一度跌至3.6,而由影评人给出的Metascore分数却在60上下。

之后,富于争议的黑人电影《一个国家的诞生》也遭遇类似窘境。打开这两部片子的评分分布页面,你会发现给1分的人几乎和给10分的一样多,呈现“C型”。莫非这是对“政治正确”的反弹?

7、除了发泄外,IMDb也有“爱国分”,印度电影就是重灾区。

由于英语在印度比较普及,在美国生活的印度人很多,且大多数的教育程度不低,他们刷起分来可谓得心应手,势不可挡。

另一个例子是,2016年克里斯蒂安·贝尔的新片《承诺》由于涉及到土耳其历史上对亚美尼亚人的大屠杀,明明只在电影节上公映过,却招来九万多人打分,其中近六万人给了1分,三万余人给了10分——看来用IMDb的土耳其人比亚美尼亚人多,好在后来加权算法起了作用。

8、时间会证明一切。很多电影在上映之初分数偏高,别急,沉淀些日子,等打分人数多了,分数自然会降到理性水平。



留言

请输入您的评论!
请在这里输入您的姓名