首页 -- >> 微信矩阵-- >> 调查
APP下载

被民调玩坏了的特朗普:大门口的陌生人

发布时间:2017-04-18 16:59 来源:中青在线 作者:刘德寰

  在美国选举前一周,我问一个直觉很强的女性:美国谁当选?她犹豫一下,说:虽然都说希拉里,我觉得是特朗普!

  特朗普(国内戏称川普)当选引发的话题已经远远超过了选举本身,其中一个重要的话题是:绝大多数民调都预测希拉里当选, 传统民意调查会死?如果仅仅是说传统民意调查的影响还有局限,更进一步的问题是:传统调查会死?这已经不是一个小问题,而是关系到一个行业的生死存亡的抉择。

  一、预测失败的三个表现

  表现之一:传统民调哀鸿遍野

  首先看看各种民调在这次竞选中的表现:

  1/ 民调网站538(FiveThirtyEight)的创始人纳特西尔弗认为,希拉里有72%的概率赢得大选,入主白宫;

  2/ 根据Real Clear Politics网站目前的数据,NBC /SM,希拉里支持率47%,特朗普支持率41%,希拉里领先6个点;

  3/ ABC/Wash Post Tracking希拉里支持率47%,特朗普支持率43%,希拉里领先4个点;

  4/ FOX ,希拉里支持率48%,特朗普44%,希拉里领先4个点(注:FOX长期偏向保守主义,是本次大选中少数偏向特朗普的主流媒体);

  5/ CBS,希拉里支持率45%,特朗普支持率41%,希拉里领先4个点:Reuters/Ipsos,希拉里支持率42%,特朗普39%,希拉里多3个点(以上数据来自Real Clear Politics网站);

  6/ CNN预计希拉里的支持率为45%,特朗普为42%,希拉里支持率多3个点;

  7/ YouGov在5日公布的民调也显示,希拉里只领先特朗普3个百分点;

  8/ 美国MSNBC电视台出口民调:美国民主党总统候选人希拉里比其对手特朗普更得选民信任;

  9/ 民调资讯网站RealClearPolitics统计,希拉里的平均民调支持率领先特朗普2.9个百分点。

  10/ 民调机构麦克莱契-马瑞斯特(McClatchy-Marist)5日公布的一份全美民调结果显示,希拉里只领先特朗普1个百分点;

  11/ 经济学人/YouGov民调结果显示,希拉里支持率领先特朗普4个百分点;

  12/ LA Times Daily的民调则显示特朗普大幅领先5个百分点。

  13/《纽约时报》认为特朗普获胜概率仅5%。

  NBC和华尔街日报民调

  CNN民调

  纽约时报民调

  14/ 影响最大的、被全球广泛推送的(甚至上了中央电视台)的民调是:路透/益普索(Reuters/Ipsos)发布的最新民调结果,民主党总统候选人希拉里克林顿(Hillary Clinton)入主白宫的概率高达90%。该民调预计希拉里获得303票,超过特朗普的235票。

  表现之二:大数据和人工智能预测失败

  1/ 微软必应团队曾公布2016年美国总统大选的预测结果,认为希拉里克林顿赢得大选的几率接近90%;

  2/ 硅谷创业公司UnanimousAI,模仿了蜜蜂、鸟类等动物的“集群智慧”原理,曾在赛马中准确猜中了前四名赛马的名次。它曾在 Reddit的问答栏目中表示,希拉里会成为下一任美国总统;

  3/ UNO系统,使用“集群智能”,预测希拉里当选;

  4/ Greg运用R和蒙特卡罗算法,预测希拉里当选;

  5/ Nate Silver用贝叶斯理论预测,希拉里当选(数据以民调为主,用的方法类似人工智能);

  6/ 印度MogIA预测,基于从 Google、Facebook、Twitter 和 YouTube 上收集到的 2000 多万个数据点的分析而得出的。预测特朗普当选,但是由于其预测模型已经人为倾向于特朗普,意义不大。

  表现之三:媒体态度鲜明地支持希拉里

  1/ 美国日发行量100强的报纸当中,公开支持希拉里的报纸已达43家,包括《纽约时报》、《华盛顿邮报》等大报;

  2/ 特朗普获得内华达州最大报纸《拉斯维加斯评论报》公开支持,且仅此一家;

  3/ 第三党自由党的候选人加里·约翰逊,得到了3家主要报纸的支持。

  二、为什么会出现如此离谱的结果

  Q对大选预测失败的几个判断:

  1. 民调的失败,不是随机的失败,是系统性偏差;

  2. 大数据和抽样数据预测的效率没有差异,应该说一样差;

  3. 特朗普的胜选不是新媒体的胜利,也不仅仅是传统媒体的衰落,是一个新的时代特征;

  4. 偶尔出现的预测正确,要么是“偶然”,要么是“时间已经接近结果了”,没有体现出方法的领先与接近于“科学”。

  Q技术层面的反思:为什么会导致如此错误?

  原因之一:选举人制度与得票率之差——赢了票数,输了选举。

  特朗普得票率47%;希拉里得票率48%。但是,由于美国特殊的“选举人票”制度,美国第45任总统将是川普,而不是希拉里。类似的情况发生在美国已经五次。而民意测验对得票率的关注度过高,使人们忽略了选举人制度,即: 以选举人制度预测大选需要所有州的样本量足够才能准确,而快速的民意测验不易完善此数据(五十个州需要五十个独立的推断)。结论是:如果所有的推断目的是奔向选举人票,同时忽视得票率、样本数量,推断目的就会发生侧重点的变化,趋近于真实的可能性会更好。

  原因之二:五十个州,是否需要50个模型?

  我们知道,当推断的主要目的是结果(选举人制)时,任何一个州的样本在本质上都是独立的,而独立的州的样本需要独立的模型推断,如果机构都是根据全国样本进行的统一加权建模,风险必然高。在找到的现有预测资料上可以看到,即使相对公开的538预测的模型,也是总体预测全美各个州,虽然独立运算,但是每个州的加权方式没有看到差异,或者模型建构思路没有差异,必然带来准确率的风险。

  原因之三:建模逻辑风险

  至少在已知的信息中(很多信息并没有完整披露),模型建构的还是因个体在总体里的简单分布进行的加权推断,少了一个极其重要的思维逻辑,就是 “传播”与“观点互促”,因为在大众传播逻辑上,现有的抽样思维没有问题,大家接受及赖以讨论的信息点在理论上是趋于一致的,但是现在是一个“大众”已经消逝的时代,人们已经生活在去众入群的生活中,群已经不再是原来的简单变量,而是一个复合型的生活态度与价值群。抽样的规则如果还是沿用原来的思维,下次预测还得失败。

  原因之四:抽样分层(分类)时一定是少了一个关键性的影响变量没有纳入,而无从加权建模

  从现有信息中,我们看到的可能用于加权的变量也就是性别、年龄、种族、学历、收入、居住地等常规的指标,没有任何新的思路。而系统性偏差也一定源于此,比如:生活方式、价值观、怨气、多指标合成的群等等。

  原因之五:“未确定投给谁”的群体是有态度的群体

  由于特朗普在竞选中的言语极端而激烈,甚至有些语言“超越底线”,使得想投给他的人认为说“投特朗普”可能担心别人说自己是“民粹主义”、“种族主义者”、“不尊重女性”等等而选择一种安全的态度“没有确定”,而行为上遵从了内心。

  原因之六:调查机构是否“价值中立”

  跟以往任何一次美国的选举不同,本次大选无论媒体还是民调的选边站队都十分明显,即:所有调查背后的机构观点已经显露,不要以为被访者看不出来,而被调查者“没有必要跟您拧着”。我们都知道,著名调查专家Sam Wang的那个著名的赌局:如果特朗普得到240张选举人票,他就吃一个虫子!

  原因之七:别以为王石、任志强、潘石屹等地产大佬们在互联网时代就没有铁杆拥趸者

  很多人都忽略了一个事实,特朗普在25年前是作为商业奇才被广为传颂的,其自传式作品《做生意的艺术》在当时的美国影响巨大,不亚于现在的几个互联网商界精英,这可以部分解释为什么45岁以上的人支持特朗普的原因。

  三、社会层面的反思为什么会导致如此错误

  关于社会层面的反思已经太多,我只说几个观点:

  1. 特朗普本人是不是“民粹主义”,是不是“种族主义”,是不是“反弱势群体”都不重要,重要的是支持他的不一定如此,他们只是觉得特朗普的某些观点是对的,不是全部,而这些“对”的一直不被大家重视;

  2. 什么是弱势群体,在现在的美国已经难以下定论,少数族裔肯定“弱势”?答案:是,但是不能反推“多数族裔”就是强势,因为很多很多多数族裔(白人)不是的强势,而这些人恰恰因为特朗普说出他们的观点而支持他。其余的论断,包括性别、美国至上主义等等也类似;

  3. 特朗普没有赢得多数年轻人(数据上如此),但是在社会化媒体中,川普的大嘴是符合直来直去、不必顾忌、想说就说、我行我素的互联网生活逻辑的,倒是没有“失去太多年轻人”,这是他当选的前提之一。不要永远看高低,要看相差多少;

  4. 群的力量远远大于众的力量,因为众已经在消逝之中了,大众传媒除了“呱噪”几句自己应该“正确”的观点来自认定众的力量之外,只能“徒叹奈何”。

  5.“女性就是大数据分析中心”。人工智能的分析比不上一个女性的直觉,为什么?因为女性不是完全信逻辑,女性信直觉、信体验、信感受、信表现、信信息的背后,而所有的所谓人工智能都只信证据(痕迹),不是感知,预测人的难度非常大,别神话!“感知理解”既是人工智能的未来出口,也是其滑铁卢!

  全球调查业因为固步自封付出了大的代价,而且不会反思,正在步传统媒体的后尘,传统媒体和调查业正面临着一轮深度“衰退”。

  转载自微信公众号:刘德寰(ID:liudehuanpku)

  内容转载自公众号

刘德寰

  刘德寰

【责任编辑:吴蕴聪】
你可能还喜欢看
中青在线版权与免责声明
热点新闻更多>>
图片阅读更多>>