2016 年美国大选的民调准确率如何?如何提高民调的准确率?

新闻背景:英国退欧公投民调错得离谱 这次美国大选呢?

最近一位住在英国的美国听众就在美国国家公共电台(NPR)的节目中提问:美国大选会不会可能看到类似英国公投退欧的结局?美国独立民调机构、智库皮尤研究中心的调查研究主管Courtney Kennedy当时回答:“有这个可能性,但看来小。”

Kennedy解释,因为英国的民调和美国不同,出于成本原因,英国很少基于概率做民调,任何人都可能被选为英国民调的调查对象,而在美国,调查机构能拿到全国电话号码的总清单,“通过这种方法我们知道每个人被选中的概率。”

英国脱欧打脸,此次美国大选会好一些吗?有哪些手段可以提高民调准确率呢?主要是成本因素吗?


可以确定一个结论了,民调等于瞎编,这次没有任何借口,总统和国会选举全都错的离谱,比如威斯康辛的Ron Johnson民调里两位数落后长达大半年,数十个民调里只有一个民调显示他领先,然而开票还没一半就赢了,这样的玩意还算是民调吗,我以后再也不信民调了。14和16年都一样,民调全部偏左4-10个百分点,而且这次没有大选与中期选举选民结构不同这个可以拿来说事的借口了,大概以后大家按这个数字调整就好了。


民调的失败不在于抽样有偏,而在于回应有偏,拒回答率或者错回答率高。即迫于舆论压力或者其他原因,川普的支持者通常在之前调查中过分conservative,这也是为什么摇摆州都投给了川普——有太多我们能不知道的隐性支持者。相反希拉里的支持者一般都是大肆宣传的。有一个很好的例子是cnn在大选前采访的一个early voter,问其支持谁回答“not decided”,试想not decided会来提前投票?支持谁不言而喻。

英国脱欧的预测失败也是出于这个原因,英国人性格上比较保守和sophisticated,支持脱欧的接受采访不会说。

基于这一点前文提到的爬去社交网络数据其实不会帮助很大,因为在社交网络发布信息时人们会更注重自己的言行。

匿名投票可能可以避免这个问题,但样本采集容易有偏。


大部分media说言论警察并不存在

结果这次所有民调统计学意义上的证明了言论警察不但存在而且非常严重

民调失效的原因很简单,大部分人在争议性的话题上公开场合并不愿意说真话,只有这个才能解释

大堆民调近乎全军覆没的现象,哪怕是传奇级别的fivethirtyeight

一个糟糕的公共舆论空间,用什么model都是没用的


目前的高票答案是错误的

LA Times是national poll。川普是靠赢得Rust Belt依靠选举人票获胜,希拉里因为加州的latinos还是赢了popular vote。

某种意义上来说LA Times的poll是唯一一个把national average搞错的poll。

不过显然答主也不是真正的相信这个poll


这次川普当选美国总统和之前英国公投脱欧都证明了一个事情,那就是世界上的的确确有一群人叫沉默的大多数。

别看这群人平时好像什么话都不说,什么事都不做,但是往往在一些关键的历史节点上,他们能让那些平时声音很大的人大吃一惊。

还记得当年有美国朋友跟我说,李,我觉得你们中国人都特别反美。我告诉他说,你错了,我们中国亲美的人,是你们美国人口的三倍不止。你在新闻上看到的,网络上看到的,街头上看到的一切反美的浪潮和声音,无论如何声嘶力竭义愤填膺,其实微乎其微,而亲美的声音,在沉默中震彻云霄。

原因很简单,那些喊反美反日的人之所以声音那么大,是因为在这个国家喊反美反日实在太容易太廉价了,任你是谁,张三李四阿猫阿狗,你根本不需要花一分钱,不用花任何一点代价就能喊两嗓子,你只要花得起买个横幅的钱,就能去堵肯德基的门口。

但是反过来呢?

至少在这个国家的政治层面上,意识形态上,美国日本仍然是她的对立面和假想敌,所以反美反日是这个国家的政治正确。违背政治正确,需要付出切切实实的成本。

政治正确这个东西,确实能感染一部分人。比如所谓的白左圣母心,比如国内的小粉红,永远感动永远热泪盈眶。

但对于沉默的大多数来说,现实利益永远放在第一位,因为他们正是这些白左和小粉红的父母和保护者,他们是要帮白左和小粉红买单的人。

对这些人来说,政治正确算个球。只要不触及他们的核心利益,他们可以保持沉默和合作,但是一旦你越过红线,你会发现无论你想做什么,你呼吁什么,你一定会失败。

如果不出意外的话,特朗普注定碌碌无为,因为他早就把能帮他做成事情的那些高层人物得罪了。但这和他出现的重要意义相比可以忽略了。

特朗普不是引起美国各种问题的原因,相反,他是美国各种问题所引发的结果,而且还不是最终结果,只是沉默的大多数给当权者和利益集团的一个警告。


看了几个回答,不得不说,近年政治正确,清高的pc,还真是挺可怕了。连英美这样的国家也多少人是怕被pc攻击而言不由衷。


夸一下大USC和洛杉矶时报的民调,之前一直和其他几大民调有差距,但是结果证明了一切~

另附链接 The USC/L.A. Times poll saw what other surveys missed: A wave of Trump support


没有言论自由的民调毫无意义。


作者:王二狗

链接:有哪些数据风向标更好地预测了这次美国总统选举结果? - 王二狗的回答

来源:知乎

著作权归作者所有,转载请联系作者获得授权。

从事后看,什么都是风向标。然而选举之前几乎所有媒体都预测川普当选的概率不超过20%,媒体之中最看好川普的Nate Silver给出29%的概率居然引发巨大争议。再好的风向标也顶不住黑天鹅。抽样调查的局限性在这种超过50%就赢的投票中被严重放大。

美国大选启示

1.数据预测的局限性。

之前美国各大主流媒体的民调结果都显示希拉里占优势,几乎所有媒体都预测川普当选的概率不超过20%,媒体之中最看好川普的Nate Silver给出29%的概率居然引发巨大争议。

为何如此?

个人认为主要就是资金不够,调查样本不足,随机性不够导致的。

为了节约资金,所有的民调都只能在较小的样本调查范围内进行,所有的民调都需要很多“假设条件”。50个州,每个州调查500个人,加起来就超过2万人,这样的调查耗费的资金、时间已经够大。但这样本完全不够。加上很多媒体为了效率依赖网络进行调查,很多大龄、赤贫等等非网络用户不会被纳入调查范围,样本的随机性不够。加上每个州的都是独立的选举人票,超过50%即拿走全部,也就是说在第一次调查结果如果两人差距在10%甚至20%的范围内这个抽样调查都不够可靠,这次媒体根据民调得出的错误结论主要原因就是多个摇摆州希拉里只领先不到5%,而媒体就把全部选举人票给了她。

同样的预测事故在之前的英国脱欧事件里已经反映的很明显。这些都反映了中产以上人群更容易在当今传媒中发声,而大量底层沉默的大多数一直被媒体习惯性忽略的媒体阶级属性。

数据预测从来都是有局限性的,否则08年就不会发生金融危机,黑天鹅事件就不会存在。

2.温州工厂的威力真的那么巨大么?

特朗普当选后,很多媒体报道说义乌工厂成功预测美国大选,这是大数据的胜利。这是什么鬼?据说事情是这样的,义乌一个工厂的老板说,特朗普面具的订单是希拉里的4倍,之所以希拉里面具订单少,是因为采购方对希拉里能否当选没有信心。

对此我只想说,呵呵,MDZZ。

按照这个预测,特朗普应该是4倍优势当选啊,为什么最终结果是228对290?如果根据这个“大数据”预测,按照美国的州选举人制度,特朗普应该获得每个州的选举人票,因为每个州他都有4倍优势啊?但最终的结果是特朗普当选也只是“微弱”优势,他靠着多个摇摆州获得比希拉里多不到5%的选票取得了更多的选举人票,仅此而已。

另外一个事实,希拉里这次选举经费是特朗普的数倍,按道理她更有钱去买更多的面具。

3.政治正确是否是真正的正确。

没有什么是真正的正确,枪杆子里出话语权,强权就是一切。这一直是新世纪之前的人类社会法则。之所以会有政治正确,主要就是因为民主选举制度的存在。民主制度越发展到最后,两方政治纲领越会趋同,谁都没有绝对把握赢得对方,这时候,两方都会想从少数族裔、移民、各种以前被歧视的人那里拉到选票。这时候,对非主流人群的政策、口号就会占据主流的宣传之中。这种政治正确发展到极端,就会形成少数对多数的歧视,参见天国某绿。


传统主流媒体因为一致向着希拉里,所以他们的民调几乎骗了所有人,如果关注美国社交网络的话你会发现特朗普的支持率奇好。这是传统媒体和新媒体的差距,大选前印度某数据公司通过分析Twitter和Facebook上的民意做出了特朗普当选的预测,互联网时代传统媒体的舆论控制能力在下降,新媒体极速走到了前头。


谢邀。

本身对民调这事并不是很注意,川普也好,希拉里也罢,没有太多关心。所以对于此问题,可能会有点答非所问,我记得之前学统计学的时候,就看过一个美国大选的报道,比较有意思,下面复制过来:

美国大选民调历史上有一个很知名的故事,是关于《文学文摘》和知名民调机构盖洛普的。

在1936年美国大选中,民主党候选人罗斯福对战共和党候选人阿尔夫· 兰登。《文学文摘》此前准确预测过5次总统选举结果。1936年大选,《文学文摘》当年邮寄出1000万份问卷,回收到230万份,样本数量很大。

经过分析后,他们预测共和党候选人阿尔夫· 兰登会战胜罗斯福当选总统。结果却是罗斯福获得了压倒性的胜利——在48个州中胜出46个,普选票也拿到了60%多。

《文学文摘》遭到羞辱,但这次的惨败使他们不久就宣告破产了。

原来,《文学文摘》是按照电话号码本选出的这1000万调查对象,但在当年的美国,能装得起电话的往往都是较富裕阶层、持保守立场的共和党选民,而支持罗斯福的广大工人群体基本被排除在调查范围之外,由此在样本上造成了显著偏差。

但另一家刚成立了一年的民调公司盖洛普,只用了5万样本,得出了完全相反的结果。其采用的办法就是分层随机抽样。分层随机抽样,可以避免对样本来源集中于某一群体,能够更客观地反映全体投票者的倾向。

盖洛普由此一战成名,逐步成长为美国知名民调机构。盖洛普创始人乔治· 盖洛普,也被视为大选民调科学化的代表性人物。其本人更是留下这样的名言:“抽样民意调查就是那根给 民主脉搏 把脉的手指”。

上文网址:http://transcoder.baidu.com/from=1000950a/bd_page_type=1/ssid=0/uid=0/pu=usm%400%2Csz%40320_1004%2Cta%40iphone_2_6.0_9_1.2/baiduid=8605BB3F3825ABCDC2E104767AA5FC55/w=0_10_/t=iphone/l=3/tc?ref=www_iphonelid=8650995461362694581order=4fm=aloptj=www_normal_4_0_10_titlevit=osresm=8srd=1cltj=cloud_titleasres=1title=%E7%BE%8E%E5%9B%BD%E5%A4%A7%E9%80%89%3A%E9%82%A3%E4%BA%9B%E5%B9%B4%2C%E9%9D%A0%E8%B0%B1%E4%B8%8E%E4%B8%8D%E9%9D%A0%E8%B0%B1%E7%9A%84%E6%B0%91%E8%B0%832016%E5%B9%B4%E7%BE%8E%E5%9B%BD%E5%A4%A7%E9%80%89...dict=32w_qd=IlPT2AEptyoA_ykzz41pywBsOFgktJRhoVFurQqcdx-osec=16528di=f5b39951505c2261bdenc=1tch=124.534.301.608.3.1015nsrc=IlPT2AEptyoA_yixCFOxXnANedT62v3IEQGG_yJR0D7bpFqjgf4wXdNpX88wLjrIBU0gu7iHxBt8wnSa_Xkn7A60tLdmpSFwmHrfdvnuhh0ZUQpJut9seqid=780e8289840a3800100000055821f8aawd=clk_info=%7B%22srcid%22%3A%221599%22%2C%22tplname%22%3A%22www_normal%22%2C%22t%22%3A1478621381950%2C%22xpath%22%3A%22div-a-h3%22%7D

以上内容,仅作为一个故事看看就好。

现在的民调,应该不会是那个年代的方式,也不会是那种简单的思维了,最起码会融合舆论热度,影响力,政治主张等等方面的因素考虑。作为一个天朝吃瓜群众,尤其是数据方面的新人,抱歉没能回答得了这个问题。


贴另一个问题下自己的回答:

作者:硝酸铵

链接:美国大选的民调有多准确? - 硝酸铵的回答

来源:知乎

著作权归作者所有,转载请联系作者获得授权。

更新:把测力计改成了秒表;另外以防系统误差,增加了校准问题3。

-----------------------------------------------------------

刚想的提高今年美国大选民调精确度、防止有人不愿回答真实意愿的一个方法:

拿一个数码显示的秒表,精确到毫秒,告知被调查者使用方法为按开始后正常呼吸两次以上(防止连击得到的数据不随机)再按结束,然后看末位数字是奇数还是偶数(不让调查员看到)。问卷关于被调查人背景的问题如常,但关于投票意愿的两个核心问题如下:

核心问题1:请按秒表开始,然后至少呼吸两次后按结束,如果现在显示的最后一位是偶数 或者 你打算支持克林顿,请回答“Aye”;只有 上述两者皆不成立,请回答“Nay”。

核心问题2:请按秒表开始,然后至少呼吸两次后按结束,如果现在显示的最后一位是偶数 或者 你打算支持特朗普,请回答“Aye”;只有 上述两者皆不成立,请回答“Nay”。

校准问题3:请按秒表开始,然后至少呼吸两次后按结束,如果现在显示的最后一位是偶数,请回答“Aye”;否则请回答“Nay”。

然后就可以统计分析结果了,结合被调查人背景估计能得到不少有意思的信息。

可惜现在太迟啦…纸上谈兵罢了。

(声明:此调查方法非原创;不过两方面各问一遍并用以相互校验、外加校准问题的方法没见过,不知有否应用先例?)

当然,取样的代表性是更基础更重要的要素,这个参见其他更专业的答案吧。


选举前不声不响,选举后都出来分析了。


谁说没有一个民调准确预测了川普的获胜?

Where the presidential race stands today: The USC Dornsife / Los Angeles Times poll

以上是洛杉矶时报(典型“左媒”,背书了希拉里)与南加州大学(典型“左校”)合作做出的民调


谢邀。恭喜题主,Trump胜,民调机构实力打脸,充分说明这是个值得研究的好课题!

刚刚开了个脑洞,是否可以搜集民众在社交平台的言论,通过文本挖掘计算出民众对竞选者的情绪指数(积极,消极或中立),这或许可以在一定程度上辅助预测。就像当年利用Twitter预测股票涨跌一样。

更新:

利用社交网络数据的确会带来更大偏差,因为在公众场合人们会更注意自己的言行,掩盖真实想法,尤其在主流媒体在希拉里的引导之下。看今年五月份的一条微信推文川普商品是希拉里四倍!江浙订单、美国淘宝出货量共和党大胜 利用电商平台积累的订单数据或许可以作为辅助预测的新思路 。


-

「民调永远是对的哟。」

「菲律宾的总统,下了杀人令,可是有90%的民调支持率呢。」

噗。……来来来,参观团请移驾这个答案的评论串:

如何看待菲律宾总统杜特尔特公开鼓励民众枪杀毒贩? - yolfilm 的回答

知乎最好玩的一群人,他们嘲弄希拉蕊的民调数字,

同时呢,又可以用杜特尔特的民调数字,证明他的正确。

你跟他说「民调不可信」,他还会骂你「没有证据」。

呶,证据来了,川普以低民调,高票当选美国总统。

政治一事,真是好玩。

噗。

------------------------------------

不答评论串的诸位大侠,感觉不好意思。

我就补两句。

诸位呀,把民调叫的震天响?不知大家信心打哪来的?

讲真,就因为「没见过民调」,才会出现你们这种盲信。

以外面的社会为例,随便整个选举,都有二三十家机构在作民调。

选举过程中,民调数字的操弄,是非常正经的选战手段。

见多了猪跑,也吃多了猪肉,你不会把猪当神明贡。

不说别的,你们接过民调电话没有?在街上撞见民调人员没有?

多来几次,瞎鸡巴乱答几次,你就知道这玩意儿,有它妈的多可笑。

我随便给诸位键盘侠举个例子啊。

当代投票最困难的有几点,其中一个叫「选民热情」。

每个党,每个候选人,都会叫选前「告急」,拼命塑造自己快选不上的假象。

所以,作为支持者,我们巴不得对手的民调数字愈高愈好。

遇上了作民调的,全说反话……。

为什么?就为了剌激我方支持者的危机意识。

鼓励我方支持者们,别在家睡觉了,快出门投票!

民调是一种真真假假的游戏,在当代的选战中,早就是一种招式用老的套路。

1、选举时,高数字有时是给对方阵营送炸弹。不可信。

2、平时,政令型的询问(比如菲律宾杀人乱政),

一般人更不可能在「接受调查」时,讲「反政府」的意见。

3、民调没有专利,任何野鸡单位都能作,而且可以作出各种假数字出来。

吹牛又不犯法?又不上税?谁它妈不会整两数字来帮自己搞政治呀?

上面说的,是「常识」。

当然,信不信由你咯,谁爱信,谁信去。

-


大家还没从这场意外的选举结果中缓过劲

我们意外是因为没想到川普会赢

没想到他会赢是因为几乎所有民调都选择了希拉里

一片蓝海:主流民调几乎全部预测希拉里当选,并且胜算高到不忍直视

这个星球上最爱科学的国家,用最直观的数据摆了所有地球人一道

所有人,包括川普和希拉里

美国多家媒体都说开了,川普根本没想到自己会赢

虽然嘴上口风一直很硬,但在临投票前一周,连他居功至伟的竞选经理都站出来承认

他们在民调中落后

“是的,我们落后了”

为什么这次大选民调全错了?欢迎查看我的文章知乎专栏

作者:林伯虎

链接:知乎专栏

来源:知乎

著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。


代议制民主的一个理论基石是:自由的媒体提供有效的信息供选民做出理性选择。

然而,不论是这次美国大选还是之前的Brexit,选前的民调都与结果大相径庭,让人大跌眼镜。

现在的问题是:所谓的信息自由市场真的能降低信息成本吗?毕竟在内容近乎免费的时代媒体的价值完全体现在外部性上,媒体天然就有寻租的冲动,市场失灵难道不是注定的吗?

也许西方人该好好想想了。


有些敏感问题调查的方法还是有办法增加准确性的。

比如先做一个抽球,然后根据抽球结果回答不同问题(比如一个是你支持谁,另一个是你最不支持谁),而调查者只知道两种题目的比例而不知道某个人具体回答的问题。这样对个人层面来说并不知道某人具体支持某方,但是从群体层面来说,是可以进行无偏估计的。

这次民调最大的问题是:绝大多数民调部门并没有意识到这是一个敏感问题;或者绝大多数民调部门自己默认了一个有偏的结果。公开支持trump会被攻击,谩骂甚至殴打,这种情况在一个皿煮国家也是够了,公开违宪的行为都能被认为是政治正确的表达。

政治正确是对的,但是过于政治正确造成的割裂就不知道如何弥补了。。


民调的作用是影响民意,而不是反映民意,就如同博彩公司的赔率是用来引导投注,而不是反映博彩公司的真实倾向。


推薦閱讀:

入行大數據需要掌握哪些技能?
如何判斷一個行業的興衰呢?
怎樣判斷一個人是否適合做數據分析?用什麼題目測試更有效?
大數據理論如何指導交通數據分析?
什麼是數據分析?

TAG:数据分析 | 2016年美国大选 |