FiveThirtyEight,了解嗎?國內有模仿者嗎?


我覺得大家不能太過責怪媒體。換位思考一些,人家也不容易。

大家想,每四年的總統大選,候選人大把的銀子孝敬他們,這可是一條產業鏈,多少人靠這吃飯。特別是傳統媒體,被互聯網搞得沒米下鍋了。等大選和楊白勞等過年一樣。好不容易巴巴的等了四年,以為可算可以吃肉了。可川普來了!不但不給錢,反而說自己上電視上報紙是給媒體創造收視率和業績,應該媒體倒貼川普才對。

哪有這麼不要臉的東西!這都能當上總統那還不壞了規矩。以後大選大家有樣學樣,發發免費的臉書推特,你說媒體還活不活了?砸人飯碗,如殺人父母,這還不和他拚命?被川普逼到這份上,媒體也怪可憐的,有苦說不出啊。


538是Nate Silver一手創立的。Nate Silver是以創建和分析棒球高階數據起家的,作為一個棒球愛好者,我個人是承認他在棒球研究方面的貢獻的。

Silver在政治預測方面一戰成名是作為獨立分析者在08年大選時成功預測了50個州中49個的最終歸屬,超過了許多知名polling機構。但如果我們回過頭來看,考慮到搖擺州就那麼幾個,而08年又是金融危機後的特殊情況,他的成功率其實並沒有大眾光環里那麼耀眼。而就是這次成功之後,Silver才把538從個人博客做成了官方網站,其中並不是只有政治類內容,也包括體育和其他方面的統計分析。事實上538現在是ESPN旗下的一員。

從水平上看,538的棒球分析我是一直都看且不敢忽視其觀點的。儘管現在有了很多競爭對手,但作為棒球高階統計分析的先驅,538的乾貨還是不少,也往往有獨到的精闢之處。但在政治分析領域,我一直覺得它言過其實,也很樂於見到它被打臉。

政治選舉方面的分析由於樣本量的問題,本身難度確實比較大。但538自身的模型假設恐怕也是有問題的。例如人群在一個大選周期內受到當期事務和情緒的影響,可能會有很大的立場shift,因此所謂的長期均值回歸能否用在短周期內恐怕是很有疑問的。另外由於樣本數量問題,線性回歸的standard error必然很大(你甚至可以argue說以這麼小的樣本數量根本不能做線性回歸)。538還綜合各大polling機構的polling結果搞起所謂的poll-plus模型,但在我看來,把不同分層方法/樣本時間/數量的poll總和在一起,如果你不是很清楚每個poll的方法/構成的話,結果簡直就是garbage in garbage out. 此外,我認為538忽視了不同年齡/性別/種族的投票意願和相應的投票率對結果的影響,而這一點在本次大選中將尤為重要。

即使有這麼多的弱點,538仍然很有可能是現存的政治預測網站中最「科學」也最接近現實的,如果他們能嚴格按照模型結果來分析的話。然而,538的作者們明顯有自己的political agenda,嚴重傾向民主黨建制派,也因此使得他們的分析文章比他們的模型預測的bias更加嚴重。今年初選時他們的模型在較早的時候已經顯示老床是共和黨方面的熱門人選(之一),然而由於他們被自己的政治傾向蒙蔽了雙眼,反而寫出了一大堆認為老床沒戲的文章,事後看來打臉真是乓乓的。Nate Silver到後來覺得事態不對,按照模型預測寫了幾篇相對中規中矩的,才稍稍挽回聲譽。然而目前在大選中,他們又由於自己的偏好而寫出了有傾向性的文章,個人判斷將再次被打臉。這也說明了要堅持科學是何等的不易。


有誰把nate silver 15年8月開始對trump在初選的預測文章截個圖出來嗎

今年還神話nate silver就太搞笑了


看到有童鞋發中國地圖,我想說真正區分中國各省發展水平尤其是政治傾向的指標,有一個極為簡單的,就是轉移支付占財政比例

那麼按照美帝的政治傾向,紅:傾向於小政府,弱干預;藍傾向於大政府強幹預。應該是獲得的轉移支付少的省份傾向於紅,較多的省份傾向於藍。同時觀察數據大概能看到幾個極為明顯的斷點,雲南-湖南,標誌著巨額轉移支付省份和普通省份的分界;海南-重慶,標誌著普通省份和富裕省份的分界。

(注意,美國兩黨的意識形態在經濟領域僅僅和財政槓桿強烈相關,這不符合中國國情,但我們只是要幾張圖。。。就不用討論那麼深)

那麼僅僅按照經濟基礎的話,我們可以根據自然分界線得到這麼一個區分:

藍省鐵盤:

各種邊疆省份,一共大概是100張選舉人票(我按照美式記法,選舉人票=2+該省15歲以上人口佔全國15歲以上人口比例(六普,我懶得翻18歲的了)*435)

紅省鐵盤:

京津滬、

蘇浙粵閩(這7個除非發生極其重大的政治軍事突變,完全沒有翻藍可能性)、

山東重慶(存在因為意識形態翻藍的可能性,但極低)

這9個省市都是人口非常密集的省市,大概是169張選舉人票搖擺省份:

真正的人口大省集群。。。一共245張選舉人票


知乎上提問題都不需要用一個完整的句子嗎?


近些年來,美國職業競技體育的團隊中 data driven decision-making 的元素不斷增多,越來越多的大型網站或俱樂部開始關注這一方面。如果非要說一個起源,應該從2003 年Michael Lewis 的 Moneyball 開始比較合適。該書詳細前棒球球員 Billy Beane 在Oakland 管理期間將量化分析應用於球隊管理的這一系統過程。這裡不詳細展開。FiveThirtyEight 是最早的一批做這方面工作的網站之一,在08 年由Nate Silver(本人便是棒球數據分析大師)。其方法在體育方面取得巨大成功後,他又將自己的模型應用於美國政治選舉中,而且準確的可怕!(08 的總統選取中,他預測對了50個州中49 個州的選舉結果)

以上是比較基本的介紹,就我所知目前國內沒有模仿者(吧~ ),如果需要進一步了解詳細情況,下面有三個網站可以參考。

FiveThirtyEight (Wiki)

FiveThirtyEight (官網)

Forbes Welcome


1.The Cubs Have A Smaller Chance Of Winning Than Trump Does

2.The Cubs World Series curse had to end in the most dramatic way possible and it did


就是說川普2%的幾率被提名的那個?


中國藍的跟紅的和米帝能一樣么。。。。。

米帝是藍的太過了,天朝是很多地方太紅了。


台灣地區也有幾個類似於538預測選舉的網站

一個是未來事件交易所(這個準確度偏低)

一個是 殘酷無情的未來事件預測,完全基於民調的,這個準確度有80%以上,撇開意識形態不談,是做的政治選舉預測比較好的華語網站。


推薦閱讀:

請大家把2016年美國大選看作一場狼人遊戲,劇情是怎樣進行的?
如何看待9月17日紐約街頭爆炸,紐約市長發表聲明沒有證據顯示與恐怖主義有關?
請介紹一下Barry Goldwater?
如果川普邀請希拉里做國務卿會怎樣?
為什麼美國明星歌手普遍支持希拉里作為下一任總統?

TAG:互聯網產品 | 希拉里·柯林頓HillaryClinton | 2016年美國大選 | 唐納德·約翰·特朗普DonaldJTrump | 538民調 |