[轉錄] 美國民調四年進步了多少?沒有太多! at HatePolitics

熱度資訊

由 291e1c1807 發佈分享連結

關鍵字分析:


1.轉錄網址︰
https://www.voicettank.org/single-post/2020110501
2.轉錄來源︰
思想坦克 王宏恩
3.轉錄內容︰

四年前,美國各家民調公司預測民主黨候選人希拉蕊.柯林頓有九成的機會當選總統,最
後由共和黨的川普出線。當時各家民調公司的討論結果是,雖然民調資料跟大選選舉人票
是接近的(希拉蕊拿到比較多選票是事實,而且誤差也在統計範圍內),但是幾個搖擺州
同時產生了有地區相關的誤差,因此最後集體向川普偏移幾個百分點,又因為選舉人團制
,所以導致結果大逆轉。

這個說法是來自於統計的理論,民調本來就會有誤差,有時高估有時低估,這是只使用抽
樣時不可避免的。但是理論上高估跟低估的分布是均勻的,畢竟每次抽樣彼此之間是獨立
的,因此有時高估、有時低估的狀況會互相抵銷,總體來說平均值應該是準確的。

但是民調公司認為2016年的許多州的誤差之間有互相連帶,一個州低估時另一個州也會跟
著被低估。這個連帶的背後可能是特定的政黨、族群、職業間的關聯,最後導致結果一起
逆轉。單純從各州平均誤差來說,假如用收集各家民調做最後預測的FiveThirtyEight為
基準,平均高估了希拉蕊1.6%,而低估了川普2.3%,一來一往就是4%的差距。

因此在這次2020年,各家民調公司在進行預測時,幾乎都把各州過去的空間相關納入考量
,尤其是FiveThirtyEight以及《經濟學人》都特別聲明它們的預測模型有放入空間相關
。四年之後,這一次的預測結果是否有改進了呢?

從目前(美國西岸時間11/4早上11點)的結果來看,民調這次似乎沒有進步太多。

首先,就預測差異來看,我同樣使用538的資料以及目前開票的結果資料,平均而言,538
在所有州低估川普2.56%、高估拜登2.96%,這一來一往的差距高達5%!這也是為什麼選前
民調幾乎全面看好拜登,但最後結果開出來至今還在拉鋸。

接著,我把538在2016年預測川普的差距程度、跟2020年預測川普的差距程度,畫成以下
的分布圖。在這張圖裡面,X軸是2016年川普實際得票扣掉2016年538對川普的預測,而Y
軸則是2020年川普實際得票扣掉2020年538對川普的預測,中間的黑斜實線是做為比較基
準的X=Y,而虛線則是誤差分布回歸模型的趨勢線。

從結果來看,我們可以發現以下的狀況。

第一,大部分的點落在第一象限,代表538在2016年低估川普的地方,2020年還是低估川
普,但也有一些點落在第二象限,是2016高估但2020低估的州。

第二,幾乎很少點在Y=0以下,代表538幾乎在所有的地方在2020年都是繼續低估川普。在
第三象限的點很少,代表沒有什麼地方是2016以及2020都高估川普的。

第三,假如從趨勢線來看,趨勢線的確比X=Y還要平,這代表說預測誤差範圍變小了。
2016年誤差可以從+10%一路錯到-10%,但是2020的誤差錯誤只從+10%到-2%,這可能可以
歸功於這次把空間相關納進模型,因此有修正了空間上的不準確率。

然而,平均誤差顯然還是很大,這裡看到的5%誤差遠比傳統抽樣一千人的3%還大(當然,
誤差本來就可能大於3%,請參考這篇〈對比式選舉民調的錯誤解讀〉。而且就分布來看,
顯然仍然有系統性的朝低估川普的方向偏移。在選前一些討論,就有提到民調裡面有害羞
的川普支持者,而且這比例可能也高達3%。民調做出這個比例的方式是,先問受訪者有沒
有認識誰支持川普但不敢講的,假如受訪者說有,民調再問說「那是不是你啊?」。大概
有3%的受訪者承認,因此得到這個數字。

但正因為這些人的存在,導致民調在修正上出現困難。過去民調修正的方法是透過社會經
濟變數來加權,這背後的假設是不同社會經濟背景的人投票傾向不一樣,而且不接受採訪
的比例也不一樣,但總體來說在修正之後,不接受採訪的比例會是隨機誤差。

但假如現在的誤差是來自於某候選人的支持者系統性的不接受採訪,那麼就算修正之後,
還是會普遍低估該候選人的支持度,除非我們直接加一個比例給這候選人,但這很可能是
毫無理論基礎的加法。

雖然這聽起來很玄,但這在台灣民調界過去並不是個這麼神奇的事。以前由於台灣白色恐
怖,泛綠選民往往拒絕在民調裡面表態,甚至根本不接受民調採訪,因此導致過去台灣的
民調常常會顯著地高估泛藍的支持度(以我跑2014年台灣地方選舉來看,平均而言會有
3.7%高估泛藍。這個現象隨著蔡英文在2016年當選之後逐漸消逝,但在過去幾十年政黨估
票時,常常就是從民調未表態裡面直接分超過一大半給民進黨,這樣的結果往往更接近最
後的選舉結果。當然,現在美國的民調偏差顯然不是因為有白色恐怖,但對於民調的類似
反應同樣出現在結果的偏差上。

因此光就結果來看,這次的民調與選舉結果之間的差異,可以說民調公司還是有很大的改
進空間。但是否真的在理論或實務上有辦法修正,以及這個修正本身的速度是否趕不上社
會政治經濟的快速變化,或許就是一個更嚴肅的問題了。


4.附註、心得、想法︰

幫整理重點:

538今年的預測平均而言與實際結果相差5%
相較於四年前的誤差大概是4%,基本上毫無進步

甚至四年前538有少數高估川普的部分,今年還變成低估

正面來說,是538成功把自身的誤差範圍減小,比較不會有過度誇張的單一州的誤差

538目前還在進行即時的新聞與短評更新(我沒怎麼看,有人看到他推特寫啥嗎)
確定開完票之後應該和前幾屆一樣會有總檢討

蠻期待Nate Silver這次會出來說什麼,還會否定系統性偏誤嗎?

--

There are many people in the world who really don't understand, or say they
don't, what is the great issue between the free world and the communist world.

        ~John F. Kennedy, 1963

--

網友評論

※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 172.251.25.129 (美國) ※ 文章網址: https://www.ptt.cc/bbs/HatePolitics/M.1604647380.A.25A.html
muscatsss: 他誰? 11/06 15:23
ggirls: 連民調都不會,去和共產黨學學吧 11/06 15:24
Robben: 按照美國主流民調 拜登早就贏了 11/06 15:25
MVPGGYY: 很多都還是前幾天才刻意快速縮短差距,故意留下最後一次 11/06 15:26
MVPGGYY: 民調不會差太多的歷史數字,但都還是差不少,這民調實在 11/06 15:26
MVPGGYY: 是.... 11/06 15:26
Capital235: 按照xinn的民調 拜登早就宣布勝選了 11/06 15:26
Capital235: 我們也不用在這討論 11/06 15:26
bakedgrass: 這是事實... 11/06 15:27
KotoriCute: 這四年美國民調毫無長進 11/06 15:27
KotoriCute: 還是嚴重低估川普 11/06 15:27
bakedgrass: 這點川粉其實非常正確 11/06 15:27
KotoriCute: 民調公司真的應該通通關閉 11/06 15:27
MVPGGYY: 你要是去抓選前1~2個月的民調數字,那會嚇死人的錯更大 11/06 15:28
slimak: 看538的話 開完佛州拜登就宣佈當選了 11/06 15:29
SilverFlare: 退步吧 538準備信用破產 11/06 15:29
elainakuo: 16% 應該一開始就信心滿滿 第一天播到後面哭喪臉 11/06 15:30
MVPGGYY: 反而另外那家t什麼的民調,說有大量沉默害羞的支持者倒是 11/06 15:32
MVPGGYY: 非常正確的判斷跟民調 11/06 15:32
Robben: 普選票還差不多3% 11/06 15:36
same60710: 就民調還是有差 只是這次川普沒逆轉到可以贏而已 11/06 15:42
MVPGGYY: 要不要找台灣的美麗島那間民調公司去幫他們做啊? 美麗島 11/06 15:42
MVPGGYY: 這次的民調跟投票結果幾乎差不多 11/06 15:42
same60710: 總而言之做出拜登大勝跟川普逆轉的民調兩邊都不準啊 11/06 15:42
MVPGGYY: 可是你去看差異的%數字,是做川贏的差異小很多,民調公司 11/06 15:44
MVPGGYY: 在意的應該是數字的差異而不是誰輸誰贏才對 11/06 15:44
Colitas: Trafalger做MN是tie,這樣叫準?只是像內文說的一樣直接 11/06 15:46
Colitas: 把票加給川普吧 11/06 15:46
MVPGGYY: 要看整體數字差異吧,別家的就是差更多啊 11/06 15:48
Robben: 我覺得沒ㄧ家是準的 11/06 15:48
zssj: 都是看今天的汽球 去判斷明天的風向 XD 11/06 15:49
Colitas: 我也覺得都不太準,川普因素影響太大,可以變準的方法確 11/06 15:49
Colitas: 實就是往川普加,但是這樣就會在某些情況出現荒謬的結果 11/06 15:49
fanrei: 1樓他爸是王業立本人也在美國助教政治領域吧 11/06 15:50
fanrei: 理論上應該是淺藍淺民主黨 11/06 15:50
tx5311: 10月川普陣營出手那段時間前後感覺比較可以參考 11/06 15:54
tx5311: 最後兩個禮拜大概只是為了避免誤差太大才做平衡的 11/06 15:54
Colitas: 全國民調IBD準確度還不錯,他們有公布每天滾動的數據, 11/06 15:58
Colitas: 也有公布細項,可以跟早期投票的數據互相應證,最後跟結 11/06 15:58
Colitas: 果也蠻接近的,至於各州,真的沒看到哪家特別準,主流媒 11/06 15:58
Colitas: 體幾乎都低估川普的隱形影響力。 11/06 15:58
TheoEpstein: 確實如此 11/06 16:03
sevenine: 不是都算田野調查嗎? 11/06 16:06
tavern: 下次共和黨派個中規中矩一點的候選人大概會民調會準一點 11/06 16:08
thegame09305: 他就假民調當文宣咩,你們跟他計較 笑死 11/06 16:12
stja: 11/06 16:13