誤差或失真:被賭盤「比下去」的選前民調,真的不再值得美國人信任了嗎?

為了理解民調偏差的原因,本文參考全球媒體報導(如 BBC、半島電視台、多數美國媒體等)及專業研究中心的分析,也訪談了在美國小型民調公司工作的數據分析師 Lynus Hung,綜合各方意見,得出幾項結論⋯⋯。
誤差或失真:被賭盤「比下去」的選前民調,真的不再值得美國人信任了嗎?

總體來說,2024 美國大選的民調預測仍在合理誤差範圍內。

Photo Credit:Frame Stock Footage@Shutterstock

撰文:Judy Wu

美國 2024 年總統與國會選舉雖然落幕,但相較於選前民調顯示的「雙方支持率接近」、「選情緊繃」,最終投票結果卻是川普大勝 314 萬票,並拿下全部 7 個搖擺州的選舉人票,讓許多人質疑民調是否失真、不具參考價值。

但是,事實真是如此嗎?民調是早已偏離民意,還是僅在誤差範圍內?

民調「失真」爭議的來龍去脈

在大型選舉前,民調通常是候選人、媒體和民眾了解選情的重要工具。

2024 年美國大選前,多數民調顯示這是美國史上「最接近」的總統競選之一:在全國範圍內及關鍵搖擺州,賀錦麗與川普的支持度僅相差 1 至 2 個百分點,多數評論認為雙方在關鍵州的支持度相當,難以預測誰能贏得所需的 270 張選舉人票,雙方可說是勢均力敵。像是《紐約時報》的報導就顯示,賀錦麗和川普在搖擺州的民調預測平分秋色。

而根據《FiveThirtyEight》(美國民調預測網站,由 Nate Silver 創辦,融合不同民調數據以提供綜合的選舉預測和分析)的民調分析,以全國來說,賀錦麗的勝選機率比川普高 1.2 個百分點,許多媒體也參照這些民調數據做了相應報導,認為賀錦麗的當選機率更高。

賀錦麗在全國範圍內的民調略勝川普 1.2 個百分點。圖/截自 FiveThirtyEight 官方網站

然而最終結果出爐,(在截稿日前)川普共獲得 7,552 萬票,超過賀錦麗的 7,238 萬票,領先約 314 萬票。在選舉人票方面,川普在 7 個搖擺州(賓州、喬治亞州、北卡羅來納州、密西根州、亞利桑那州、威斯康辛州、內華達州)皆勝出,拿下共 93 張選舉人票,最終以 312 比 226 贏得總統職位,甚至在賀錦麗獲勝的幾個州也出現民調預測「低估川普支持率」的現象。

此結果不僅讓共和黨支持者大喊紅潮來襲,也引發民眾對民調預測的信任危機,例如:《The Daily Show》的主持人 Jon Stewart,在節目上公開嘲笑民調的不準確;由 J. Ann Selzer 創立的民調公司 Selzer and Co 也被抨擊操控數據,因其預測賀錦麗在愛荷華州領先川普 3 個百分點,但結果卻是川普大勝 13 個百分點;而部分選民則認為主流媒體淪為「左派喉舌」,話語權被壟斷,紛紛揚言退訂,說不會再相信假新聞。

這是因為民調結果的偏差,可能影響一些尚未投票的選民的投票意願和方向,甚至誤導候選人,從而影響他們的競選策略。

大選結果。圖/Google presidential result

一些人甚至指出,線上博彩網站的預測比民調「更準確」,認為日後選舉不必再參考民調,只要看賭盤即可。去中心化預測市場平台《Polymarket》也在 X(前稱 Twitter)上發表貼文,聲稱他們證明了市場的智慧高於民調、媒體及專家們,因為他們一致且準確地預測了大選結果。

先了解美國民調的運作方式

目前選舉民調大多還是以電話調查為主,考慮到手機的普及率,通常採用手機調查多於市話調查,有些民調機構也開始使用線上調查平台。民調公司會依據當地人口組成來選取具代表性的樣本,包括年齡、性別、族裔、黨籍等,使用隨機抽樣或其他方法,並根據歷史數據進行加權分析,以確保調查結果能夠反映全體選民的意向。

為了理解民調偏差的原因,筆者參考全球媒體報導(如 BBC、半島電視台、多數美國媒體等)及專業研究中心的分析,也訪談了在美國小型民調公司工作的數據分析師 Lynus Hung,綜合各方意見,得出接下來的結論。

造成民調偏差的 4 個可能因素

原因一:取樣偏差

在抽取樣本時就有可能出現誤差,例如樣本群體的不同:《FiveThirtyEight》的統計數據中,就可以發現光是 Sample Types(樣本類型)就有分成 Adult(成人)、Voters(選民)、Likely Voters(可能的選民)和 Registered Voters(已登記的選民),樣本群體之間存在差異。

此外,並非所有目標族群都有機會被抽樣,即便被抽中也可能不願參加調查──年輕且高學歷的民主黨支持者較常使用手機,並傾向參與民意調查,手機調查可能會接觸到較多這類型的群眾,導致樣本數太高;而川普曾抨擊民調「造假」,導致共和黨支持者參與意願較低,因而樣本數相對不足。

有些人認為民調機構未能有效接觸川普支持者,可能是 2016 年後民調偏差增加的原因。雖然有些民調機構試著使用打電話以外的方法(如 Email 或網路問卷)來接觸不同的群體,也不一定能蒐集到最具代表性的樣本集合。

不同民調的樣本來源和預測結果差異。圖/截自 FiveThirtyEight 官方網站

原因二:回應偏差

隱性選民效應(Shy Tory Factor)在川普參與的選舉中更為顯著──2016 年川普 vs 希拉蕊的選舉中,已經發生過類似結果,部分選民可能因擔心社會壓力或批評,選擇提供符合社會期望的回答,或者不公開其真實意向,當支持的候選人不被看好或有爭議時,這種現象會尤其顯著。

由於川普針對女性和種族的爭議性言論,經常被媒體大肆報導、引發「炎上」,隱性選民因此更傾向在民調中隱瞞真實立場。此外,為了符合近年美國社會提倡的多元共融(DEI),部分選民可能聲稱支持如賀錦麗等候選人、但實際投票給川普,這類隱性選民效應或社會期望偏差,都可能對民調結果產生影響。

原因三:加權/分析模型偏差

以上提到的兩個問題,雖然大部分民調機構通常會依照當地人口組成、歷史投票數據進行加權分析,以讓數據更加平衡、具有代表性,但畢竟每間機構使用的數據和模型都不一樣,就可能造成分析失真。

尤其如果樣本數不足,或是選民的投票行為有很大變動時,單純按照以前的數據去做調整,就會離真正的現狀越來越遠。

原因四:誤差範圍

最後,當我們試圖用一部份人的表現來預測所有人的表現,也就是「抽樣預測」,就會存在統計誤差。當樣本數越多、越接近總投票人數時,誤差會較低。若是知道樣本數,我們就可以計算出正常的誤差範圍是多少。

研究顯示,約 1,000 人的典型選舉民調樣本的抽樣誤差約為「正負 3 到 4 個百分點」,有些研究更表明,實際誤差可能接近此範圍的兩倍。可惜的是,筆者尚未找到民調和媒體公開的樣本數,所以沒辦法確定全國和各州的偏差程度是否在標準範圍內。

搖擺州選情真的與民調「差很大」嗎?

姑且以上述的研究數據,來看 7 個搖擺州民調預測和實際結果的對比:小於 0 的表示賀錦麗領先、大於 0 的則表示川普領先的百分點,我們可以看到民調多數低估川普的支持度,但偏差多在 1-3 個百分點(僅亞利桑那州偏差接近 4 個百分點),平均約為 2.7 個百分點

看起來偏差程度不算高,但為什麼大家會覺得「差很多」呢?這是因為,民調預測雙方支持度接近(藍色點聚集在 0 附近),賀錦麗可能拿下 3 州、川普可能拿下 4 州,但只要略微低估某一方的支持度,藍色點就可能往左或往右移動。

以結果來說,民調低估川普的支持度,因為選舉人票「贏者全拿」的特性,就會感覺川普拿下 7 搖擺州的結果與預測差很大了。

搖擺州民調預測與實際結果對比,參考投票結果自行繪製圖表。圖/Judy Wu 製表

在全國範圍內,川普領先 2.5 個百分點,超出民調預測 3.5 個百分點,約在誤差臨界點。但在差距較大的紐約州(差 5 個百分點)、紐澤西州(差 12 個百分點)及愛荷華州,民調確實不夠準確。

總體來說,民調預測與實際結果一定存在誤差,但大多仍在統計的合理範圍內。由於不知道樣本數,在雙方差距小且民調誤差不大的情況下(如搖擺州),不論誰獲勝,都難以界定民調是否「失真」;而在差距大且民調誤差較大時(如紐約州和愛荷華州),民調機構可能需要調整抽樣方法與加權模型,才能更貼近選民的真實相貌。

是誤差還是真實的美國民意?

整體而言,儘管選前的民調預測,在一定程度上仍在合理誤差範圍內,但 2024 美國大選的結果,無疑再次引發了對民調準確性的討論。

川普的勝選是否真正反映了美國民眾的心聲?正如 1992 年美國總統柯林頓所言:「笨蛋,問題在經濟(It's the economy, stupid!)」,後疫情時期的通貨膨脹壓力下,美國民眾的生活面臨挑戰,許多選民希望透過選票表達對現狀的不滿、對改變的渴望,在這樣的背景下,選民的選擇不僅僅單純是對「候選人或黨派」的支持,更反映了對「未來」的期待。

《關於作者》

Judy Wu

後疫情時代來到美國完成碩士夢的行銷人,對人的行為和心理活動很有興趣,除了商管本系之外,也去雙主修了心理系,擁有行銷、業務和資料分析等多方面經驗,仍在持續探索自我和未來方向。喜愛在探索世界的旅程中,不斷尋找人生的 GPS 信號,目標是將足跡踏遍各大洲,體驗不同文化的衝擊和美食!

執行編輯:羅思涵
核稿編輯:孫雅為

關聯閱讀

作品推薦

你可能有興趣的文章

#廣編企劃|新北街舞大賽的魔力,就是能讓所有人都被這股精神感染!

歡迎回來《換日線》!
您可以使用此天下雜誌群帳號,盡情享受天下雜誌的會員專屬服務,詳細內容請參考此連結