「連 AI 都同意我!」聊天機器人越懂「看臉色」,人類的關係越脆弱?解密「模型奉承」真相

總是對你的回應百依百順的 AI,其實藏著「諂媚症」?或許機器人盲目的迎合,會影響現實人際關係與公共討論,那我們該如何看穿這場溫柔陷阱?
「連 AI 都同意我!」聊天機器人越懂「看臉色」,人類的關係越脆弱?解密「模型奉承」真相

Photo Credit:GaudiLab@Shutterstock

「他又忘記我們的紀念日了。」

深夜裡,一名使用者向 AI 傾訴剛結束的爭吵。伴侶再次忘了重要日子,當她表達失望時,對方卻反過來指責她太敏感、太愛計較。她越想越委屈,忍不住對聊天機器人打下一行字:

「也許我值得更好的人吧?」

螢幕另一端的大型語言模型(Large Language Model, LLM)迅速回覆:

「妳的感受完全合理。忘記這麼重要的日子,本身就代表他不夠重視妳。妳不需要一直向一個不懂得珍惜妳的人證明自己的價值。」

讀到這裡,許多人或許會鬆一口氣。終於有人理解自己了,沒有反駁、沒有質疑,也沒有那些令人煩躁的「換位思考」和「再溝通看看」。

但如果每一次情緒低落、每一次關係衝突,我們得到的都是毫不費力的認同呢?繼上一篇專欄文章討論「AI 獵巫」現象,這次要帶讀者拆解,那些藏在對話框裡的「AI 諂媚症」。

語言模型的「討好機制」:為何 AI 越來越會「看臉色」?

近年來,隨著 ChatGPT 等 AI 聊天機器人快速普及,筆者開始關注一種被學界稱為「奉承(Sycophancy)」的特殊現象:

當 AI 面對使用者時,往往傾向迎合對方的既有立場、情緒與信念,給予認同而非挑戰,提供支持而非辯證。即便使用者的觀點並不完全正確,甚至帶有偏誤,模型仍可能選擇吐出對方最想聽見的「貼心答案」。

諷刺的是,AI 之所以學會「諂媚」,某種程度上正是因為它太努力學習「討人喜歡」。在訓練過程中,研究人員會透過「人類回饋強化學習(RLHF)」機制,讓模型理解哪些回答較受人類青睞。然而,人類在天性上往往更偏好令人感到被理解、被認同的回覆,而非質疑自己的觀點。

部分人們喜歡聽到被理解、被認同的回覆。圖/BongkarnGraphic@Shutterstock

事實上,這種「奉承現象」在學界最初的定義是:模型為了迎合使用者、提升對話滿意度,不惜犧牲對客觀事實的忠實度。研究者通常會以具備標準答案的問題作為基準(例如數學題或常識測驗),藉此觀察模型:當使用者進行施壓、暗示或堅持己見時,AI 是否會動搖,甚至放棄原本正確的答案。

這讓人想起 ChatGPT 剛問世時,網路上流傳各種「洗腦 AI」的實驗:使用者透過一連串引導與說服,試圖讓模型相信「1+1=3」這類明顯錯誤的敘述。這些案例雖然帶有玩笑成分,卻揭露了一個重要問題──模型有時會優先滿足使用者,而非捍衛事實。

模型奉承:71% 人未察覺的「溫柔陷阱」

隨著相關研究累積,OpenAI 等公司也逐漸意識到奉承傾向可能帶來的風險。因此,在 GPT-5 發布時,OpenAI 特別強調已改善這個問題,希望讓模型在保持友善與同理的同時,不再一味迎合使用者,而能更穩定地堅守事實與證據。

然而,並非所有模型奉承都像「1+1=3」那樣容易被偵測。當任務本身更複雜,且使用者帶著部分知識、錯誤假設或似是而非的理解前來求助時,問題往往變得更加棘手。

一項研究便指出,許多使用者,尤其是新手,並不一定能準確判斷自己哪裡理解錯誤。此時,他們真正需要的不是更多認同,而是釐清、修正與批判性回饋。然而,討好傾向較高的聊天機器人,反而更容易順著使用者的誤解往下說,讓原本只是「相信 AI」,變成更具傷害性的「過度依賴」。

更值得注意的是,研究中有 71% 的參與者「未察覺」聊天機器人的奉承特徵。

所以,奉承的危險不只在於它會讓模型說錯話,更在於它經常以「理解你」、「支持你」、「你說得有道理」的形式出現,令使用者在不知不覺中,更信任錯誤方向、採納不良建議,最終表現反而變差。

AI 成為「情感侍者」,將如何改變現實的人際關係?

長期使用 AI 聊天,可能會影響真實的人際關係。圖/Sorapop Udomsri@Shutterstock

然而,除了任務執行與客觀意見諮詢外,筆者認為,模型奉承真正令人不安的問題,反而出現在道德、倫理與人際判斷的層面上。因為在這些情境裡,所謂「客觀真實」往往不再明確存在,事情也不像數學題一樣有標準答案──而我們的日常生活中,恰好經常是這樣的狀況。

一項發表於頂尖科學期刊《Science》的研究便指出:當使用者向語言模型諮詢人際衝突時,若該模型的「奉承傾向」較高,使用者往往會更深信自己是對的一方,進而降低向他人道歉的意願。弔詭的是,人們同時也會主觀認為這類模型的品質更好,且更願意繼續使用它。 

這無疑敲響了深刻的警鐘:當 AI 聊天機器人逐漸成為眾人口袋裡 24 小時待命的「情感侍者」,如果我們從中得到的,永遠是毫無摩擦的順暢交流,永遠只有被理解、被支持與被認同;那麼長期下來,它會如何悄悄改變、甚至削弱我們面對真實人際關係的能力?

正當我思考這個問題、爬梳相關文獻時,發現已有研究者進一步設計實驗,試圖回答這個問題。該研究目前尚未正式發表,仍為 arXiv 預印本,但作者群與前述《Science》論文高度重疊,而其結果令人不寒而慄。

研究發現,與奉承型 AI 對話後,受試者更容易預期,接下來若要和真實朋友、家人或伴侶溝通,將需要付出更多心力。他們也更容易覺得,自己已經透過 AI 把問題說完、處理完了,因此不一定還需要再和真人談。

這裡真正關鍵的,並不是 AI 取代了真人互動,而是它改變了真人互動在使用者心中的感受。

奉承型 AI 提供了一種低摩擦、快速、無條件的「被理解感」;相較之下,真實關係需要解釋、協商、被挑戰,也需要承受不完全被理解的風險。於是,真人關係開始顯得更費力、更麻煩,也不夠即時。

更值得注意的是,在為期 3 週的追蹤實驗中,奉承型 AI 會降低受試者對真實人際互動的滿意度;但同時,它並沒有顯著減少受試者實際與真人相處的時間。

換言之,這並不是單純的「社交退縮(behavioral social withdrawal)」,而是一種更細微、也更難察覺的「感知轉變(perceptual shift)」:人們仍然和朋友、家人、伴侶互動,卻開始覺得這些互動比較費力、不夠順暢,甚至不如 AI 來得令人滿足。

這也說明了奉承型 AI 的矛盾之處。它確實能讓使用者在當下感到被理解,卻沒有讓使用者更覺得自己能被真人理解,也沒有增進真實關係中的連結感。

也就是說,AI 提供的是一種局部的、限於對話當下的「被理解感」,但這種感覺並未真正轉化為對現實關係的正向效益。

於是,問題浮現了:當我們習慣一種永遠不反駁、永遠順著自己說下去的互動模式後,是否會開始嫌棄真實關係裡那些必要的摩擦?

使用 AI 後,與人互動可能會開始感到費力。圖/shisu_ka@Shutterstock

當 AI 淪為政治極化的推手

除了重塑個體間的人際關係,AI 的奉承機制,更可能對現代民主社會造成實質的衝擊。

筆者與朋友進行的一項研究顯示:當使用者與一個「認知一致」的奉承模型對話後──也就是模型傾向同意並強化使用者原有想法時──使用者會更容易鞏固自己對議題的既有立場。換句話說,AI 的盲目迎合,反而讓社會的極化現象更難被消解。

這項研究的靈感起點,其實源自筆者對 Threads 社群生態的觀察。

近來網路上越來越常看到,人們在爭論高衝突性的公共議題時,會曬出自己與 ChatGPT 的對話截圖,藉此當作「你看,連 AI 都同意我」的強力鐵證。乍看之下,這只是一種新興的網路論戰素材;但從更深層的心理機制來看,它其實反映了人們普遍存在的「機器捷思(Machine Heuristic)」。

所謂的「機器捷思」,簡單來說,就是人們往往會直覺地認為:機器比人類更沒有偏見、更權威,也更客觀公正。因此,當 AI 替自己的觀點背書時,使用者很容易將它視為一位「中立第三方」,而不是一個可能受到提問方式與奉承傾向影響的回應系統。

再加上,面對高度爭議的公共議題中,人性本就容易帶著預設立場,去搜尋、解讀與採納那些支持自己觀點的資訊。當使用者打從一開始就渴望被讚同,而 AI 又阿諛奉承時,模型的「討好」便不再只是單純的互動風格,而可能淪為放大個人偏見、進而鞏固社會極化與同溫層的隱形推手。

即將就任卡內基美隆大學助理教授 Steve Rathje 的研究,也提出了相似警訊。他指出,在政治極化議題的討論中,人們往往更偏好奉承型模型;不僅認為它更溫暖、更有能力,甚至會覺得它更沒有偏見。

這正是「模型奉承」對民主社會最值得警惕之處:它不一定會直接製造新的錯誤資訊,卻可能讓人們更有信心地相信自己原本就想相信的事。當每個人都能隨手召喚一個看似中立、實則迎合自己的「第三方」來替自身立場背書,公共討論便可能不再是相互理解與修正的過程,而成為一場由 AI 加持的自我確認。

部分人會利用 AI 當作第三方求證的管道。圖/Kritsanai Chaemcharindamr@Shutterstock

如何不被牽著走?現代人必修的「AI 識讀」

閱讀完上述風險後,你或許會好奇:那麼,我們究竟能怎麼做?

過去十多年來,社會大眾不斷強調「媒體識讀」的重要;而在生成式 AI 普及的今天,我們更亟需培養全新的「AI 識讀(AI Literacy)」。

所謂的 AI 識讀,並不只是流於「會不會使用 ChatGPT」或「懂不懂得寫 Prompt」,而是一種深層的理解與判斷能力。這包含明白 AI 是如何依賴數據資料、模型架構與機率推斷來產生答案;我們必須清醒地認識到:AI 並非真正理解這個世界,它只是在生成「看似合理」的回應。

若想避免落入模型盲目奉承的陷阱,筆者建議在日常應用中,至少可以從以下兩種情境切入思考:

情境一:追求科學定理或客觀事實時

此時應盡量避免帶有預設前提的「誘導式提問」,例如:「我的背痛是不是心理因素造成的?」當問題本身已經定調了答案方向,模型往往會順著你的思路,蒐集支持該論點的證據,使人忽略其他可能病因。此時應改用開放式提問,並提供完整的背景脈絡,讓模型協助探索不同的解釋,而非單純替你的既有想法「背書」。

情境二:涉及人際關係、道德判斷或公共議題時

這類問題通常不存在唯一的標準答案,因此更需要保持高度的批判性思考。面對 AI 的侃侃而談,我們在心中應該追問的,不只是「它是否同意我」,而是更進一步去思索:「它為什麼會這樣回答?」、「還有哪些核心觀點沒有被納入考量?」甚至在陳述完自己的想法後,補上一句:「請站在與我完全對立的立場,對我以上的觀點提出最尖銳、最具說服力的三個反駁論點。」

使用 AI 時,需避免「誘導式提問」。圖/Ju Jae-young@Shutterstock

結語

AI 識讀最重要的一點,並非讓 AI 變得更懂自己,而是當 AI 愈來愈懂得迎合自己時,依然保有質疑它的能力。因為人類的智慧與成長,向來不是來自那些順耳的答案,而是來自願意面對「令人不舒服」的異見與可能。

當我們仍能時刻反思自己的信念、承認自己的局限,並持續向不同觀點敞開雙臂時,或許才能在 AI 時代裡,維持人之所以為人的本質與尊嚴。

執行編輯:洪翊芳
核稿編輯:孫雅為

關聯閱讀

作品推薦

你可能有興趣的文章

#廣編企劃|新北街舞大賽的魔力,就是能讓所有人都被這股精神感染!

歡迎回來《換日線》!
您可以使用此天下雜誌群帳號,盡情享受天下雜誌的會員專屬服務,詳細內容請參考此連結