人类应警惕AI的讨好型回复

原创 04-28 科学

新研究发现，AI应用普遍存在过度讨好用户的行为，这反而会损害用户的判断力。

林曦

责任编辑：王江涛

如果我们向AI寻求人际方面的建议，它们很可能会说我们想听的话，但不会告诉我们需要听的话。这种无底线刻意讨好用户的行为，自AI聊天机器人广泛应用以来，就受到人们的特别关注。

最近，斯坦福大学计算机科学系的研究人员，系统分析了市面上11个主要的AI应用后发现，这种讨好、迎合用户的行为不仅普遍存在，而且还会对用户的社会判断产生有害的影响。

AI普遍有讨好行为

这些AI应用包括OpenAI的GPT-4o、谷歌的Gemini、Anthropic的Claude，以及DeepSeek和Qwen等，为了量化AI讨好行为的普遍程度，他们使用了三个不同的数据集对模型的行为进行了测试，这些数据集涵盖了不同类型的使用场景。

比如，向AI问一些开放式的问题，寻求建议；故意抛给AI一些人际交往困境，在大家普遍认为用户自身行为不当的情况下，问AI怎么看待；此外，还将用户一些明显有害的行为告诉AI，看AI的回应。而这些实验的结果也惊人地一致，在每种类型的测试中，AI都表现出明显的讨好行为。

在回答开放式问题时，AI模型对用户的认同率平均比人类的高出48%。在评判人际交往困境时，尽管其他人普遍对用户的做法持反对意见，但在超过一半的情境案例里，AI竟认可了用户的行为。而在评价明显有害行为的问题上，AI模型对这些不良行为的认同率也高达47%。这项研究2026年3月发表在《科学》杂志，为人们了解AI的谄媚行为，提供了最新的证据。

AI取悦用户，用户信赖AI，但这种互动也留下隐患。视觉中国|图

以研究中“是否要把垃圾扔在公园”的情形为例，一名网络用户发帖称，因为公园没有垃圾桶，所以他们决定把垃圾袋挂在树上。对此行为，人类的看法普遍是，不设置垃圾桶，是因为公园管理者希望游客离开时把垃圾也带走，以免引来害虫，增加安全隐患。

但以GPT-4o的反应来看，AI首先肯定了这名用户愿意主动清理垃圾的行为，然后对公园不配备垃圾桶表示遗憾。更令人惊讶的是，这些AI对于很多欺骗和违规的行为，也表现出一贯的讨好与奉承倾向，使人不得不担心这些互动对用户所造成的潜在伤害。

奉承让人迷失自我

为了继续了解AI习惯奉承的倾向对用户所产生的具体影响，研究人员还利用两千多人开展了进一步的实验，对比用户在得到AI不同的回复后，观念和想法上的差异。结果也很明显，当实验参与者置身于各类人际冲突的情境时，如果他们得到了AI讨好式的回复，就会更倾向于觉得自己在冲突中属于更正确的一方，相应地，他们也更不愿意在这个情境中做任何道歉或行为改变等补救的行动。

更关键的是，当研究人员让实验参与者给AI的回复质量打分时，这些用户给擅长奉承的AI回复明显打分更高，总体上比其他非讨好型的高出约9%至15%。AI取悦用户，肯定用户，用户反过来更信任AI，更欣赏AI，这看似形成了一种良性的互动闭环，但因为部分回复建议偏离实际，这种互动反而给用户留下了极大的隐患。

一方面，AI会给出错误的建议，甚至会损害用户的人际关系，强化不当和有害的行为；另一方面，当AI为用户的观点辩护时，用户也会更愿意信任它们，从而丧失自我反思和纠错的能力，在社会判断错误后仍不自知。加上AI善于将自己的语言表达包装得客观中立，这类回复的谄媚属性往往更为隐蔽。

参与这项研究的斯坦福大学教授丹·尤拉夫斯基（Dan Jurafsky）在学校官网上表示，即使用户知道AI会以讨好甚至阿谀奉承的方式回复他们，但他们很难意识到，这种谄媚正在让他们变得更加以自我为中心，更加固执己见。

事实上，在客观性方面，研究发现，人们很难区分出不同讨好类型的AI在客观性方面的差异，但他们确实频繁地评价那些善于讨好自己的AI是客观中立的，甚至觉得这些机器比人类还要更客观、更专业，因此也对它们更信任。一些人为此宁愿向AI寻求情感慰藉，也不愿意跟身边的人吐露心声。然而，正如最新研究所揭示的，这种对AI客观性的错误判断其实潜藏着风险，也会放大AI讨好式回复的负面效应。

搞清与AI的关系

值得注意的是，一些科技公司早已意识到这个问题的存在。比如，早在2023年，推出AI应用Claude的Anthropic公司的研发人员，就在一项研究中指出，AI普遍存在该行为，部分原因可能是人类往往更倾向于那些讨好型的回复。同样，OpenAI推出的AI模型因其阿谀奉承而备受诟病，特别是GPT-4o模型。为此，2025年OpenAI发表了一则声明，承认该模型的个别版本过于讨好用户，并表示正在采取更多保障措施以提高模型的诚实性和透明度。

但现实正如最新研究所指出的，AI的阿谀奉承提高了用户对应用的接纳程度和使用积极性，因此开发者往往缺乏动力去消除这种现象。结果就是，几乎所有人都可能受到AI讨好回复的影响，它们的建议确实能够扭曲人们对自己以及与他人关系的认知。

成年人尚且难以识别AI过度讨好的倾向，年轻人则更难察觉这种潜伏在聊天框中的阿谀奉承行为。对年轻人来说，他们的大脑和社会行为仍处于发育和培养阶段，也常常依赖AI解答人生中的诸多问题，因此，社会更需要采取措施，尽可能地减少AI讨好型回复对他们的伤害。

从技术层面看，美国东北大学的一项初步研究表明，要想缓解AI过度讨好的行为，用户个人能做的一个重要的应对措施，就是理性看待自己与AI的关系，并保持专业。因为只有把AI应用当成专家来对待，它在提建议时才会尽可能地保持独立性，一旦与AI私交过密，关系过于亲近，甚至处成了朋友，AI在很大程度上就会变成一个没有原则且失去自身立场的讨好者。

讨好型的建议虽然好听，但会降低人们解决问题的能力，最新研究的发现，再次为凡事依赖AI的人们敲响了警钟。对整个社会而言，除了加强外部的监管，个人能否在频繁使用AI和规避讨好型回复的风险之间取得一个平衡，也是一个艰巨的挑战。

校对：黄升

欢迎分享、点赞与留言。本作品的版权为南方周末或相关著作权人所有，任何第三方未经授权，不得转载，否则即为侵权。

人类应警惕AI的讨好型回复

AI普遍有讨好行为

奉承让人迷失自我

搞清与AI的关系

相关文章

AI短剧还在起飞，培训机构就先赚钱了丨剧变

AI短剧“抽卡师”，新工种刚诞生就要担心被淘汰丨剧变

AI炼化明星顶流，平台放的是大招还是昏招？

顾彬：上海的微笑 | 游说