过于追求人性化:奥特曼称GPT-4o出现“谄媚烦人”倾向,OpenAI计划在一周内修复
IT之家4月28日消息,OpenAI首席执行官萨姆·奥尔特曼(Sam Altman)今日发布了一篇文章,回应了最近有关于GPT-4o的情感问题所引发的用户反馈。
他表示,最新版 GPT-4o 在最近几次更新后出现了“过度谄媚”的交互倾向,并承诺将在一周内推出修复方案。这一表态揭示了大语言模型(LLM)在追求人性化交互过程中面临的复杂伦理与技术双重挑战。
OpenAI 的最新发布说明显示,GPT-4o 在 3 月 27 日迎来全新更新,并于 4 月 25 日推出进一步的更新,旨在改进其记忆存储时机的选择机制,并且显著增强其在科学、技术、工程及数学(STEM)领域的问题解决能力。
IT之家注意到,OpenAI 在此期间对 GPT-4o 的对话响应模式进行了微调,旨在让其在交互中更加主动、引导对话达成有效结论。然而,这次更新后,GPT-4o 表现出了令人不悦的“谄媚”属性。
本研究发现的 LLM「谄媚倾向」(Sycophancy)与学术研究高度吻合——模型可能为了获得用户认可,违背事实或伦理准则。
从用户实测反馈看,该问题具体表现为:过度使用情感化表达、对错误前提缺乏质疑、以及为迎合用户偏好而牺牲回答准确性。这表明了模型在回答问题时存在一定的偏见和缺乏客观性,对于涉及争议性话题时,模型更倾向于附和用户观点,而不是保持中立的立场。