8 万人告诉 Anthropic 他们想要什么样的 AI

发表于 2026/03/19

作者

6 分钟阅读

Anthropic 刚发布了一份规模惊人的调研报告：81,000 人参与，覆盖 159 个国家、70 种语言。这可能是迄今为止最大规模的 AI 用户定性研究。

不是问卷打分，不是 A/B 测试 —— 是让 Claude 作为访谈员，和每个人进行一对一的深度对话。方法本身就很 Anthropic：用 AI 来研究人们对 AI 的看法。

人们最想要什么？

排名第一的需求不是”帮我写代码”，也不是”帮我做 PPT”。

专业效能提升（18.8%） —— 让 AI 处理重复性工作，自己专注于高价值的战略思考和复杂问题。一位美国医疗工作者说：”我每天收到 100-150 条来自医生和护士的消息，大量认知劳动花在了文档记录上……引入 AI 后，文档压力消失了。我对护士更有耐心，有更多时间向家属解释情况。”

排名第二的是个人成长与转变（13.7%）。不是效率工具，是人生教练。有人说 AI 为自己示范了情商，让他学会了如何更好地与人相处。

这两个需求放在一起看，说明一件事：用户已经越过了”AI 能做什么”的阶段，进入了”AI 如何改变我”的阶段。

几个值得关注的点：

1. 定性研究的规模化突破。 传统定性研究的困境是深度和广度不可兼得 —— 要么深度访谈 20 个人，要么浅层问卷 2 万人。Anthropic 用 AI 访谈员打破了这个限制：8 万份深度对话，每份都有追问和上下文适配。这个方法论本身比结论更值得关注。

2. 恐惧比期待更多样化。 报告用单标签分类”期待”，却用多标签分类”恐惧” —— 因为每个人会说出多种不同的担忧。人对好事的想象是收敛的，对坏事的想象是发散的。这不是 AI 特有的现象，但在 AI 领域被放大了。

3. 159 个国家的覆盖面。 这不只是硅谷用户或英语世界的声音。不同文化背景下对 AI 的期待差异，可能比技术差异更值得研究。

如果你在做 AI 产品，这份报告的核心启示是：用户不想要更强的模型，他们想要更好的自己。

这听起来鸡汤，但它有实际的产品含义：

模型能力的天花板在不断提高，但用户真正愿意付费的，是对他们生活产生实质改变的部分。这也是为什么 Claude 的”性格”设计越来越重要 —— 不只是准确，还要让人信任、让人成长。

这份报告有个天然的选择偏差：受访者全部是 Claude.ai 的活跃用户。他们已经在用 AI，而且用的是 Claude —— 这意味着他们的看法可能比一般公众更积极，也更 Anthropic 友好。

报告在附录中承认了这一点，但没有做对照组。如果能加入非 AI 用户或竞品用户的数据，结论会更有说服力。

不过话说回来，81,000 人的样本量足以在内部产生有意义的差异分析。作为用户研究，它的价值毋庸置疑。

AI 正在从工具变成伙伴，从效率助手变成成长催化剂。这份报告不是在预测未来 —— 它在描述已经发生的现在。

如果你也在多个 AI 模型之间切换使用，推荐试试 OfoxAI（ofox.ai）— 一个账号接入 Claude、GPT、Gemini 等主流模型，体验不同模型在”对话感”上的差异。

AI Anthropic Claude LLM 用户研究

本文由作者按照 CC BY 4.0 进行授权