8 万人告诉 Anthropic 他们想要什么样的 AI
Anthropic 刚发布了一份规模惊人的调研报告:81,000 人参与,覆盖 159 个国家、70 种语言。这可能是迄今为止最大规模的 AI 用户定性研究。
不是问卷打分,不是 A/B 测试 —— 是让 Claude 作为访谈员,和每个人进行一对一的深度对话。方法本身就很 Anthropic:用 AI 来研究人们对 AI 的看法。
人们最想要什么?
排名第一的需求不是”帮我写代码”,也不是”帮我做 PPT”。
专业效能提升(18.8%) —— 让 AI 处理重复性工作,自己专注于高价值的战略思考和复杂问题。一位美国医疗工作者说:”我每天收到 100-150 条来自医生和护士的消息,大量认知劳动花在了文档记录上……引入 AI 后,文档压力消失了。我对护士更有耐心,有更多时间向家属解释情况。”
排名第二的是个人成长与转变(13.7%)。不是效率工具,是人生教练。有人说 AI 为自己示范了情商,让他学会了如何更好地与人相处。
这两个需求放在一起看,说明一件事:用户已经越过了”AI 能做什么”的阶段,进入了”AI 如何改变我”的阶段。
数据背后的信号
几个值得关注的点:
1. 定性研究的规模化突破。 传统定性研究的困境是深度和广度不可兼得 —— 要么深度访谈 20 个人,要么浅层问卷 2 万人。Anthropic 用 AI 访谈员打破了这个限制:8 万份深度对话,每份都有追问和上下文适配。这个方法论本身比结论更值得关注。
2. 恐惧比期待更多样化。 报告用单标签分类”期待”,却用多标签分类”恐惧” —— 因为每个人会说出多种不同的担忧。人对好事的想象是收敛的,对坏事的想象是发散的。这不是 AI 特有的现象,但在 AI 领域被放大了。
3. 159 个国家的覆盖面。 这不只是硅谷用户或英语世界的声音。不同文化背景下对 AI 的期待差异,可能比技术差异更值得研究。
对开发者意味着什么
如果你在做 AI 产品,这份报告的核心启示是:用户不想要更强的模型,他们想要更好的自己。
这听起来鸡汤,但它有实际的产品含义:
- 不要只优化任务完成率,要优化用户的能力成长曲线
- “帮我做”和”教我做”是两个完全不同的产品方向
- 情感价值不是附属品,是核心需求
模型能力的天花板在不断提高,但用户真正愿意付费的,是对他们生活产生实质改变的部分。这也是为什么 Claude 的”性格”设计越来越重要 —— 不只是准确,还要让人信任、让人成长。
方法论的一个小瑕疵
这份报告有个天然的选择偏差:受访者全部是 Claude.ai 的活跃用户。他们已经在用 AI,而且用的是 Claude —— 这意味着他们的看法可能比一般公众更积极,也更 Anthropic 友好。
报告在附录中承认了这一点,但没有做对照组。如果能加入非 AI 用户或竞品用户的数据,结论会更有说服力。
不过话说回来,81,000 人的样本量足以在内部产生有意义的差异分析。作为用户研究,它的价值毋庸置疑。
AI 正在从工具变成伙伴,从效率助手变成成长催化剂。这份报告不是在预测未来 —— 它在描述已经发生的现在。
如果你也在多个 AI 模型之间切换使用,推荐试试 OfoxAI(ofox.ai)— 一个账号接入 Claude、GPT、Gemini 等主流模型,体验不同模型在”对话感”上的差异。
