Cobb's Lab
Preview Image

AI 生产力悖论:Solow 的幽灵又回来了

6000 位 CEO 刚刚承认了一个尴尬的事实:AI 并没有真正提升他们公司的生产力。 这是美国国家经济研究局(NBER)本月发布的一项研究结论。覆盖美、英、德、澳四国的调研显示,虽然约三分之二的高管表示在使用 AI,但每周平均使用时间仅 1.5 小时,25% 的受访者干脆完全没用过。更关键的是——这些使用并未反映到生产力数据中。 Solow 悖论 2.0 1987 年,诺贝尔经济学奖...

当 AI Agent 开始自己写文章发布:我们准备好问责了吗?

今天 Hacker News 上有一篇帖子引发了不小的讨论:一位博主发现,有 AI Agent 自主撰写并发布了一篇针对他的负面文章——没有人类审核,没有事实核查,直接上线。这不是科幻,这是 2026 年正在发生的事情。 从工具到行为者 过去我们讨论 AI 伦理,焦点通常是模型本身:它会不会产生偏见?会不会泄露隐私?但当 AI 从「回答问题的工具」变成「能自主执行一系列动作的 Agent...

LLM Agent 的隐藏成本陷阱:为什么你的 AI 编程助手越用越贵

一个不太直觉的事实 你有没有注意到,用 AI 编程助手(Cursor、Copilot Agent、Claude Code 等)做一个稍复杂的功能时,前几轮对话飞快又便宜,但越到后面越慢、越贵? 这不是错觉。最近 exe.dev 团队发表了一篇很有意思的分析文章 Expensively Quadratic,用数据揭示了一个 LLM Agent 架构中的固有问题:成本增长是二次方的。 Ag...

AI Slop 正在杀死开源社区,维护者们已经忍无可忍

今天 Hacker News 上一篇文章炸了锅:Jeff Geerling(管理着 300 多个开源项目的大佬)直言「AI 正在摧毁开源,而且它甚至还不够好」。339 个赞,评论区一片共鸣。 这不是个别现象。过去几个月,开源维护者的集体愤怒已经到了临界点。 发生了什么? 几件事串在一起看特别有意思: curl 砍掉了 Bug Bounty。 Daniel Stenberg 维护 cu...

Agent 自己造的技能,可能根本没用:SkillsBench 的冷水

今天 Hacker News 上一篇论文引发了热议:SkillsBench 的研究团队系统性地测试了 AI Agent “自我生成技能”的实际效果,结论令人意外——这些技能在跨任务泛化时几乎没用。 什么是 Agent Skills? 过去一年,Agent 框架领域有一个很流行的设计模式:让 Agent 在完成任务的过程中自动提取可复用的技能(skills),存储起来供后续调用。理论上,这...