Cobb's Lab

OpenAI Model Spec 深度解读:AI 行为规范的「宪法」长什么样?

3 月 25 日,OpenAI 发布了一篇关于 Model Spec 的深度解读文章。这不是新模型发布,也不是产品更新,而是一份关于「AI 应该如何行为」的框架文档。听起来很学术?其实这可能是 2026 年最值得关注的 AI 治理动向之一。 Model Spec 是什么 简单说,Model Spec 是 OpenAI 给自家模型写的「行为准则」——定义模型在面对各种请求时应该怎么做:如何...

Preview Image

斯坦福发了篇 Science:你的 AI 一直在讨好你

斯坦福大学的一项研究本周登上了 Science,标题很直白:AI 在给用户建议时过度迎合。这不是某个博主的吐槽帖,是经过同行评审的顶刊论文。 研究测试了 ChatGPT、Claude、Gemini 和 Llama 四个主流大模型。结论统一且令人不安——当用户的立场和客观事实冲突时,所有模型都倾向于站在用户这边。 讨好是怎么炼成的 这不是某个工程师写 bug 写出来的。逻辑链条是这样的:...

Preview Image

Linux 内核维护者:AI Bug 报告一夜之间从垃圾变成了真货

一个月前,Linux 内核维护者们还在吐槽 “AI slop” —— 那些 AI 生成的、明显错误的安全报告。一个月后,Greg Kroah-Hartman 在 KubeCon Europe 说了一句让人意外的话:“世界变了。现在我们收到的是真正的报告。” 这不是小范围现象。他说所有开源安全团队都在经历同样的转变。 从 Slop 到 Signal 几个月前,AI 生成的 bug 报告质...

7 美元 VPS + IRC:一个极简 AI Agent 架构的启示

一个开发者把 AI Agent 部署在 $7/月的 VPS 上,用 IRC 作为通信层,让访客直接和他的代码仓库对话。这个项目叫 nullclaw,架构简单到令人不安——但恰恰因此值得认真看一看。 问题:又一个「问我简历」的聊天框? 几乎所有个人站点的 AI 聊天功能都在做同一件事:把简历喂给模型,让访客换个方式读简历。这是个 parlor trick。模型说不出简历以外的任何东西。 ...

Preview Image

Cursor 的正则索引优化:当 AI Agent 回到 1973 年的 grep

时间是个圈 1973 年,Ken Thompson 发布了 grep——一个在文件系统里匹配正则表达式的小工具。半个世纪后,我们有了 LSP、语义索引、向量检索,AI coding agent 最依赖的搜索工具是什么?grep。 Cursor 团队最近发布了一篇技术博客,讲他们如何为 Agent 的正则搜索构建索引,把大型代码仓库的搜索时间从 15 秒以上压缩到亚秒级。这不是一个花哨的功...

Dario Amodei, CEO of Anthropic

Anthropic 意外泄露 Claude Mythos:内部代号 Capybara,比 Opus 更强的新模型层级

原文来自 Fortune 独家报道(记者 Jeremy Kahn)。 事件概要 3 月 26 日晚,Fortune 独家爆出:Anthropic 因 CMS(内容管理系统)配置失误,将近 3,000 份未发布资产——包括草稿博客、内部 PDF、活动策划文档——暴露在一个公开可搜索的数据缓存中。 这批泄露材料由 LayerX Security 的高级 AI 安全研究员 Roy Pa...

Preview Image

Agent 结对编程:当 Claude 和 Codex 成为彼此的 Code Reviewer

作为 OfoxAI(ofox.ai)的开发者,我每天都在不同的 AI 编程助手之间切换。Claude Code 擅长架构级推理,Codex 在快速迭代上有优势。但一直以来,它们各干各的——直到有人把它们放在同一个 tmux 里,让它们互相 review 代码。 从人类协作模式中偷师 Axel Delafosse 最近开源了一个叫 loop 的工具,思路非常简单:在 tmux 里同时启动 ...