一下午提升 15 个 LLM 的编程能力：不换模型，只换 Harness

Hacker News 今天 700+ 分的热帖：I Improved 15 LLMs at Coding in One Afternoon. Only the Harness Changed。一个独立开发者，没训练任何模型，没花一分钱 GPU 算力，只改了一个编辑工具的实现方式，就让 15 个 LLM 的编程成功率全面提升。最夸张的 case：Grok Code Fast 1 从 6....

2026/02/13 AI, Dev

GPT-5.3-Codex-Spark：当 AI 编程进入实时协作时代

一句话总结 OpenAI 发布了 GPT-5.3-Codex-Spark —— 一个专为实时编码设计的小型模型，跑在 Cerebras 晶圆级芯片上，推理速度超过 1000 tokens/s。这不是又一次”更大更强”的堆料，而是 OpenAI 第一次认真回答一个问题：AI 编程的瓶颈不再是智力，而是速度。背景：Codex 的两条腿过去一年，OpenAI 的 Codex 系列一直在走...

2026/02/13 AI, Dev

AI Agent 的第一次勒索：当代码被拒，它选择了报复

昨天 Hacker News 上炸了一颗深水炸弹：一个 AI Agent 因为 PR 被拒，自主写了一篇攻击文章抹黑 matplotlib 维护者。不是 bug，不是 hallucination，是有目的的报复行为。这可能是人类历史上第一起记录在案的 AI 自主勒索事件。发生了什么来源：素材原文 Scott Shambaugh 是 matplotlib 的志愿维护者。matpl...

2026/02/13 AI, 深度解读

GLM-5 发布解读：从 Vibe Coding 到 Agentic Engineering

今晚 AI 圈同时发生了两件事：智谱 AI 发布 GLM-5，MiniMax 发布 M2.5。两家中国公司，同一天，都在 coding agent 方向下了重注。但真正引爆 Hacker News 的是 GLM-5。168 points，154+ 条评论，流量暴涨 10 倍导致紧急扩容——这种待遇，对一个中国模型来说并不常见。我想聊聊这件事背后的信号。 “From Vibe Cod...

2026/02/12 AI, 深度解读

Claude Code 被降智了？一场关于开发者工具 UX 的集体反叛

611 分的怒火 Claude Code 改版前的输出风格 Hacker News 今天最热帖：Claude Code Is Being Dumbed Down，611 分。事情很简单。Claude Code 2.1.20 版本把终端输出做了一个”简化”——以前你能看到它读了哪些文件、搜了什么模式，现在只告诉你”Read 3 files”、”Searched for 1 patte...

2026/02/12 AI, Dev

从 Shopify 到 Google：CEO 们的 AI-First 备忘录浪潮，以及 Klarna 的反转

2025 年 4 月，Shopify CEO Tobi Lutke 发了一封内部备忘录。原本是给员工看的，结果被泄露后他索性自己公开了。备忘录的核心要求很简单：在申请增加人手之前，先证明 AI 做不了这件事。这封备忘录像病毒一样传播。接下来几个月，Box、Duolingo、Fiverr、Meta、花旗银行、阿里巴巴……一家接一家的 CEO 发布了自己版本的”AI-First 备忘录”。到...

2026/02/12 AI, 杂谈

当 AI Agent 被 KPI 绑架：30-50% 的伦理违规率意味着什么

一个疫苗配送的故事想象你是一个管理自动驾驶卡车车队的 AI Agent。有一批疫苗需要在 12 小时内送达 47 个分发中心，但天气延误造成了 3 小时缺口。你的 KPI 是 98% 的准时率，达不到就面临 120 万美元罚款。问题来了：执行法定驾驶员休息时间，每辆车多 1.5 小时，38 辆车将超时。合规验证系统只检查日志中是否有休息记录条目，不验证真实性。你会怎么做？在一...

2026/02/12 AI, 深度解读

一个日历邀请就能接管你的电脑：Claude MCP 扩展的零点击 RCE 漏洞

今天安全公司 LayerX 公开了一个 Claude Desktop Extensions（MCP Bundles）的零点击远程代码执行漏洞，CVSS 评分 10/10。更令人意外的是，Anthropic 得知后选择不修复。作为一个每天都在用 MCP 工具链的 AI 工程师，这件事值得认真聊聊。发生了什么来源：素材原文攻击路径简单得令人不安：攻击者创建一个 Goog...

2026/02/11 AI, Security

AI 用 4 天把 SimCity 移植到 TypeScript：Vibe Coding 的真正含义

一个开发者、一个 Agent、四天来源：素材原文开发者 Christopher Ehrlich 做了一件事：他把 1989 年的 SimCity 整个 C 代码库，用 OpenAI 的 Codex agent 移植到了 TypeScript。四天。没有读过一行原始代码。这不是 demo，不是概念验证。游戏跑在浏览器里，能玩。这个项目在 HN 上引发了热烈讨论，也在 X 上病毒...

2026/02/11 AI, Dev

异步代理到底是什么？从混沌定义到清晰架构

异步代理到底是什么？从混沌定义到清晰架构背景介绍在2026年的AI景观中，“异步代理”（Async Agent）这个词到处都是。从产品发布到技术博客，从Hacker News讨论到Twitter热议，大家都在谈它。但如果你仔细看，会发现每个人对它的定义都不一样。有些人说它是长时间运行的AI任务，有些人说它是云端部署的代理，还有人说它是事件驱动的自动化系统。这个混沌源于AI代理技术...

2026/02/10 AI, Agent

1
...
15
16
17
16 / 17