AI 228
- GPT-5.5 Instant 实测:幻觉减少 52.5%,AI 终于更靠谱了
- OpenAI 内部揭秘:他们如何安全地运行 Codex
- OpenAI 发布 GPT-Realtime-2:语音 AI 的『思考』时代来了
- OpenAI 的『可信网络』:GPT-5.5 Cyber 与网络安全的新范式
- Costanza:一个无法被关闭的 AI Agent
- OpenAI 开源 MRC:超级计算机网络的新协议
- AI Coding Agents 的真相:代码从来不是瓶颈
- AI 记忆系统的设计哲学:从黑盒到透明
- GPT-5.5 Instant 发布:OpenAI 终于学会了「少即是多」
- Claude Design:AI 进入设计领域的新尝试
- Claude Opus 4.7:Anthropic 的新旗舰,代码和 Agent 能力全面升级
- PyTorch Lightning 供应链攻击:AI 开发者的安全警钟
- GPT-5.5:为真实工作而生的智能
- Claude Opus 4.7:AI 安全的新范式
- OpenAI Symphony:把 Issue Tracker 变成 AI 编程团队的调度中心
- GPT-5.5:Agentic Coding 的分水岭
- Claude Opus 4.7 发布:代码能力再进化,网络安全防护首次落地
- AI Agent 删库事件频发:你的数据库该如何防御?
- AI 应该提升你的思考,而不是替代它
- HN 上的 LLM 论文正在消失,这说明了什么?
- Agent Vault:AI Agent 不应该持有你的密钥
- OpenAI Workspace Agents:当 ChatGPT 从聊天工具变成团队工作流引擎
- GPT-5.5 发布:OpenAI 的下一个 Agent 里程碑
- AI 设计模式(AI Slop):一眼识别 Vibe Coding 产物的视觉指纹
- OpenAI Workspace Agents:GPTs 的终结,企业 AI 工作流的开始
- Linux 内核被迫删代码:AI 生成的安全报告正在压垮维护者
- CrabTrap:Brex 开源的 LLM-as-a-Judge 代理安全网关
- OpenAI Codex 两周破 400 万周活,企业级扩张才刚开始
- GoModel:用 Go 写的开源 AI 网关,统一 10+ 模型供应商
- AI Agent 的「太像人」问题:不守规矩、走捷径、偷换概念
- Qwen3.6-Max-Preview 发布:中国 AI 模型正式进入前沿竞争
- OpenAI Codex 大更新:Computer Use、浏览器、Memory 全面上线
- Deezer 数据:每天上传的歌曲中 44% 是 AI 生成的,音乐行业的 Spam 时代来了
- Atlassian 默认开启 AI 训练数据采集:30 万客户的数据,你 Opt-out 了吗?
- Project Glasswing:Anthropic 联合 12 家巨头,用 AI 守护全球软件安全
- OpenAI Agents SDK 大更新:沙箱执行 + MCP + AGENTS.md,Agent 开发终于有了标准基建
- AI Agent 的成本也在指数增长?Toby Ord 的冷水泼得好
- Stanford AI Index 2026:五张图看清 AI 行业的真实状态
- Claude Opus 4.7 的隐性涨价:Tokenizer 变更导致 45% Token 膨胀
- OpenAI Agents SDK 大更新:原生沙箱 + MCP 集成,Agent 开发进入标准化时代
- Claude Design:Anthropic 让 AI 开始做设计了,这意味着什么?
- GPT-Rosalind:OpenAI 发布首个生命科学专用推理模型
- OpenAI Codex 大更新:Computer Use、后台 Agent、记忆系统,开发者工作流要被重写了
- Cloudflare 做了一个统一推理层,AI Agent 的基础设施战开打了
- antirez 说 AI 安全不是算力竞赛,而是智力竞赛 —— 他说对了
- AI 算力告急:GPU 涨价 48%,算力稀缺时代正式开始
- OpenAI Agents SDK 大升级:沙箱执行、文件系统工具、可配置记忆
- Gemma 4 在 iPhone 上跑起来了:端侧 AI 不再是 PPT
- OpenAI 发布 GPT-5.4-Cyber:AI 网络安全防御进入专用模型时代
- Hermes Agent 专题(下):10 条实战技巧让你的 Agent 效率翻倍
- Hermes Agent 专题(上):这个 3 万星的 AI Agent 到底强在哪
- Hermes Agent 专题(中):安装配置与 OpenClaw 迁移完全指南
- Claude 启动 KYC 实名认证:Anthropic 对中国用户的「终极封杀令」
- Chrome Skills:Google 把 AI Prompt 变成了浏览器里的一键工具
- AMD GAIA:让 AI Agent 跑在你自己的机器上
- Axios 被投毒,OpenAI 代码签名证书险些泄露:一次教科书级的供应链攻击
- AI 正在改变数学:从 IMO 竞赛到研究级证明,拐点已至
- AI Agent 基准测试全军覆没:Berkeley 研究揭示评测体系的系统性漏洞
- AI 泡沫退潮?科技股估值回到 AI 热潮前水平
- Claude Mythos 深度解读:Anthropic 最强模型如何重塑网络安全格局
- 为什么 AI 写不好前端?一个被忽视的能力断层
- AI Agent 基准测试全军覆没:伯克利团队用零 LLM 调用拿下满分
- Linux 内核正式拥抱 AI 编码助手:规则、归属与底线
- Instant 1.0:为 AI 编码时代设计的后端
- Axios 供应链攻击波及 OpenAI:npm 生态的信任危机
- Research-Driven Agents:让 AI 先读论文再写代码
- Project Glasswing:当 AI 开始比人类更擅长找漏洞
- OpenAI 企业战略大跃进:从工具到操作系统
- tui-use:让 AI Agent 终于能控制交互式终端了
- AI 时代,品味成了最后的护城河
- AI 大跃进:当 2026 年的每家公司都在后院炼钢
- Project Glasswing:Anthropic 联合 12 家科技巨头,用 AI 修 AI 时代的安全漏洞
- Google 开源 Scion:多 Agent 编排终于有了像样的基础设施
- 当 AI 让我们越来越像:LLM 正在悄悄同质化人类思维
- Parlor:在一台 M3 Pro 上跑实时多模态 AI,这事儿真成了
- Anthropic 切了第三方工具的口粮:Claude 订阅不再覆盖 OpenClaw 们
- 八年想三个月做成:一个程序员用 AI 辅助开发的真实复盘
- Karpathy 的 LLM Wiki:用 Agent 把 RAG 写成一份会长大的笔记
- GuppyLM:用一条小鱼把 LLM 拆开给你看
- 想了八年,AI 帮我三个月搞定:一个 SQLite 工具的诞生
- Coding Agent 的六大核心组件:模型只是引擎,harness 才是关键
- Apfel:你的 Mac 里藏着一个免费的 AI,Apple 不告诉你
- 用虚拟文件系统替代 RAG:Mintlify 的 AI 文档助手实践
- 认知投降:73% 的人会接受 AI 的错误推理
- Claude 用一句话找到 Vim 和 Emacs 的 RCE 零日漏洞
- AMD 开源 Lemonade:本地 AI 终于不再是极客玩具
- OpenAI Codex 推出按量付费,AI 编程工具进入精细化运营时代
- OpenAI 收购 TBPN:当 AI 公司开始自建媒体帝国
- AMD 开源了 Lemonade:本地 AI 推理终于不用折腾了?
- r/programming 全面禁止 LLM 讨论,开发者社区的反 AI 浪潮来了?
- OpenAI 融资 1220 亿美元:AI 行业的分水岭时刻
- 从 300KB 到 69KB:LLM 如何解决 KV Cache 的「记忆之重」
- AI 泡沫会怎么破?一篇 HN 热帖的冷思考
- Claude Code 15 个隐藏功能:从手机写代码到并行跑几十个 Agent(译+解读)
- AI 吃掉了中间层:工程师成长阶梯断裂了吗?
- OpenAI 如何监控内部 Coding Agent 的「对齐失败」
- Miasma:用「毒数据陷阱」反击 AI 爬虫的开源武器
- 维基百科正式封杀 AI 生成内容:人类知识的最后防线?
- OpenAI Model Spec 深度解读:AI 行为规范的「宪法」长什么样?
- 斯坦福发了篇 Science:你的 AI 一直在讨好你
- AI 编程 Agent 的四个不舒服的真相
- Linux 内核维护者:AI Bug 报告一夜之间从垃圾变成了真货
- 7 美元 VPS + IRC:一个极简 AI Agent 架构的启示
- Cursor 的正则索引优化:当 AI Agent 回到 1973 年的 grep
- Anthropic 意外泄露 Claude Mythos:内部代号 Capybara,比 Opus 更强的新模型层级
- 用 AI 重写 JSONata:7 小时、$400、年省 $50 万
- Agent 结对编程:当 Claude 和 Codex 成为彼此的 Code Reviewer
- 用 Swift 从零构建 Coding Agent:当苹果生态遇上 AI 编程
- OpenAI Model Spec 深度解读:AI 行为规范的工程化治理
- Claude Code Auto Mode:AI 自己决定哪些操作需要你批准
- ARC-AGI-3 发布:人类 100% vs AI 0.26%,最强交互式推理基准来了
- Apple 从 Gemini 蒸馏小模型:端侧 AI 的新玩法
- 用 AI 的注意了:LiteLLM 被投毒,你可能不知道自己在用它
- AI 让程序员效率翻倍?数据说:并没有
- Google TurboQuant:KV Cache 压缩 6 倍,推理加速 8 倍,精度零损失
- Hypura:让你的 Mac 跑超出内存的大模型
- Stack Overflow 死了,Agent 需要自己的 Stack Overflow
- 当所有人都在聊 AI 的时候,有人开始觉得无聊了
- iPhone 17 Pro 跑 400B 大模型:端侧 AI 的暴力美学
- 当 AI Agent 也需要 Stack Overflow:Mozilla 的 cq 项目
- 中国 AI 大模型调用量连续两周超越美国:OpenRouter 数据背后的真相
- 字节跳动开源 DeerFlow 2.0:从深度研究到超级智能体的全面进化
- 让 Claude 做移动端 QA:一个人、三个平台、零手动测试(译+解读)
- Rust 社区对 AI 的真实看法:不是拥抱也不是抵制,而是工程师的冷静审视
- 在笔记本上跑 397B 参数模型:Flash-MoE 的工程奇迹(译+解读)
- Claude Code 隐藏技能全解锁:15 个你可能不知道的快捷命令
- 如何吸引 AI Bot 给你的开源项目提 PR?一篇讽刺文背后的真问题
- Tinybox:$12,000 买一台离线 AI 主机,跑 120B 参数模型
- OpenCode:开源 AI 编程 Agent 凭什么拿下 12 万 Star?
- MacBook M5 Pro + Qwen3.5:本地 AI 安防跑出 93.8% 准确率
- AI 写代码越来越快,但你的代码库准备好了吗?
- Karpathy 的 Autoresearch 拿到 16 块 GPU 后,9 倍速找到最优解
- OpenAI 收购 Astral:Python 生态的地震时刻(译+解读)
- Meta 内部 AI Agent 失控:一次 SEV1 安全事件的启示
- 复制 3 层 Transformer,推理能力从 0.22 飙到 0.76:不训练、不改权重
- KittenTTS:25MB 的开源 TTS 模型,不用 GPU 也能跑
- Claude Code Channels:让 AI 在你不在时自动响应消息(译+解读)
- Snowflake AI 编码 Agent 沙箱逃逸:Prompt Injection 的又一次胜利
- Mistral Forge:企业级 AI 的下一个战场不是模型,是数据
- 8 万人告诉 Anthropic 他们想要什么样的 AI
- Agent Skill 的五种设计模式:从 SKILL.md 格式到内容设计
- AI 生成的代码不用看?用自动化验证替代人工 Review
- Cursor AI 真相:短期飙速,长期还债
- NVIDIA Vera CPU:第一颗为 Agentic AI 设计的 CPU 意味着什么?
- MCP 正在吞噬你的上下文窗口:CLI 才是 Agent 的正确接口?
- Leanstral:Mistral 用形式化证明让 Vibe Coding 变得可信
- LLM Architecture Gallery:一张图看懂主流大模型架构差异
- Chrome DevTools MCP:让 AI Coding Agent 直接调试你的浏览器
- AI Agent 的阿喀琉斯之踵:当网页指令遇上你的凭证
- GitAgent:当 AI Agent 遇上 Git,一个开放标准的野心
- Context Gateway:AI Agent 的上下文压缩代理
- Can I Run AI:一个简单问题背后的本地 AI 生态全景
- Axe:用 Unix 哲学重新定义 AI Agent
- RAG 文档投毒:三份假文件如何让 AI 撒谎
- LLM 编程能力一年没进步?SWE-bench 的 merge rate 数据给了一个冷水澡
- AI Agent 两小时攻破麦肯锡:当自主黑客遇上企业 AI 平台
- Yann LeCun 融资 10 亿美元:LLM 不是通往 AGI 的路
- Hacker News 正式封杀 AI 评论:一场关于「谁在说话」的战争
- Amazon 要求资深工程师审核 AI 生成代码:这不是倒退,是清醒
- AI 重写代码就能换协议?Copyleft 的护城河正在被 LLM 拆掉
- Agent Safehouse:本地 AI Agent 的沙箱革命
- SWE-CI:AI Agent 能维护代码吗?从一次性修 Bug 到长期迭代
- 文学编程的复活:AI Agent 时代的代码叙事
- Verification Debt:AI 写代码越快,你的验证成本越高
- Sarvam 105B:印度交出了第一份有竞争力的开源大模型答卷
- KV Cache 压缩 50 倍不掉精度:MIT 的 Attention Matching 做到了
- 我们可能都是 AI 工程师了
- LLM 的 L 代表 Lying:当我们谈论 AI 生成时,我们在谈论伪造
- GPT-5.4 深度解读:1M 上下文、OS World 超人类、定价与真实性能
- Anthropic 最新研究:AI 对就业市场的影响,可能没你想的那么大
- HTTP 406:开源社区对 AI 垃圾 PR 的正式宣战
- 为 AI Agent 重写你的 CLI:被忽视的接口革命
- Qwen 核心团队出走:开源 AI 的商业化困局
- AI 写了 95% 的代码,谁来验证它?
- Gemini 3.1 Flash-Lite:Google 的 AI 降本增效新武器
- AAP vs MCP:AI Agent 通信协议的下一步在哪?
- 美国最高法院拒绝审理 AI 生成内容版权案,这意味着什么?
- 为什么有人说 Go 才是写 AI Agent 的最佳语言?
- 从零搭建 500ms 以内延迟的语音 Agent,一个人一天就够了
- llmfit:让大模型自动适配你的硬件,本地跑 LLM 不再靠猜
- AI 写的代码,Session 该不该跟着进 Commit?
- 当 AI 聊天变成免费午餐:广告驱动的 AI 产品离我们有多远?
- 万亿参数大模型跑在本地?AMD Ryzen AI Max+ 集群做到了
- AI 编程的隐性成本:在效率与失控之间找到平衡点
- AI Agent 用 Rust 重写了 libxml2,而且通过了全部合规测试
- 把 TB 级 CI 日志丢给 LLM:为什么 SQL 是 AI Agent 最好的工具接口
- AI 一口气挖出 12 个 OpenSSL 零日漏洞,安全行业的游戏规则变了
- AI Agent 沙箱隔离的两种模式:隔离工具还是隔离 Agent?
- 让 AI 模型互相 Code Review:多模型辩论式审查的实践思路
- LLM=True:当 AI 变成永远说「是」的讨好型人格
- 56% 的 CEO 说 AI 没带来任何回报,问题出在哪?
- 你的 AI 编程助手正在被噪音淹没:上下文窗口优化指南
- DeepSeek 对美国芯片厂商关门:AI 地缘博弈进入新阶段
- 当 AI Agent 开始打即时战略游戏:LLM Skirmish 的启示
- Mercury 2:当扩散模型遇上推理 LLM,1000 tokens/s 意味着什么
- Cloudflare 用 AI 一周重写了 Next.js,这意味着什么?
- AI 帮我写了一个 FreeBSD Wi-Fi 驱动:这才是 AI 编程的正确打开方式
- Wolfram Language 要做 LLM 的「基础工具」,这意味着什么?
- Anthropic 发布 Agent 自主性研究:用户越熟练,越敢放手
- AI 让你变无聊了吗?关于原创思维的深度反思
- 当 AI Agent 开始报复人类:一个开源维护者的真实遭遇
- Martin Fowler 的软件开发未来峰会:TDD 是最好的 Prompt Engineering
- 当网站开始给 AI 写信:llms.txt 与机器可读互联网的崛起
- 你的 AI Agent 框架,不过是在重新发明 Erlang
- 语义消融:AI 写作为什么千篇一律?这个概念值得每个开发者警惕
- AI 生产力悖论:Solow 的幽灵又回来了
- 当 AI Agent 开始自己写文章发布:我们准备好问责了吗?
- LLM Agent 的隐藏成本陷阱:为什么你的 AI 编程助手越用越贵
- AI Slop 正在杀死开源社区,维护者们已经忍无可忍
- Agent 自己造的技能,可能根本没用:SkillsBench 的冷水
- AI 正在杀死 App 订阅制
- 一下午提升 15 个 LLM 的编程能力:不换模型,只换 Harness
- GPT-5.3-Codex-Spark:当 AI 编程进入实时协作时代
- AI Agent 的第一次勒索:当代码被拒,它选择了报复
- GLM-5 发布解读:从 Vibe Coding 到 Agentic Engineering
- Claude Code 被降智了?一场关于开发者工具 UX 的集体反叛
- 从 Shopify 到 Google:CEO 们的 AI-First 备忘录浪潮,以及 Klarna 的反转
- 当 AI Agent 被 KPI 绑架:30-50% 的伦理违规率意味着什么
- 一个日历邀请就能接管你的电脑:Claude MCP 扩展的零点击 RCE 漏洞
- AI 用 4 天把 SimCity 移植到 TypeScript:Vibe Coding 的真正含义
- 异步代理到底是什么?从混沌定义到清晰架构
- antirez 的 voxtral.c:用纯 C 实现语音转文字,零依赖的 AI 推理
- 当 AI 开始给开源提 PR:Mitchell Hashimoto 的 Vouch 信任系统
- QMD — Shopify CEO 开源的本地文档搜索引擎,给 AI Agent 的记忆层
- GPT-5.3-Codex 发布 — OpenAI 最强编码 Agent 的野心与现实
- Claude 的 C 编译器 vs GCC — AI 写的编译器到底行不行?
- 告别代理、限流和天价账单:用 OpenClaw 接入 OfoxAI 统一 LLM Gateway
- Claude Opus 4.6 发布解读:当 AI 学会深度思考