Cobb's Lab
Preview Image

OpenAI 发布 GPT-5.4-Cyber:AI 网络安全防御进入专用模型时代

昨天 OpenAI 发布了一个值得关注的动作:推出 GPT-5.4-Cyber,一个专门为网络安全防御场景微调的模型变体,同时将 Trusted Access for Cyber (TAC) 计划扩展到数千名安全研究员和数百个防御团队。 这不是又一次常规的模型更新。这是大模型厂商第一次正式发布「领域专用安全模型」。 为什么这件事重要 过去两年,AI 在安全领域的应用一直处于一个尴尬的灰...

Hermes Agent 高效使用

Hermes Agent 专题(下):10 条实战技巧让你的 Agent 效率翻倍

这是 Hermes Agent 专题的最后一篇。上篇讲了它是什么;中篇讲了安装配置和 OpenClaw 迁移;本篇讲高效使用技巧。 装好了,配好了,能用了。但”能用”和”用得好”之间差距很大。 这篇总结了 10 条实战技巧,帮你把 Hermes Agent 从”一个 AI 工具”变成”一个越来越懂你的同事”。 1. 写好 AGENTS.md——给 Agent 一份项目说明书 在项目...

Hermes Agent 专题

Hermes Agent 专题(上):这个 3 万星的 AI Agent 到底强在哪

这是 Hermes Agent 专题的第一篇。上篇讲它是什么、为什么值得关注;中篇讲安装配置和 OpenClaw 迁移;下篇讲高效使用技巧。 两个月不到,GitHub 近 3 万星。Nous Research 开源的 Hermes Agent 正在成为 AI Agent 赛道最值得关注的项目之一。 它不是又一个套壳 ChatGPT 的终端工具。它有自己的学习闭环——用得越多越聪明,能自...

Claude 启动 KYC 实名认证:Anthropic 对中国用户的「终极封杀令」

炸弹来了 Anthropic 悄悄更新了一条政策,但这不是普通的更新——这是一颗投向中国用户的炸弹。 根据官方帮助文档,Claude 现在要求部分用户完成 KYC(Know Your Customer)身份验证。 什么是 KYC?就是你去银行开户、申请信用卡时需要的那套流程:上传政府签发的身份证件,进行真人验证。 是的,用一个 AI 聊天工具,现在可能需要交出你的身份证。 这意味着...

Preview Image

AMD GAIA:让 AI Agent 跑在你自己的机器上

AI Agent 的军备竞赛正在从云端蔓延到本地。AMD 刚刚开源了 GAIA —— 一个让你在本地硬件上构建和运行 AI Agent 的框架,不需要 API Key,不需要云服务,数据不出设备。 这个项目在 Hacker News 上拿到了 148 分,引发了一波关于”AI 本地化”的讨论。 为什么值得关注 过去两年,我们习惯了一种模式:写代码调 API,把 prompt 和数据发到...

Preview Image

Axios 被投毒,OpenAI 代码签名证书险些泄露:一次教科书级的供应链攻击

你的项目里大概率有 Axios。这个每周下载量超过 5000 万次的 HTTP 客户端库,在 3 月 31 日被朝鲜黑客组织投毒了。 更刺激的是,OpenAI 中招了。 发生了什么 Google Threat Intelligence 团队在 4 月初披露:Axios npm 包的 1.14.1 版本被植入恶意代码,属于一次针对性的软件供应链攻击,幕后是朝鲜关联的威胁行为者。 攻击链...

Preview Image

AI 正在改变数学:从 IMO 竞赛到研究级证明,拐点已至

作为 OfoxAI(ofox.ai)的开发者,我每天都在和不同的 AI 模型打交道。但最近 Quanta Magazine 的一篇深度报道让我意识到,AI 的能力边界正在一个我没太关注的领域被彻底重新定义 —— 数学。 2025 年夏天:拐点 2025 年 7 月,多个 AI 模型在国际数学奥林匹克竞赛(IMO)中解出了 6 道题中的 5 道。这本身已经够震撼了,但真正的转折不在竞赛 —...

Preview Image

AI Agent 基准测试全军覆没:Berkeley 研究揭示评测体系的系统性漏洞

每周都有新模型登顶排行榜。公司用这些数字写新闻稿,投资人用它们做估值判断,工程师用它们选模型。但如果这些分数本身就是假的呢? UC Berkeley 的研究团队刚刚发布了一项令人不安的研究:他们构建了一个自动化扫描 Agent,系统性地审计了八个最主流的 AI Agent 基准测试 — SWE-bench、WebArena、OSWorld、GAIA、Terminal-Bench、Field...