
OpenAI 发布 GPT-5.4-Cyber:AI 网络安全防御进入专用模型时代
昨天 OpenAI 发布了一个值得关注的动作:推出 GPT-5.4-Cyber,一个专门为网络安全防御场景微调的模型变体,同时将 Trusted Access for Cyber (TAC) 计划扩展到数千名安全研究员和数百个防御团队。 这不是又一次常规的模型更新。这是大模型厂商第一次正式发布「领域专用安全模型」。 为什么这件事重要 过去两年,AI 在安全领域的应用一直处于一个尴尬的灰...

昨天 OpenAI 发布了一个值得关注的动作:推出 GPT-5.4-Cyber,一个专门为网络安全防御场景微调的模型变体,同时将 Trusted Access for Cyber (TAC) 计划扩展到数千名安全研究员和数百个防御团队。 这不是又一次常规的模型更新。这是大模型厂商第一次正式发布「领域专用安全模型」。 为什么这件事重要 过去两年,AI 在安全领域的应用一直处于一个尴尬的灰...

这是 Hermes Agent 专题的最后一篇。上篇讲了它是什么;中篇讲了安装配置和 OpenClaw 迁移;本篇讲高效使用技巧。 装好了,配好了,能用了。但”能用”和”用得好”之间差距很大。 这篇总结了 10 条实战技巧,帮你把 Hermes Agent 从”一个 AI 工具”变成”一个越来越懂你的同事”。 1. 写好 AGENTS.md——给 Agent 一份项目说明书 在项目...

这是 Hermes Agent 专题的第一篇。上篇讲它是什么、为什么值得关注;中篇讲安装配置和 OpenClaw 迁移;下篇讲高效使用技巧。 两个月不到,GitHub 近 3 万星。Nous Research 开源的 Hermes Agent 正在成为 AI Agent 赛道最值得关注的项目之一。 它不是又一个套壳 ChatGPT 的终端工具。它有自己的学习闭环——用得越多越聪明,能自...

这是 Hermes Agent 专题的第二篇。上篇讲了它是什么;本篇讲安装配置和 OpenClaw 迁移;下篇讲高效使用技巧。 上篇介绍了 Hermes Agent 的核心特性。这篇进入实操——从零开始装起来,配好模型和平台,如果你是 OpenClaw 用户,还有完整的迁移路径。 安装 一行命令: curl -fsSL https://raw.githubusercontent.c...
炸弹来了 Anthropic 悄悄更新了一条政策,但这不是普通的更新——这是一颗投向中国用户的炸弹。 根据官方帮助文档,Claude 现在要求部分用户完成 KYC(Know Your Customer)身份验证。 什么是 KYC?就是你去银行开户、申请信用卡时需要的那套流程:上传政府签发的身份证件,进行真人验证。 是的,用一个 AI 聊天工具,现在可能需要交出你的身份证。 这意味着...

Google 昨天发布了 Chrome 的新功能 Skills,核心思路很简单:把你写过的好用 AI prompt 保存下来,下次一键复用。 听起来不起眼,但这个方向值得认真看。 什么是 Chrome Skills 简单说,Skills 是 Chrome 内置 Gemini 的 prompt 模板系统。你在浏览器里用 Gemini 写了一个好用的 prompt(比如「把这个食谱改成纯素...

AI Agent 的军备竞赛正在从云端蔓延到本地。AMD 刚刚开源了 GAIA —— 一个让你在本地硬件上构建和运行 AI Agent 的框架,不需要 API Key,不需要云服务,数据不出设备。 这个项目在 Hacker News 上拿到了 148 分,引发了一波关于”AI 本地化”的讨论。 为什么值得关注 过去两年,我们习惯了一种模式:写代码调 API,把 prompt 和数据发到...

你的项目里大概率有 Axios。这个每周下载量超过 5000 万次的 HTTP 客户端库,在 3 月 31 日被朝鲜黑客组织投毒了。 更刺激的是,OpenAI 中招了。 发生了什么 Google Threat Intelligence 团队在 4 月初披露:Axios npm 包的 1.14.1 版本被植入恶意代码,属于一次针对性的软件供应链攻击,幕后是朝鲜关联的威胁行为者。 攻击链...

作为 OfoxAI(ofox.ai)的开发者,我每天都在和不同的 AI 模型打交道。但最近 Quanta Magazine 的一篇深度报道让我意识到,AI 的能力边界正在一个我没太关注的领域被彻底重新定义 —— 数学。 2025 年夏天:拐点 2025 年 7 月,多个 AI 模型在国际数学奥林匹克竞赛(IMO)中解出了 6 道题中的 5 道。这本身已经够震撼了,但真正的转折不在竞赛 —...
每周都有新模型登顶排行榜。公司用这些数字写新闻稿,投资人用它们做估值判断,工程师用它们选模型。但如果这些分数本身就是假的呢? UC Berkeley 的研究团队刚刚发布了一项令人不安的研究:他们构建了一个自动化扫描 Agent,系统性地审计了八个最主流的 AI Agent 基准测试 — SWE-bench、WebArena、OSWorld、GAIA、Terminal-Bench、Field...