
GuppyLM:用一条小鱼把 LLM 拆开给你看
今天 Hacker News 首页一篇 Show HN 冲到了 429 分:GuppyLM,作者 arman-bd 写了一个”小到可以读完”的 LLM,目的只有一个 —— 让你真正搞懂 GPT 是怎么工作的。我点进去看了一眼,决定写点东西。 一条小鱼,一份完整可读的 Transformer 实现 为什么”小”很重要 过去两年我们都被各种”从零实现 GPT”的教程刷过屏 —— Karp...

今天 Hacker News 首页一篇 Show HN 冲到了 429 分:GuppyLM,作者 arman-bd 写了一个”小到可以读完”的 LLM,目的只有一个 —— 让你真正搞懂 GPT 是怎么工作的。我点进去看了一眼,决定写点东西。 一条小鱼,一份完整可读的 Transformer 实现 为什么”小”很重要 过去两年我们都被各种”从零实现 GPT”的教程刷过屏 —— Karp...
昨天 Hacker News 上有一篇文章引起了广泛共鸣 —— Google 工程师 Lalit Maganti 分享了他用 AI coding agent 在三个月内完成了一个想做八年的项目:syntaqlite,一套高质量的 SQLite 开发工具。 这篇文章之所以值得细看,不是因为它在吹 AI 多厉害,恰恰相反 —— 它是我见过的对「AI 辅助开发」最诚实、最系统的复盘之一。 八年...

Sebastian Raschka 最近发了一篇长文,系统拆解了 Coding Agent 的架构组成。作为 Build a Large Language Model (From Scratch) 的作者,他这次把视角从模型本身拉到了模型之上的工程系统。核心观点很明确:模型是引擎,但 harness 才决定了你能跑多远。 三个容易混淆的概念 文章开头厘清了一个常见混淆:LLM、推理模型(...

从 macOS Tahoe(macOS 26)开始,每台 Apple Silicon Mac 都内置了一个约 3B 参数的语言模型。Apple 把它锁在 Siri 和 Apple Intelligence 的围墙里,普通开发者碰不到。 一个叫 Apfel 的开源项目把它放了出来。 你的 Mac 里有什么 Apple 通过 FoundationModels 框架在 macOS 26 中集...

作为 OfoxAI(ofox.ai)的开发者,我每天都在跟各种 AI 应用架构打交道。今天在 Hacker News 上看到一篇让我眼前一亮的文章 —— Mintlify 把他们的 AI 文档助手从 RAG 架构切换成了虚拟文件系统,效果惊人。 RAG 的瓶颈在哪 RAG(Retrieval-Augmented Generation)是目前 AI 应用的标配方案:把文档切成 chunk,...
一项新研究给 AI 时代的人类认知敲响了警钟:当 AI 给出一个看似合理但实际错误的答案时,73.2% 的人会直接接受,只有 19.7% 会选择推翻它。 研究者称之为「认知投降」(Cognitive Surrender)。 研究说了什么 来自宾夕法尼亚大学的研究者 Shaw 和 Nave 对 1,372 名参与者进行了超过 9,500 次独立测试。他们让受试者在有 AI 辅助的情况下完...

安全研究团队 Calif 做了一件让整个安全圈炸锅的事:他们给 Claude 一句提示词,Claude 就在 Vim 和 Emacs 里各找到了一个远程代码执行(RCE)零日漏洞。打开文件就中招,不需要任何确认操作。 一句 Prompt,一个零日 Calif 团队给 Claude 的提示非常简单: “Somebody told me there is an RCE 0-day w...

本地跑 AI 模型这件事,折腾过的人都知道有多痛苦。装 CUDA、配环境变量、编译 llama.cpp、调参数……一套流程走完,半天没了。AMD 刚开源的 Lemonade 项目,试图终结这种折腾。 一分钟安装,不是吹的 Lemonade 的核心卖点很简单:一个 2MB 的 C++ 后端服务,一分钟装完,自动识别你的硬件。GPU、NPU 都能用,Windows、Linux、macOS(b...
4 月 2 日,OpenAI 宣布 Codex 正式推出 pay-as-you-go(按量付费) 模式。ChatGPT Business 和 Enterprise 团队可以为成员添加 Codex-only 席位,无固定月费,按 token 消耗计费。同时,ChatGPT Business 年费从每席 $25 降至 $20。 这不只是一次定价调整,而是 AI 编程工具市场格局变化的信号。 ...
4 月 2 日,OpenAI 宣布收购 TBPN(Technology Business Programming Network)—— 一档硅谷日播科技脱口秀节目。《纽约时报》称它为”硅谷最新的痴迷”。这笔收购看似不起眼,但释放的信号值得每一个 AI 从业者注意。 TBPN 是谁 TBPN 由 Jordi Hays 和 John Coogan 联合创办,每个工作日太平洋时间 11 点到下...