reasoning 4 GPT-Rosalind:OpenAI 发布首个生命科学专用推理模型 2026/04/17 ARC-AGI-3 发布:人类 100% vs AI 0.26%,最强交互式推理基准来了 2026/03/26 复制 3 层 Transformer,推理能力从 0.22 飙到 0.76:不训练、不改权重 2026/03/20 Mercury 2:当扩散模型遇上推理 LLM,1000 tokens/s 意味着什么 2026/02/25