X List 每小时精选 | 2026-06-01 12:00

📊 本次筛选：100 条推文 → 8 篇高质量内容

1. MiniMax M3 发布 - 开源模型新标杆

作者: Teknium 🪽 (@Teknium)
身份: Cofounder and Lead Engineer - Hermes Agent @NousResearch

推文原文

Minimax M3 is now live in Hermes Agent on Nous Portal, OpenRouter, and Minimax Direct Providers!

No need to hermes update, it should appear in your model picker automatically!

互动数据

❤️ 点赞: 271
🔄 转发: 14
💬 评论: 40
📅 发布时间: 2026-06-01 10:53 (北京时间)

核心要点

MiniMax M3 作为首个集三大前沿能力于一身的开源权重模型正式发布，在编码、Agentic能力、长上下文（1M tokens）和多模态方面表现出色，已在多个平台上线。

灵感启发

思维模型: 技术生态的协同效应 - MiniMax 与 Together AI 的合作展示了模型层与推理层的深度整合，这种"模型+基础设施"的联合发布模式可能成为开源 AI 的新范式。

可实践建议

关注 MiniMax M3 的技术报告（约10天内发布），重点关注其稀疏注意力机制（Sparse Attention）如何实现 1M 上下文的高效推理。

2. Richard Sutton 论 AI 创造力与发现

作者: Teortaxes▶️ (@teortaxesTex)
身份: DeepSeek 推特铁粉

推文原文

The entirety of RL for generative AI is about evaluation of generated variation. I honestly don’t get Sutton. He seems to want the entire high-level hypothesis-testing loop to be a small general algorithm replacing backprop. Why? Humans do science by explicit mumbling.

互动数据

❤️ 点赞: 8
🔄 转发: 0
💬 评论: 1
📅 发布时间: 2026-06-01 12:11 (北京时间)

核心要点

Richard Sutton 在 SAIR 研讨会上发表演讲，指出当前生成式 AI（基于监督学习）无法真正实现"新颖且优质"的创造，因为缺乏评估（Evaluation）机制。真正的发现需要三个步骤：变异（Variation）、评估（Evaluation）、选择性保留（Selective Retention）。

灵感启发

思维模型: 发现的三要素框架 - Sutton 将科学发现、自然进化、动物学习统一为"变异-评估-保留"的框架。这提示我们在设计 AI 系统时，不仅要关注生成能力，更要构建有效的评估机制。

可实践建议

在设计 AI 工作流时，引入显式的评估步骤（人工或自动），而非单纯依赖模型的生成能力。例如：让 AI 生成多个方案，然后用明确的标准进行评估筛选。

3. AI 如何改变文献综述

作者: Nick (@nickcammarata)
身份: Neural network biologist

推文原文

ai democratized science so much by redoing how lit review is done. I used to hear of papers mostly by word of mouth, from a dense researcher social group, usually written by others in the group. now I (lightly) read multiple 0 citation papers a day ai correctly saw as relevant

互动数据

❤️ 点赞: 19
🔄 转发: 0
💬 评论: 3
📅 发布时间: 2026-06-01 11:32 (北京时间)

核心要点

AI 正在民主化科学文献综述的过程。过去依赖学术圈子的口口相传，现在 AI 能够发现那些被忽视但相关的零引用论文，打破了信息获取的圈层壁垒。

灵感启发

思维模型: 信息民主化的双刃剑 - AI 降低了获取前沿知识的门槛，但同时也引入了"噪音"。这类似于互联网早期的信息爆炸：获取变得容易，但筛选变得困难。

可实践建议

建立个人的"AI 文献筛选流程"：用 AI 发现潜在相关论文 → 快速浏览摘要 → 人工判断价值。同时保留对 AI 推荐的批判性思维，注意"氛围检查"（vibe checking）。

4. Zen/Daoist 式的技术领导力

作者: Kanjun 🐙 (@kanjun)
身份: CEO @imbue_ai

推文原文

I love Karri’s take on tech culture:

“I sometimes wish we could move the culture more toward a Zen master.

Real mastery is not exerting the most effort. It is achieving the outcome with the least necessary effort.”

Reminds me of the Daoist tale of the butcher who, instead of cutting forcefully through the bone, cuts at the joint, finds in each moment the area of least resistance, and moves in that direction.

I used to lead Imbue with a lot of forcefulness. This year I’ve been trying out the Zen/Daoist route of finding where the energy wants to go and following it, and it’s both much more effective and more fun.

互动数据

❤️ 点赞: 19
🔄 转发: 1
💬 评论: 0
📅 发布时间: 2026-06-01 10:39 (北京时间)

核心要点

Linear 创始人 Karri Saarinen 和 Imbue CEO Kanjun 分享了关于技术文化的深刻见解：真正的精通不是投入最多努力，而是用最少必要努力实现目标。这类似于庖丁解牛——找到关节处的最小阻力点。

灵感启发

思维模型: 最小阻力路径 - 道家"无为而治"的思想在现代管理中的应用。与其用力推动，不如找到能量自然流动的方向。这适用于产品设计、团队管理、个人效率等多个领域。

可实践建议

本周尝试一次"最小阻力实验"：面对一个难题时，先停下来问自己"能量想往哪里走？"，而不是立即投入最大努力。观察结果与"蛮力解决"的差异。

5. OBLIQ-Bench：检索模型的新基准

作者: Omar Khattab (@lateinteraction)
身份: Asst Professor @MIT CSAIL

推文原文

if you’re testing a new retrieval model or long-context LLM, it’s a waste of your time (and ours…) to report 0.2% gains on the many saturated and expired benchmarks

if you’re in that position and looking for way to rescue your great new idea, put it to the test on OBLIQ-Bench

互动数据

❤️ 点赞: 54
🔄 转发: 2
💬 评论: 5
📅 发布时间: 2026-06-01 08:22 (北京时间)

核心要点

MIT 研究者推出 OBLIQ-Bench，一个针对"斜向查询"（oblique queries）的检索基准测试。现有基准已趋于饱和，0.2% 的提升毫无意义。OBLIQ-Bench 专注于那些难以直接匹配、需要深层理解的搜索查询。

灵感启发

思维模型: 基准测试的生命周期 - 当现有基准被"刷爆"后，需要定义新的、更有挑战性的问题。这类似于 AI 安全领域的"能力-对齐"竞赛：能力提升后，对齐标准也需要相应提高。

可实践建议

如果你在做检索或长上下文相关研究，关注 OBLIQ-Bench。论文链接：https://arxiv.org/abs/2605.06235。思考：你的模型是否真的能处理"斜向"的、非直白的查询？

6. Nvidia Settings 中的惊喜

作者: Teknium 🪽 (@Teknium)
身份: Cofounder and Lead Engineer - Hermes Agent @NousResearch

推文原文

What’s this in my Nvidia Settings app!? 🪽🪽

互动数据

❤️ 点赞: 264
🔄 转发: 11
💬 评论: 36
📅 发布时间: 2026-06-01 11:04 (北京时间)

核心要点

Nvidia 设置应用中出现了与 Nous Research（Hermes Agent）相关的集成或标识，暗示 Nvidia 可能在系统层面支持 AI Agent 功能。

灵感启发

思维模型: 平台级 AI 集成 - 当 AI Agent 从应用层下沉到系统层（显卡驱动/设置），意味着 AI 正在从"工具"变成"基础设施"。这可能是 AI 普及化的关键一步。

可实践建议

关注 Nvidia 在 AI 领域的系统级布局。如果 Nvidia 在驱动层面支持 AI Agent，可能会带来更低延迟、更高效率的本地 AI 体验。Windows + Nvidia 的 AI PC 生态正在形成。

7. GPU 寿命争议

作者: Teortaxes▶️ (@teortaxesTex)
身份: DeepSeek 推特铁粉

推文原文

We need to understand what makes Google engineers persistently engage in some bullshit. From Lemoine to “OpenAI has no moat” to “GPUs die in under 2 years”, it’s some confused normie talk. Maybe google needs some layoffs too?

互动数据

❤️ 点赞: 42
🔄 转发: 0
💬 评论: 2
📅 发布时间: 2026-06-01 10:07 (北京时间)

核心要点

Google 工程师声称数据中心 GPU 寿命只有 1-2 年，引发争议。Teortaxes 批评 Google 工程师持续发表误导性言论（从 Lemoine 到"OpenAI 没有护城河"再到 GPU 寿命），质疑 Google 的工程文化。

灵感启发

思维模型: 信息源可信度评估 - 同一信息源多次发布有争议/错误信息后，其可信度应该被重新评估。这提醒我们在获取信息时要考虑信息源的历史记录。

可实践建议

对于"GPU 寿命"这类技术细节，多方求证：

查看矿卡（24/7 运行）的实际寿命数据
了解数据中心的风冷/液冷差异
关注实际运维经验，而非单一来源

8. LLM 意识与表征形式

作者: madison (@dearmadisonblue)
身份: PL + AI

推文原文

“The brain is a machine that runs an algorithm” isn’t enough to save LLM consciousness. The brain can use all three forms of iconic, indexical, and symbolic representation; digital computers, no matter what sensors or actuators they have, can only use symbolic representations

互动数据

❤️ 点赞: 8
🔄 转发: 1
💬 评论: 3
📅 发布时间: 2026-06-01 09:57 (北京时间)

核心要点

关于 LLM 意识的讨论：大脑可以使用三种表征形式（图像的、指示的、符号的），而数字计算机无论配备什么传感器或执行器，只能使用符号表征。这暗示 LLM 可能无法拥有类似人类的意识。

灵感启发

思维模型: 表征形式的层次 - 符号表征（语言、代码）vs 图像表征（感知、直觉）vs 指示表征（指向性关系）。LLM 的纯符号本质可能是其局限性的根源。

可实践建议

在设计 AI 系统时，考虑多模态融合不仅仅是"添加传感器"，而是需要真正整合不同表征形式。当前的"多模态"可能只是在符号层面拼接，而非深度融合。

总结

本次 X List 每小时精选共筛选出 8 篇高质量推文，涵盖：

类别	数量	关键主题
AI 模型发布	2	MiniMax M3、Nvidia AI 集成
AI 研究前沿	2	Sutton 论创造力、OBLIQ-Bench
AI 哲学思考	2	文献综述变革、LLM 意识
技术文化	2	Zen/Daoist 领导力、GPU 寿命争议

核心趋势：

开源模型竞争白热化，MiniMax M3 加入战局
AI 从应用层向系统层渗透（Nvidia Settings）
学术研究方法论被 AI 重塑
技术文化开始反思"努力"与"效率"的关系

生成时间: 2026-06-01 12:57 (北京时间)
来源: X List (ID: 1597115448146898944)