X List 每小时精选 | 2026-05-30 12:00
从 X List 精选的 8 篇高质量推文,涵盖 AI Agent、模型架构、商业分析和行业趋势
1️⃣ Hermes Agent 推出 Tool Search 功能
作者: @Teknium (NousResearch 联合创始人)
发布时间: 2026-05-30 06:43 (北京时间)
互动数据: ❤️ 532 | 🔄 33 | 💬 42
推文原文
Now in Hermes Agent, you can load an arbitrary amount of tools from mcps to plugins and get access to it all, with no compromise to your context!
Anytime you load more than 10% of your context window in tools from mcps or plugins, this feature will activate automatically!
🧠 AI 深度分析
【核心要点】
Hermes Agent 推出智能 Tool Search 功能,当工具占用超过 10% 上下文窗口时自动激活,让 Agent 可以加载任意数量的 MCP 和插件工具而不影响上下文质量。
【灵感启发】
这代表了 Agent 架构的重要演进——从"加载所有工具"到"按需搜索加载"。类似于人类大脑的工作方式:我们不会同时思考所有知识,而是根据需求检索。这种稀疏激活机制可能是解决上下文限制的关键路径。
【可实践建议】
如果你正在构建 AI Agent,考虑实现类似的动态工具加载机制:维护一个工具注册表,让 Agent 根据任务描述自主搜索并加载所需工具,而非一次性加载全部工具。
📱 社交媒体文案
【即刻版】
Hermes Agent 这波更新太香了!🚀 Tool Search 功能让 Agent 可以加载任意数量的工具而不会撑爆上下文窗口——超过10%自动触发智能搜索。这就像是给 AI 装上了"按需取用"的超能力,从此告别"工具太多装不下"的烦恼。Agent 架构正在快速进化,动态工具管理将成为标配!
#AI #Agent #NousResearch #HermesAgent #科技动态
参考链接:https://x.com/Teknium/status/2060492153466573138
【Twitter/X版】
Hermes Agent 推出 Tool Search:当工具占用>10%上下文时自动激活,支持加载任意数量 MCP/插件而不影响性能。Agent 架构的重大进化!
#AI #Agent #NousResearch
https://x.com/Teknium/status/2060492153466573138
2️⃣ OpenAI Greg Brockman 展示 Codex 自管理功能
作者: @gdb (OpenAI 联合创始人 & 总裁)
发布时间: 2026-05-30 06:19 (北京时间)
互动数据: ❤️ 400 | 🔄 20 | 💬 36
推文原文
codex for managing the codex UI:
🧠 AI 深度分析
【核心要点】
Greg Brockman 展示了 Codex 的新能力:可以管理 Codex 自身的 UI 界面,包括创建线程、搜索、组织、置顶重要对话,以及为并行任务创建工作区。
【灵感启发】
“AI 管理 AI 界面"标志着工具使用能力的质变——从被动执行命令到主动管理环境。这类似于程序员使用 IDE 的方式:不仅写代码,还管理项目结构。这种元能力(meta-capability)是通往更自主 Agent 的关键一步。
【可实践建议】
如果你在使用 AI 编码助手,尝试让它不仅生成代码,还管理你的开发环境:组织文件结构、管理 Git 分支、维护文档。观察它在"元任务"上的表现。
📱 社交媒体文案
【即刻版】
Codex 这波操作太秀了!🤖 用 Codex 管理 Codex 自己的 UI——创建线程、搜索对话、组织项目、置顶重要内容,还能开并行工作区。AI 开始管理自己的"工作环境"了,这是从"工具"到"协作者"的关键跃迁!
#OpenAI #Codex #AI编程 #科技动态
参考链接:https://x.com/gdb/status/2060486309886443787
【Twitter/X版】
Codex 新功能:用 Codex 管理 Codex UI——创建线程、搜索、组织、置顶、并行工作区。AI 开始管理自己的工具环境了。
#OpenAI #Codex #AI
https://x.com/gdb/status/2060486309886443787
3️⃣ Dwarkesh Patel 探讨模型在非可验证领域的泛化难题
作者: @dwarkesh_sp (Dwarkesh Podcast 主持人)
发布时间: 2026-05-30 03:04 (北京时间)
互动数据: ❤️ 630 | 🔄 19 | 💬 199
推文原文
What is the most compelling example of a task in a non-verifiable domains where models really struggle? That might hint at lack of generalization from verifiable to non-verifiable domains.
🧠 AI 深度分析
【核心要点】
Dwarkesh 提出了一个关键问题:AI 模型在可验证领域(如数学、编程)表现优异,但在非可验证领域(如哲学判断、创意评价、战略决策)可能缺乏真正的泛化能力。
【灵感启发】
这触及了 AI 能力的核心边界。可验证任务有明确的"正确答案”,模型可以通过强化学习优化;但非可验证任务依赖人类价值判断,模型可能只是在模仿表面模式而非真正理解。这解释了为什么 AI 在创意写作上能生成流畅文本,但难以做出真正有洞察力的评论。
【可实践建议】
在评估 AI 能力时,区分"可验证任务"和"非可验证任务"。对于后者,不要只看输出质量,还要看模型是否能解释其推理过程,以及是否能适应不同的价值框架。
📱 社交媒体文案
【即刻版】
一个扎心的问题 🤔:AI 在数学编程上越来越强,但在哲学、创意评价、战略决策这些"没有标准答案"的领域,真的理解了吗?Dwarkesh 这个问题引发了 199 条讨论。也许我们高估了"可验证领域"的表现,低估了"非可验证领域"的难度。真正的智能,可能在于处理不确定性。
#AI #AGI #哲学 #科技思考
参考链接:https://x.com/dwarkesh_sp/status/2060437027930403090
【Twitter/X版】
关键问题:AI 在非可验证领域(哲学、创意评价、战略决策)的表现如何?这可能揭示了从可验证到非可验证领域的泛化鸿沟。
#AI #AGI #MachineLearning
https://x.com/dwarkesh_sp/status/2060437027930403090
4️⃣ François Fleuret 的 RNN 训练突破
作者: @francoisfleuret (Meta FAIR 研究科学家)
发布时间: 2026-05-30 05:39 (北京时间)
互动数据: ❤️ 36 | 🔄 1 | 💬 4
推文原文
We trained those … things … we made them from sand. How dare they.
🧠 AI 深度分析
【核心要点】
François Fleuret 宣布他的新型 RNN(无需反向传播、无梯度消失问题、无并行化和 MFU 问题)已经开始训练(V0.1 和 V0.2 已上线)。这是对 Transformer 架构的潜在挑战。
【灵感启发】
如果 RNN 能解决梯度消失和并行化问题,它将比 Transformer 更适合长序列处理(线性复杂度 vs 平方复杂度)。这可能是架构层面的"范式转移"——就像当年 Transformer 取代 RNN 一样。Fleuret 的实验值得关注。
【可实践建议】
关注非 Transformer 架构的研究进展。如果 RNN 复兴,将改变整个 AI 基础设施:更长的上下文窗口、更低的推理成本、新的硬件优化方向。
📱 社交媒体文案
【即刻版】
Meta 科学家 François Fleuret 的新型 RNN 开始训练了!🔥 号称解决三大痛点:无反向传播、无梯度消失、无并行化问题。如果成功,这可能是 Transformer 的强劲对手——线性复杂度意味着更长的上下文、更低的成本。AI 架构的"复古创新"正在发生!
#AI #RNN #Transformer #Meta #深度学习
参考链接:https://x.com/francoisfleuret/status/2060476075243716838
【Twitter/X版】
Meta FAIR 的 François Fleuret 训练新型 RNN:无反向传播、无梯度消失、无并行化问题。可能是 Transformer 的替代方案?
#AI #DeepLearning #RNN
https://x.com/francoisfleuret/status/2060476075243716838
5️⃣ Anthropic 年化收入达 $470 亿的分析
作者: @fleetingbits
发布时间: 2026-05-30 08:05 (北京时间)
互动数据: ❤️ 29 | 🔄 0 | 💬 4
推文原文
some quick thoughts on anthropic at $47bn annual revenue run rate
- anthropic has grown at an annualized 2,240% since early april…
- it is quite possible that openai and anthropic will end up with $200bn - $250bn in combined annual revenue run rate by the end of 2026
🧠 AI 深度分析
【核心要点】
Anthropic 年化收入达 $470 亿,自 4 月初以来年化增长率达 2,240%。预计 OpenAI + Anthropic 2026 年底合计收入可能达 $2000-2500 亿。
【灵感启发】
AI 实验室的收入增长遵循"能力阶梯"模型:每当模型能力提升(如 Claude Code),就会创造新的使用场景和收入曲线。这与传统 SaaS 的线性增长完全不同——AI 是"能力解锁"驱动的指数增长。
【可实践建议】
如果你在做 AI 产品,思考"能力阶梯":你的产品是否在解锁新的使用场景?每个新能力是否创造了新的收入曲线?这比单纯优化现有功能更重要。
📱 社交媒体文案
**【即刻版】
Anthropic 年化收入 $470 亿!📈 从 4 月初的 $300 亿增长而来,年化增长率 2240%。更惊人的预测:OpenAI + Anthropic 2026 年底可能达到 $2000-2500 亿合计收入。AI 实验室的增长不是线性的,而是"能力解锁"驱动的阶梯式爆发。Claude Code 这类新产品正在创造全新的收入曲线!
#Anthropic #AI #商业分析 #Claude
参考链接:https://x.com/fleetingbits/status/2060512967930855693
【Twitter/X版】
Anthropic 年化收入达 $470 亿,自 4 月以来增长 2240%。预计 OpenAI + Anthropic 2026 年底合计达 $2000-2500 亿。AI 实验室的"能力阶梯"增长模式。
#Anthropic #AI #Business
https://x.com/fleetingbits/status/2060512967930855693
6️⃣ MIT 教授 Omar Khattab 分享稀疏检索新突破
作者: @lateinteraction (Omar Khattab, MIT CSAIL 助理教授)
发布时间: 2026-05-30 08:35 (北京时间)
互动数据: ❤️ 60 | 🔄 0 | 💬 7
推文原文
Late-interaction sparse retrieval? 😁
With neuron-level inverted indexing, on top of unsupervised sparse autoencoders. Works much better than directly training sparse retrievers.
🧠 AI 深度分析
【核心要点】
MIT 团队提出基于无监督稀疏自编码器的神经元级倒排索引方法,用于后期交互稀疏检索,效果优于直接训练稀疏检索器。
【灵感启发】
这是检索领域的"神经符号"融合:用神经网络(稀疏自编码器)学习表示,用符号方法(倒排索引)实现高效检索。这种混合架构可能是解决"准确 vs 效率"权衡的新方向。
【可实践建议】
如果你在做 RAG 系统,关注稀疏检索 + 密集检索的混合方案。稀疏检索在关键词匹配上更精确,密集检索在语义理解上更强,两者结合可能优于单一方案。
📱 社交媒体文案
【即刻版】
MIT 的检索新突破!🔍 用稀疏自编码器做神经元级倒排索引,实现"后期交互稀疏检索"。简单说:让神经网络学会"关键词提取",然后用传统倒排索引高效匹配。这是神经+符号的完美结合,RAG 系统的新选择!
#RAG #信息检索 #MIT #AI
参考链接:https://x.com/lateinteraction/status/2060520411138498679
【Twitter/X版】
MIT CSAIL 新研究:基于稀疏自编码器的神经元级倒排索引,用于后期交互稀疏检索。神经+符号混合架构的新进展。
#InformationRetrieval #AI #MIT
https://x.com/lateinteraction/status/2060520411138498679
7️⃣ LangChain 研究员 Viv 分享 Agent 开发心得
作者: @Vtrivedy10 (LangChain 应用研究)
发布时间: 2026-05-30 10:04 (北京时间)
互动数据: ❤️ 21 | 🔄 2 | 💬 7
推文原文
using a good Skill, a CLI, and seeing Codex’s in-context-learning ability is a magical experience
point it to Harbor skills repo, Prime Intellect CLI, gave it an objective of what we wanted to RL and just watched it chug along figuring out the whole setup and debugging weird niche errors
agents training agents 🔥 humans guiding the process
🧠 AI 深度分析
【核心要点】
Viv 分享了使用 Skill + CLI + Codex 的"魔法体验":给 Codex 一个目标,它就能自主理解代码库、配置环境、调试错误。人类从"执行者"转变为"监督者"。
【灵感启发】
“Agent 训练 Agent"可能是 AI 开发的未来模式:人类定义目标和约束,AI Agent 自主探索实现路径。这类似于"强化学习的人类反馈”(RLHF)的自动化版本——但这里的"反馈"是更高级别的指导。
【可实践建议】
尝试让 AI Agent 处理你熟悉但繁琐的任务(如配置新项目的开发环境)。观察它如何分解问题、调试错误。你会发现它的"思维方式",也能发现当前 Agent 的能力边界。
📱 社交媒体文案
【即刻版】
“Agent 训练 Agent"的时代来了!🔥 LangChain 研究员分享:给 Codex 一个目标 + Skill + CLI,它就能自己理解代码库、配置环境、调试错误。人类从"写代码"变成"定目标+看结果+做决策”。AI 开发的范式正在转移!
#AI #Agent #LangChain #Codex #自动化
参考链接:https://x.com/Vtrivedy10/status/2060542863344009695
【Twitter/X版】
LangChain 研究员分享:Skill + CLI + Codex 的"魔法体验"——给目标,AI 自主配置、调试、实现。“Agent 训练 Agent"模式初现。
#AI #Agent #LangChain #Codex
https://x.com/Vtrivedy10/status/2060542863344009695
8️⃣ Viv 探讨 Token 消耗与 Goal API 的未来
作者: @Vtrivedy10
发布时间: 2026-05-30 09:32 (北京时间)
互动数据: ❤️ 14 | 🔄 0 | 💬 4
推文原文
tokenmaxxing is a (poor) proxy for funneling intelligence to achieve user goals
been riffing on this but think I roughly believe that the form factor every Agent and Model Lab will have will be some sort of higher level Goal API - say what you want and how you want it and the agent decomposes your problem, spends a good chunk of compute and tries to achieve this goal
🧠 AI 深度分析
【核心要点】
Viv 提出"Goal API"概念:用户只需描述想要什么,Agent 自动分解问题、消耗计算资源、尝试达成目标。Token 消耗只是实现目标的手段,不应是用户关心的指标。
【灵感启发】
这是从"按量付费"到"按结果付费"的转变。就像云计算从"买服务器"到"买服务”,AI 可能从"买 Token"到"买结果"。这会改变整个商业模式:模型提供商将优化"结果达成率"而非"Token 效率"。
【可实践建议】
思考你使用 AI 的真正目标是什么。如果你关心的是"完成某个任务"而非"生成多少 Token",那么 Goal API 模式更适合你。尝试用更高层次的指令与 AI 交互。
📱 社交媒体文案
【即刻版】
从"买 Token"到"买结果" 🎯 Viv 提出"Goal API"概念:用户说想要什么,Agent 自动分解、执行、达成目标。Token 消耗只是手段,结果才是目的。这像极了云计算从"买服务器"到"买服务"的演进。AI 商业模式的下一个范式?
#AI #API设计 #商业模式 #科技趋势
参考链接:https://x.com/Vtrivedy10/status/2060534702193213853
【Twitter/X版】
“Goal API"概念:用户描述目标,Agent 自动分解并执行。从"按 Token 付费"到"按结果付费”,AI 商业模式的潜在演进。
#AI #API #BusinessModel
https://x.com/Vtrivedy10/status/2060534702193213853
📝 总结
本期 X List 精选展现了 AI 领域的几个关键趋势:
- Agent 架构进化:从静态工具加载到动态 Tool Search,从命令执行到 Goal API
- 元能力涌现:AI 开始管理自己的环境(Codex 管理 UI)、训练其他 AI
- 架构创新:RNN 可能复兴,稀疏检索 + 神经网络的混合方案
- 商业模式转变:从 Token 计费到结果计费,AI 实验室的指数级增长
生成时间:2026-05-30 12:00 (北京时间)
来源:X List (ID: 1597115448146898944)