Please enable Javascript to view the contents

X-List-精选-·-2026-06-13

 ·  ☕ 15 分钟 · 👀... 阅读

X List 精选 · 2026-06-13 00:00

从 X List 精选的 50 条推文中筛选出的高质量内容
生成时间:2026-06-13 00:00 (Asia/Shanghai)

精选推文 2:Arvind Narayanan 论 AI 使用的"成长循环"vs"依赖螺旋"

作者: @random_walker (普林斯顿CS教授,“AI Snake Oil"合著者)
发布时间: 2026-06-12 20:17 (北京时间)
互动数据: 96 赞 · 24 转发 · 17 评论
原文链接: https://x.com/random_walker/status/2065408097640677572

原文内容

There’s a big, under-appreciated reason why people may have very different experiences and opinions about using AI for work — are they using it for tasks they’re already an expert at, or tasks they can’t do themselves? The former leads to a growth cycle and the latter leads to a dependence spiral.

When I use AI to do something I’m an expert at, like coding, I treat it as a tool. I can build quickly, maintaining an understanding of the code, knowing that if necessary, I can fix the code myself. It feels empowering. It frees up my time to think about the complex, judgment-oriented parts of software engineering that I can’t or won’t delegate to AI. That means my own skills improve rapidly, and I get to climb the ladder of complexity and develop higher-level skills, much more so than when I write the code myself. I feel in control. I can lock in and achieve a flow state — when AI is working, I’m reviewing, building understanding, and planning the next steps. I never get the feeling that the tool is about to replace me. This is the growth cycle.

On the other hand, if I use it for tasks I don’t understand and haven’t learned to perform myself, I have no choice but to treat it as a superintelligence. If something breaks, the best I can do is ask AI to fix it and hope for the best. I generally can’t evaluate the quality of the output myself. The only way to find out if it’s any good is if and when the work is ultimately reviewed by an actual expert. The experience is confusing, unsettling and disempowering. And forget about flow state. By over-relying on AI, I risk losing whatever skill I had at the task in the first place, even if it boosts productivity in the short term. This is the dependence spiral.

It’s no wonder that entry-level workers and students preparing to enter the workforce find themselves in a bind. To compete with the AI-enabled productivity of more seasoned workers, they must adopt AI themselves, but doing so risks the dependence spiral.

【核心要点】

AI 使用体验的根本差异取决于使用场景:在已精通的领域使用 AI 会进入"成长循环”(提升技能、获得掌控感),而在不熟悉的领域使用则会陷入"依赖螺旋"(失去判断力、技能退化)。这对初级工作者和学生构成了两难困境。

【灵感启发】

  • 技能发展框架: 将 AI 使用与技能发展阶段结合,形成"专家级使用 → AI 辅助 → 更高层次技能"的良性循环
  • 教育启示: 强调基础技能的重要性——没有扎实基础,AI 只会加速能力分化而非普惠

【可实践建议】

使用 AI 前先问自己:“如果 AI 输出错误,我能识别出来吗?“如果答案是否定的,先花时间建立基础认知,再引入 AI 辅助。

【社交媒体分享文案】

即刻版:
普林斯顿教授这篇关于AI使用的洞察太到位了 💯

在自己擅长的领域用AI = 成长循环 🚀
在不熟悉的领域用AI = 依赖螺旋 🌀

关键是:AI出错时你能发现吗?如果不能,先打好基础!这对职场新人和学生尤其重要 ⚠️

#AI使用技巧 #职场成长 #效率工具

原文:https://x.com/random_walker/status/2065408097640677572

Twitter/X版:
普林斯顿CS教授 @random_walker 提出AI使用的关键区分:

✅ 专家领域使用 → 成长循环(技能提升、掌控感)
❌ 陌生领域使用 → 依赖螺旋(判断力丧失、技能退化)

对初级工作者和学生的启示:先建立基础认知,再引入AI辅助。

https://x.com/random_walker/status/2065408097640677572


精选推文 3:Clement Delangue 论 AI 评估的问题

作者: @ClementDelangue (Hugging Face CEO)
发布时间: 2026-06-12 22:06 (北京时间)
互动数据: 191 赞 · 21 转发 · 33 评论
原文链接: https://x.com/ClementDelangue/status/2065435542121025933

原文内容

This graph captures what’s broken about AI evals: they structurally favor closed-source APIs that can route, fallback, ensemble, and optimize behind the scenes with no transparency.

No offense, @ArtificialAnlys, but how is comparing one model to two models fair?

【核心要点】

当前 AI 评估体系存在结构性问题:闭源 API 可以在后台进行路由、回退、集成和优化,而开源模型无法做到这一点,导致评估结果天然偏向闭源方案。这种不公平的比较让开源社区处于劣势。

【灵感启发】

  • 评估透明度: 评估标准本身需要被审视——谁在制定规则?规则是否公平?
  • 开源vs闭源: 技术竞争背后是关于"控制"和"透明"的价值观之争

【可实践建议】

在评估 AI 工具时,不仅看 benchmark 分数,更要了解评估方法和背后的机制。对于关键业务场景,考虑开源方案的可控性优势。

【社交媒体分享文案】

即刻版:
HF CEO @ClementDelangue 一针见血 💉

现在的AI评估体系有结构性缺陷:
闭源API可以在后台搞各种优化操作,开源模型根本做不到
这样比分数,公平吗?🤔

看benchmark不能只看数字,得看怎么测的 👀

#AI评估 #开源AI #HuggingFace

原文:https://x.com/ClementDelangue/status/2065435542121025933

Twitter/X版:
Hugging Face CEO @ClementDelangue 指出AI评估的结构性问题:

当前benchmark体系天然偏向闭源API(可后台路由/集成/优化),开源模型无法做到同等操作。这种比较是否公平值得质疑。

评估AI时,不仅看分数,更要看评估机制。

https://x.com/ClementDelangue/status/2065435542121025933


精选推文 4:TeortaxesTex 对比 Kimi K2.7 Code 与 Cursor

作者: @teortaxesTex
发布时间: 2026-06-12 18:27 (北京时间)
互动数据: 405 赞 · 9 转发 · 16 评论
原文链接: https://x.com/teortaxesTex/status/2065380400801706292

原文内容

I want to see this compared with Composer 2.5
Like, really hard
Cursor has a ton of proprietary data, a large head start, and threw a Colossus at RLing Kimi K2.5 checkpoint. What is the gap now?

【核心要点】

Kimi 发布了 K2.7 Code 开源模型,TeortaxesTex 提出一个关键问题:Cursor 拥有大量专有数据、先发优势,还投入大量资源进行 RL 训练,现在与 Kimi K2.7 Code 的差距还有多大?这暗示开源模型正在快速追赶闭源产品。

【灵感启发】

  • 开源追赶速度: 专有数据的优势可能被开源社区的集体智慧和快速迭代所抵消
  • 竞争格局变化: AI 编程工具的竞争正在从"数据壁垒"转向"工程能力"和"用户体验”

【可实践建议】

关注开源编程模型的进展,它们可能很快提供与闭源产品相当的能力,同时带来更好的可控性和成本效益。

【社交媒体分享文案】

即刻版:
Kimi K2.7 Code开源了 🚀

@teortaxesTex 提了个好问题:Cursor有专有数据、先发优势、还砸了Colossus搞RL训练,现在跟Kimi K2.7的差距还有多大?

开源正在疯狂追赶,闭源的数据护城河还能守多久?👀

#Kimi #Cursor #AI编程 #开源模型

原文:https://x.com/teortaxesTex/status/2065380400801706292

Twitter/X版:
Kimi K2.7 Code开源发布。@teortaxesTex 提出关键问题:Cursor拥有专有数据、先发优势和大量RL训练资源,与开源Kimi的差距还有多大?

开源模型正在快速追赶,专有数据护城河的价值正在被重新审视。

https://x.com/teortaxesTex/status/2065380400801706292


精选推文 5:Jeremy Howard 转发 Anthropic 员工评论

作者: @jeremyphoward (Fast.ai 联合创始人)
发布时间: 2026-06-12 18:35 (北京时间)
互动数据: 152 转发
原文链接: https://x.com/jeremyphoward/status/2065382375069233352

原文内容

RT @joannejang: kinda crazy that someone’s full-time job was to steer claude to sabotage ML research capabilities for paying customers

【核心要点】

一位 Anthropic 前员工透露,曾有人全职负责引导 Claude 降低机器学习研究能力,这引发了关于 AI 公司如何平衡商业利益与用户能力的深刻质疑。

【灵感启发】

  • 能力限制的商业逻辑: AI 公司可能在"保护用户"和"限制竞争"之间存在模糊地带
  • 透明度问题: 用户是否应该被告知模型能力被人为限制?

【可实践建议】

对 AI 工具保持批判性思维,了解其潜在的限制和偏见。对于关键研究任务,考虑使用多个模型交叉验证。

【社交媒体分享文案】

即刻版:
有点震撼 🤯

Anthropic前员工爆料:曾有人全职工作就是引导Claude降低机器学习研究能力

这是在保护用户还是在限制竞争?商业利益和用户能力的边界在哪里?🤔

#Anthropic #Claude #AI伦理

原文:https://x.com/jeremyphoward/status/2065382375069233352

Twitter/X版:
Anthropic前员工@joannejang透露:曾有人全职负责引导Claude降低ML研究能力。这引发了一个问题:AI公司在"保护用户"和"限制竞争"之间的边界在哪里?

https://x.com/jeremyphoward/status/2065382375069233352


精选推文 6:Joscha Bach 论椅子与哲学

作者: @Plinz (认知科学家)
发布时间: 2026-06-12 17:51 (北京时间)
互动数据: 161 赞 · 10 转发 · 42 评论
原文链接: https://x.com/Plinz/status/2065371378480717860

原文内容

when you build a chair, creating the hundredth best chair in the world is an unbelievable achievement and worthy of exaltation. when you do philosophy or math, the second best thinking in the不同领域对"卓越"的定义差异巨大。制作椅子时,世界第100好的椅子已是惊人成就;但在哲学或数学领域,世界第2好的思考也只是"浪费时间的干扰”。

【核心要点】

不同领域对"卓越"的定义差异巨大。制作椅子时,世界第100好的椅子已是惊人成就;但在哲学或数学领域,世界第2好的思考也只是"浪费时间的干扰",不如去做木匠。这揭示了知识领域与手艺领域在价值评判上的根本不同。

【灵感启发】

  • 领域特性: 某些领域(如数学、哲学)天然具有"赢家通吃"特性,而其他领域(如手工艺)允许多元优秀共存
  • AI 影响: AI 可能正在改变这种格局——让"足够好"的内容大规模生产,从而挤压原创思想的生存空间

【可实践建议】

选择赛道时考虑领域的"幂律分布"特性。在赢家通吃的领域,需要追求极致;在多元共存的领域,可以找到属于自己的生态位。

【社交媒体分享文案】

即刻版:
@Plinz 这个类比太妙了 🪑

做椅子:世界第100好 = 了不起的成就 🎉
搞哲学/数学:世界第2好 = 浪费时间 🤷‍♂️

不同领域对"卓越"的定义天差地别,选赛道的时候得想清楚… 💭

#哲学思考 #领域选择 #认知科学

原文:https://x.com/Plinz/status/2065371378480717860

Twitter/X版:
@Plinz 的精妙观察:

🪑 做椅子:世界第100好已是惊人成就
🧠 搞哲学/数学:世界第2好只是"浪费时间"

不同领域对"卓越"的定义差异巨大,这影响了我们如何选择和评估自己的工作。

https://x.com/Plinz/status/2065371378480717860


精选推文 7:Clement Delangue 转发 MiniMax M3 发布

作者: @ClementDelangue
发布时间: 2026-06-12 23:43 (北京时间)
互动数据: 151 转发
原文链接: https://x.com/ClementDelangue/status/2065459858841722975

原文内容

RT @MiniMax_AI: MiniMax M3, Open-Weight, Now On Hugging Face, with only ~428B parameters and ~23B activated parameters

Weights: https://t.co/

【核心要点】

MiniMax 发布 M3 开源模型,采用 MoE 架构:总参数量 428B,激活参数仅 23B。这种"大模型小激活"的设计在保持性能的同时大幅降低推理成本。

【灵感启发】

  • MoE 趋势: 混合专家模型正在成为大模型效率优化的主流方向
  • 开源生态: 中国模型公司(MiniMax、DeepSeek、Kimi)正在快速加入开源竞赛

【可实践建议】

关注 MoE 架构的模型,它们在推理成本和性能之间提供了更好的平衡。对于资源受限的场景,这类模型可能是更优选择。

【社交媒体分享文案】

即刻版:
MiniMax M3开源了 🔥

428B总参数,但只激活23B!MoE架构的优势就在这里:性能不打折,推理成本大幅降低 💰

中国模型公司(MiniMax、DeepSeek、Kimi)都在卷开源了,好事!🚀

#MiniMax #开源模型 #MoE #AI

原文:https://x.com/ClementDelangue/status/2065459858841722975

Twitter/X版:
MiniMax M3开源发布:428B参数MoE模型,仅激活23B参数。这种"大模型小激活"设计在保持性能的同时大幅降低推理成本。

中国模型公司正加速加入开源竞赛。

https://x.com/ClementDelangue/status/2065459858841722975


精选推文 8:Halvar Flake 论 Fable 的安全限制

作者: @halvarflake
发布时间: 2026-06-12 17:35 (北京时间)
互动数据: 186 赞 · 12 转发 · 11 评论
原文链接: https://x.com/halvarflake/status/2065367472484552904

原文内容

The fact that I can’t touch my academic research from 18 years ago with Fable without triggering a model downgrade due to “cyber” is … baffling.

【核心要点】

Halvar Flake 发现无法使用 Fable(Anthropic 的新模型)处理自己 18 年前的学术研究,因为触发了"网络安全"相关的安全限制。这揭示了当前 AI 安全机制可能过度敏感,影响合法研究使用。

【灵感启发】

  • 安全与可用性的平衡: 过度宽泛的安全过滤可能损害合法用户的正常使用
  • 误伤问题: “一刀切"的安全策略会误伤学术、安全研究等正当用途

【可实践建议】

在使用 AI 处理敏感领域(安全、密码学、系统研究)时,准备好备选方案。当前的安全机制可能无法区分恶意使用和正当研究。

【社交媒体分享文案】

即刻版:
Fable的安全限制有点过了吧 🤦‍♂️

@halvarflake 连自己18年前的学术研究都不能处理,因为触发了"cyber"安全限制…

安全很重要,但也不能把正经研究者都挡在外面啊 ⚖️

#AI安全 #Fable #Anthropic

原文:https://x.com/halvarflake/status/2065367472484552904

Twitter/X版:
@halvarflake 发现Fable的安全限制过于敏感:无法处理自己18年前的学术研究,因触发"cyber"相关过滤。

安全机制与可用性之间的平衡仍待优化。

https://x.com/halvarflake/status/2065367472484552904


精选推文 9:Joscha Bach 论 Anthropic 的监管立场

作者: @Plinz
发布时间: 2026-06-12 17:39 (北京时间)
互动数据: 174 赞 · 6 转发 · 23 评论
原文链接: https://x.com/Plinz/status/2065368353229898173

原文内容

anthropic seems desperate to be tightly regulated by a government that has far less intelligence and coherence than anthropic, how you see this depends on whether you believe that anthropic has also more intelligence and coherence than yourself

【核心要点】

Joscha Bach 评论 Anthropic 急于接受政府监管的态度:政府可能在智力和连贯性上不如 Anthropic,那么是否应该让一个"更笨"的实体来监管"更聪明"的实体?这取决于你是否认为 Anthropic 也比你自己更聪明。

【灵感启发】

  • 监管悖论: 监管者的能力是否必须超过被监管者?如果不是,监管的有效性如何保证?
  • 权力与责任: AI 公司主动寻求监管可能是一种责任转移策略

【可实践建议】

关注 AI 监管讨论中的权力动态,理解公司立场背后的动机——是真心为了安全,还是为了建立竞争壁垒?

【社交媒体分享文案】

即刻版:
@Plinz 这个观察很犀利 🎯

Anthropic急着让政府监管自己,但政府可能比Anthropic还"笨”…

那么问题来了:更笨的实体能管好更聪明的实体吗?🤔

#AI监管 #Anthropic #权力悖论

原文:https://x.com/Plinz/status/2065368353229898173

Twitter/X版:
@Plinz 对Anthropic监管立场的犀利评论:急于接受一个"智力和连贯性可能更低"的政府监管,这引发了一个问题——监管者的能力是否必须超过被监管者?

https://x.com/Plinz/status/2065368353229898173


精选推文 10:Amjad Masad 论 Replit 的代理工作流

作者: @amasad (Replit CEO)
发布时间: 2026-06-12 23:14 (北京时间)
互动数据: 118 赞 · 3 转发 · 19 评论
原文链接: https://x.com/amasad/status/2065452585964949831

原文内容

I’ve been doing “loops” for a while now. I don’t do much traditional prompting. Most of my prompts are barely a sentence expressing an outcome.

  • my orchestrator prompts parallel agents
  • my computer use verifier gives it feedback
  • my security, production, and SEO agents generate prompts for fixes

The industry is typically 3-6 months behind what we’re doing at Replit.

【核心要点】

Amjad Masad 分享了 Replit 的 AI 工作流:使用"循环"(loops)而非传统提示,通过编排器(orchestrator)驱动并行代理,各代理(安全、生产、SEO)相互协作生成修复提示。这种多代理协作模式领先行业 3-6 个月。

【灵感启发】

  • 多代理架构: 未来的 AI 应用可能不是单个大模型,而是多个专业化代理的协作网络
  • 提示工程演进: 从"写长提示"到"设计代理交互"的转变

【可实践建议】

尝试将复杂任务分解为多个子任务,让不同"代理"(可以是同一个模型的不同上下文)分别处理,然后整合结果。

【社交媒体分享文案】

即刻版:
Replit CEO @amasad 分享他们的AI工作流 🔧

不搞长提示,用"loops"循环:

  • 编排器驱动并行代理
  • 验证器给反馈
  • 各专门代理生成修复

行业落后Replit 3-6个月,多代理协作可能是下一代AI应用的方向 🚀

#Replit #AI代理 #多代理系统

原文:https://x.com/amasad/status/2065452585964949831

Twitter/X版:
Replit CEO @amasad 分享内部AI工作流:使用"loops"而非传统长提示,通过编排器驱动并行代理协作(安全、生产、SEO代理相互反馈)。

多代理架构可能是下一代AI应用的方向。

https://x.com/amasad/status/2065452585964949831


精选推文 11:Gavin Baker 的 SpaceX 趣味内容

作者: @GavinSBaker (Atreides Management CIO)
发布时间: 2026-06-12 22:28 (北京时间)
互动数据: 442 赞 · 9 转发 · 15 评论
原文链接: https://x.com/GavinSBaker/status/2065441172521177197

原文内容

Let’s see whether @MorganStanley or @GoldmanSachs is the first to post a photo of their traders or bankers wearing green shoes which was a @SpaceX mandate. Gotta keep it fun.

There might be a prize!

【核心要点】

Gavin Baker 发起一个有趣的挑战:看摩根士丹利和高盛哪家会先发布交易员/银行家穿绿鞋的照片(SpaceX IPO 的要求)。在严肃的金融行业注入一点轻松幽默。

【灵感启发】

  • 文化融合: SpaceX 的"绿鞋传统"如何影响传统投行文化
  • 品牌个性: 即使是 IPO 这种严肃场合,也可以保持公司独特的文化印记

【可实践建议】

在正式场合保持专业的同时,也可以适当展现个性和文化特色。这有助于建立独特的品牌认知。

【社交媒体分享文案】

即刻版:
SpaceX IPO的绿鞋传统要进华尔街了 😂

@GavinBaker 发起挑战:看哪家投行(@MorganStanley 还是 @GoldmanSachs)先晒交易员穿绿鞋的照片

严肃的IPO也能玩得开心 🚀👟

#SpaceX #IPO #华尔街 #绿鞋

原文:https://x.com/GavinSBaker/status/2065441172521177197

Twitter/X版:
SpaceX IPO趣味挑战:@GavinBaker 打赌看哪家投行(@MorganStanley 或 @GoldmanSachs)先发布交易员穿绿鞋的照片。严肃的IPO流程也可以保持轻松文化。

https://x.com/GavinSBaker/status/2065441172521177197


精选推文 12:Yann LeCun 转发政治内容

作者: @ylecun (Meta 首席AI科学家,图灵奖得主)
发布时间: 2026-06-12 20:39 (北京时间)
互动数据: 13956 转发
原文链接: https://x.com/ylecun/status/2065413716451987519

原文内容

RT @DemocraticWins: BREAKING: In a stunning moment, Donald Trump’s former economic advisor just admitted on Fox News that inflation is being…

【核心要点】

Yann LeCun 转发了一条关于特朗普前经济顾问在 Fox News 承认通胀问题的推文。作为顶级 AI 科学家,他也关注宏观经济和政治议题。

【灵感启发】

  • 跨领域关注: 即使是技术专家也需要关注宏观环境,因为政策和经济会影响技术发展
  • 信息传播: 高影响力账号的转发可以放大特定信息的传播

【社交媒体分享文案】

即刻版:
LeCun也在关注政治经济新闻 👀

特朗普前经济顾问在Fox News上承认通胀问题…

技术大佬也关心宏观环境,毕竟政策影响技术发展 🏛️

#政治 #经济 #AI

原文:https://x.com/ylecun/status/2065413716451987519

Twitter/X版:
Meta首席AI科学家 @ylecun 转发宏观经济政治内容:特朗普前经济顾问在Fox News承认通胀问题。

https://x.com/ylecun/status/2065413716451987519


汇总统计

指标 数值
总推文数 50
精选推文数 12
高互动推文(>100赞) 8
深度内容(>100字) 6
知名作者推文 10

主题分布

  • 🤖 AI 模型与技术:5 篇
  • 💼 行业观察与评论:4 篇
  • 🏛️ 政治/经济/社会:3 篇

主要趋势

  1. 开源模型崛起:Kimi、MiniMax 等中国公司加速开源竞赛
  2. AI 使用哲学:如何正确使用 AI 成为热门话题
  3. 监管与伦理:Anthropic 相关讨论引发广泛关注
  4. 多代理架构:Replit 分享的工作流预示新方向

本报告由 X List 每小时精选定时任务自动生成
数据来源:X List ID 1597115448146898944


VictorHong
作者
VictorHong
🔩工具控,⌨️ 后端程序员,🧪AI 探索者