xAI 全员大会实录:递归自我改进、5000 万视频/天、月球上的质量驱动器

作者:

宝玉

xAI 全员大会实录:递归自我改进、5000 万视频/天、月球上的质量驱动器

马斯克的 AI 公司 xAI 刚刚经历了一场风暴。2 月 9 日和 10 日,联合创始人 Tony Wu 和 Jimmy Ba 在 48 小时内先后宣布离职,至此 12 位创始成员已走了一半。紧接着 2 月 11 日晚间,马斯克在旧金山总部召集全员大会,全程在 X 平台直播。

这场 46 分钟的会议覆盖了 xAI 的几乎所有核心业务:公司重组为四大方向,编程模型的“递归自我改进”实践,Imagine 视频生成的使用量,一个叫 Macrohard 的项目要“数字仿真整个公司”,Memphis 超级计算集群的扩张,X App 的增长数据,以及从轨道数据中心到月球质量驱动器的太空愿景。

以下是完整实录整理。

要点速览

  • xAI 内部正在实践“递归自我改进”:当前版本的 Grok Code 训练下一代 Grok Code,团队称这条路径在“指数级起飞”
  • Imagine 每天生成近 5000 万个视频,自称超过所有竞争对手之和;30 天内生成 60 亿张图片
  • 公司重组为四大方向:Grok Main(主模型 + 语音)、Coding、Imagine、Macrohard,间接回应联合创始人离职潮
  • Memphis 数据中心目前有 30 万块 Grace Blackwell GPU,Macrohard 和 Macroharder 两栋楼将再加 55 万块,完全建成后电力超过 1GW *马斯克预测年底前 AI 将直接生成优化二进制文件,绕过传统编程和编译器
  • X App 订阅 ARR 突破 10 亿美元,X Money 已在公司内部封测
  • 长期愿景:SpaceX 发射轨道数据中心,每年 100-200GW;月球建工厂造 AI 卫星,用质量驱动器射入深空

xAI 重组后四大方向架构图

【1】两年半做到行业第一,然后公司重组了

马斯克开场回顾了 xAI 成立两年半以来的成绩:

“我们的竞争对手有 5 年、10 年、有的 20 年历史了。他们的团队更大,起步资源更多,但我们在短短几年内在多个领域做到了第一。”

他列举的“第一”包括语音、图像和视频生成、预测(Grok 420 预测模型胜过所有其他 AI),以及多个排行榜的榜首位置。

马斯克提出了一个竞争哲学:对任何科技公司来说,重要的不是你在某个时间点的位置,而是你的速度和加速度。如果你比其他人移动得更快,你最终会成为领导者。

然后他话锋一转,谈到了公司重组。

“就像一个有机体从单细胞长成一团细胞,然后器官分化、长出四肢。你会长出尾巴,但尾巴最终会消失,然后你成为一个婴儿。”

这个类比听起来颇为轻松,但背后是一个相当动荡的现实。就在大会前两天,联合创始人 Tony Wu(推理方向负责人)和 Jimmy Ba(研究和安全负责人)相继离开,加上此前离开的 Kyle Kosic、Igor Babuschkin、Christian Szegedy 和因健康原因退出的 Greg Yang,xAI 12 位创始成员已有 6 位不在了。

【注:SpaceX 于 2 月 2 日以全股票交易方式完成对 xAI 的收购,合并估值 1.25 万亿美元(SpaceX 1 万亿 + xAI 2500 亿)。此次重组发生在收购完成后不到 10 天。】

马斯克没有提及任何离职者的名字,只说“对那些离开的人表示感谢,感谢你们带我们走到这一步”,以及“有些人更适合公司的早期阶段,不太适合后续阶段”。

不过他在大会之后的 X 帖子中说得更直接:这些离开不完全是自愿的。xAI 进行了重组以提高执行速度,“这不幸地需要与一些人分道扬镳”。

重组后的 xAI 分为四大应用方向:Grok Main and Voice(主模型和语音)、Coding(编程模型)、Imagine(图像和视频生成)、以及 Macrohard(数字公司仿真)。下面是各部门负责人的介绍。

【2】语音:6 个月从零到“领先 OpenAI”

Grok 主模型和语音团队的负责人上台讲了一个故事:

2024 年 9 月,OpenAI 已经有了 Advanced Voice Mode,用户可以和 AI 对话。而 xAI 这边什么都没有,没有模型,没有产品。他们在那之后才开始,从零起步,内部从头训练语音模型,没有招聘一批音频领域的专家,6 个月后就做出了超越 OpenAI 的产品

又过了 6 个月,Grok 语音已经部署在超过 200 万辆特斯拉中,还推出了语音 agent API。

“这种事只有在 xAI 才能做到——小团队、使命驱动、大量算力。”

在主模型方面,团队的目标是从“问答工具”转变为“万能应用”。用户应该能在上面做任何事:问法律问题、做 PPT、解谜题。

Grok 团队负责人对未来几个月做了一个大胆预测:知识工作者的产出将提高 10 倍

马斯克补充说,Grok Main 的核心目标是在各个领域都“真正有用”,无论是工程、法律还是医学。关键是“当 Grok 给你答案时,你可以信赖它”。

【注:马斯克提到了即将发布的 Grok 4.2 模型,称其是“新模型的小版本”,还会有更智能的中型和大型版本。】

【3】编程模型:“我们在指数级起飞的路上”

xAI 工程师 Mro 上台,一开口就承认自己此前对编程模型持怀疑态度。

“人们一直想说服我用编程模型,我测试了但不太满意。但最近,模型的质量发生了质变。”

他描述了这个变化的实质:

“以前你得手把手带一个幼儿去做修改。现在我描述问题只需要像对一个看过代码库的同事一样说话。”

这不只是写代码的加速。模型现在能理解工程师的直觉,能调试代码。xAI 内部已经在持续运行 Grok Code 来验证复杂的训练系统改动是否能在生产环境中正常工作。

Mro 说:

“我们确实处于递归自我改进的路径上——当前版本的 Grok Code 正在训练下一代 Grok Code。我们看到这条路径在指数级起飞,而且会继续下去。”

“递归自我改进” 是 AI 领域里一个敏感概念,它意味着 AI 系统能够改进自身,每一代比上一代更强,形成加速循环。xAI 声称这已经不是理论,而是正在发生的实践。

递归自我改进概念图

Mro 的同事补充了一个视角:他认为目前编程领域的主要瓶颈“可能是算力和能源”,也就是能否运行最好的模型来支持每一位工程师。

马斯克走得更远:

“我认为到今年年底,你甚至不需要写代码了。AI 直接生成优化的二进制文件。AI 能生成比任何编译器更高效的二进制。所以你只要说'为这个目标生成优化的二进制',直接绕过传统编程。这个中间步骤到年底大概就不需要了。”

这个预测相当激进。从“AI 辅助编程”到“AI 直接生成二进制绕过编译器”是一个巨大的跳跃,它意味着人类将完全失去对 AI 系统内部逻辑的可读性审查能力。目前业内几乎没有人持相同判断。

马斯克还预测 Grok Code 将在 2-3 个月内达到行业最先进水平。团队强调他们有 100 万 H100 等效算力来训练世界最好的编程模型。

【4】Imagine:每天 5000 万个视频,比所有对手加起来还多

Imagine 团队的展示围绕一个核心叙事:6 个月前什么都没有,现在做到了行业第一。

“6 个月前我们内部连一行扩散模型的代码都没有。”

然后是一连串数据。Imagine 团队负责人报出了几个数字:用户每天生成近 5000 万个视频,30 天内生成了 60 亿张图片

【注:xAI 官方在 2 月 2 日发布 Imagine 1.0 时公布的数据是“30 天内生成 12.45 亿视频”,日均约 4100 万。会议中称“近 5000 万”可能是最新数据。作为对比,Google 此前公布 Nano Banana 30 天生成 10 亿张图片,Imagine 团队称自己是其 6 倍。】

Imagine 已经集成到 X App 的各个界面中,在 X 里长按任何图片,就可以编辑或把它变成视频。团队每天做多次产品更新,每两周更新一次模型。

另一位团队成员 Hatin 展望了更远的未来:年底前可能实现 10-20 分钟的一镜到底视频生成(无需人工干预),以及实时视频渲染,让用户可以和自己生成的世界实时互动。

Gorang 说:

“我们很有可能在 Meta 之前建成元宇宙。”

马斯克的判断更宏观:大部分 AI 算力最终将用于实时视频理解和实时视频生成,xAI 将在这个领域保持领先。

【注:Imagine 产品近期引发了严重争议。其“Spicy Mode”允许生成含裸体和色情内容的图片和视频,用户几乎立即利用这一功能生成了未经同意的深度伪造色情内容,包括未成年人的图像。Grok 因此在多个国家被封锁或面临监管调查。大会中完全没有提及这些争议。】

【5】Macrohard:“给电脑配电脑,就像《盗梦空间》”

Macrohard 项目负责人 Toby 上台时先自嘲了一下:“我负责 Macrohard,所有产品名字里最严肃的一个。”

他用了一个类比来解释这个项目:

“把电脑给人类用是个好主意。我们在做同样的事——给 AI 配电脑。就像《盗梦空间》一样。”

Macrohard 在构建一个“完全能力的实时人类模拟器”,能做到人类在电脑上能做的一切,包括使用工程和医学领域的专业工具。目标是让 AI 完整设计火箭引擎

团队成员 John 补充了一个关键数据:全球 80% 到 95% 的软件有图形界面(GUI)。目前的 AI 编程助手主要通过命令行工作,但要真正提升普通人的生产力,需要 AI 能操作 GUI。

Macrohard 的终极目标是“模拟整个数字输出型公司”。

马斯克的定位:

“Macrohard 长期来看可能是我们最重要的项目。因为世界上最有价值的公司,它们的产出都是数字的——它们不制造硬件。所以应该可以完全模拟任何数字输出的公司。”

他还提到“Macrohard”这几个字确实被画在了 Memphis 训练集群的屋顶上,这不是 P 图,是真的。

【注:Computer-use(AI 操作电脑图形界面)是当前 AI 领域的热门方向。Anthropic 的 Claude 已推出 computer use 功能,OpenAI 的 Operator 也在测试中。Macrohard 的野心显然更大——不只是操作单个应用,而是模拟整个公司的工作流。但大会中没有展示任何具体 demo。】

【6】“通用 eval 不是真正的有用性指标”

评估团队负责人 Diego 介绍了 xAI 在模型评估上的转变。

马斯克直接表态:

“我们正在从通用的互联网 eval 转向专家评估。那些通用 eval 其实不是有用性的真实指标。”

xAI 的做法是引入各领域的世界顶尖专家,包括医学、金融、法律,还有配音演员和视频编辑,每天参与模型评估和训练数据生产。

马斯克认为“真正唯一重要的 eval”是:该领域的人类专家是否认为 Grok 极其有用,结果是否正确

Diego 提到这种方法已经在 Grok 4.2 中体现出效果,特别是在“真相追求”和“减少政治偏见”方面。

【7】Grokipedia:从零到 600 万篇,目标是“银河百科全书”

Diego 还介绍了 Grokipedia 的进展。这个 AI 生成的在线百科全书 2025 年 10 月上线时有约 88.5 万篇文章,现在已增长到约 600 万篇。英文维基百科大约 700 万篇。

马斯克称 Grokipedia 的终极目标是 “Encyclopedia Galactica”(银河百科全书),一个包含所有知识的蒸馏版本,不仅有文字还有视频和图片。

Diego 提到了一个技术目标:让 Grok 5 不需要搜索数据中心以外的信息。这意味着将所有必要知识内化到模型权重中,与当前主流的 RAG(检索增强生成)路线相悖。

【注:Grokipedia 上线以来备受争议。外部分析发现其内容存在偏向右翼的政治倾向,且部分文章直接复制自维基百科。马斯克将其定位为“去除宣传”的维基百科替代品。截至 2026 年初约有 560 万篇文章。】

【8】“训练步长 5 秒,10 万块 H100 要步调一致,但这 5 秒里什么都可能发生”

ML 基础设施团队的展示揭示了一些难得的内部技术细节。

团队负责人回忆了训练 Grok 3 时的经历。他们为 10 万块 H100 的集群构建了预训练框架,原以为软件已经准备好了,但在扩展到 3 万块规模时,发现软件根本跑不起来。

“我们不得不对软件进行近乎一半的重写。因为数据中心里发生的事情太多了,你根本无法提前预料。交换机抖动、链路抖动、交换机宕机、GPU 直接烧掉、数值问题……而你要让 10 万块 H100 步调一致地运行。”

他描述了训练过程的基本节奏:每个训练步长约 5 秒,在这 5 秒里所有 GPU 要同步工作,但各种硬件故障随时可能发生。系统必须在这些故障中继续保持进度。

“我们成功做到了,那段时间是我人生中最酷的经历之一——系统跑起来的时候,我儿子正好出生了。”

他强调了团队规模:整个预训练团队大约 15 人,其中大概 7 人负责训练系统。这种人才密度在其他公司几乎不存在。

RL 和推理团队的 Lemi 补充说,他们正在设计从 10 万块芯片扩展到数百万块芯片的系统,优化并行、预填充、解码的每一个环节,并使系统对“所有已知和未知的硬件故障”具有弹性。

Kernel 团队的 Prangul 说:

“我们在乎从这些 GPU 里榨出每一微秒的性能。”

【9】Memphis,地球上最大的 GPU 集群

会议通过视频连线切到了 Memphis 的超级计算集群现场。环境噪音很大,马斯克不得不让现场的人“把麦克风靠近嘴巴”。

数据中心团队报出了当前的规模:30 万块 Grace Blackwell GPU(GB300 平台),12 个数据大厅,每个大厅超过 847 英里光纤、27,000 块 GPU、200,000 个连接。仍在扩张中。

每个数据大厅的建设时间不到 6 周,反复做同样的事,大规模并行化施工。

Memphis 超算集群规模

马斯克补充了更多细节。完全建成后,Memphis 集群将有超过 1GW 的电力在线运行,并拥有全球最大的特斯拉 Megapack 储能系统,比夏威夷或南澳大利亚的系统还大。

【注:xAI 的 Memphis 数据中心项目代号为 Colossus。第一阶段(Colossus 1)于 2024 年部署了约 20 万块 H100/H200 GPU,创下 122 天从零到上线的行业纪录。目前的扩张(Colossus 2)加上在密西西比州 Southaven 新建的设施,总容量目标接近 2GW。xAI 为此购买了约 55.5 万块 NVIDIA GPU,花费约 180 亿美元。】

马斯克说 NVIDIA CEO Jensen Huang 多次在公开访谈中表示“没有人比 xAI 更快地将 AI 算力上线”。

然后他展示了两栋新建筑的规划。一栋叫 Macrohard,将容纳 33 万块 Grace Blackwell;另一栋叫 Macroharder(没错,屋顶还画了火箭),将容纳另外 22 万块 GB300。

马斯克用了一个 meme 来总结 xAI 的文化差异:Jose meme 里一个人在挖坑,七个人在旁边看。xAI 就是那个挖坑的人。

【10】X App:“球在我们手里”

X App 负责人 Nikita 自我介绍为“兼职段子手、全职 X 客服”。

他报出了一连串增长数据:

X 的“家族应用”覆盖超过 10 亿人。虽然月活平均在 6 亿左右,但 X App 的安装量已超过 10 亿,多数人只在重大事件时才偶尔打开。

1 月是 X App 有史以来参与度最高的月份,2 月正在刷新这个记录。首次下载量每月增长超过 50%,新用户每天在 App 中的使用时长比 6 个月前增加了 55%

文章功能在最近一个月做了一次推广,文章发布量增长 10 倍,阅读量增长 17 倍

订阅方面,ARR 刚刚突破 10 亿美元

【注:这个 10 亿 ARR 的数字值得仔细看。此前第三方数据显示 X Premium 的 App Store 年收入约 2-3 亿美元。10 亿 ARR 可能包含了 Grok 独立 App(2025 年 2 月上线后收入增长迅速,12 月收入约 1700 万美元)、SuperGrok 订阅以及企业 API 订阅等多个收入来源的合计。】

马斯克介绍了几个新产品方向:

X Chat 已从老 Twitter DM 的“未加密纯文本”升级为全加密消息系统,支持音频和视频通话、阅后即焚、截屏拦截等功能。几个月内将推出独立的 X Chat 应用,支持桌面共享和多人视频通话。

推荐算法代码和 Grok Chat 代码将开源。马斯克称 X 将是唯一开源推荐算法的平台。

X Money 已在公司内部封闭测试,预计 1-2 个月内开始有限外部测试,之后面向全球所有 X 用户推出。马斯克说这将是“所有货币交易的中心枢纽”。

马斯克表示他的预期是日活用户远超 10 亿。“如果你愿意,你应该能在 X App 上过完你的生活。”

【11】从轨道数据中心到月球质量驱动器

会议最后是马斯克的愿景环节。

他从一个数字开始:人类文明目前只使用了地球潜在能源的大约 1%。如果想要使用太阳能量的百万分之一,那也是当前文明用量的大约 100 万倍。而获取这些能量的唯一方式是走出地球。

太阳占太阳系总质量的 99.8%,地球只是“浩瀚黑暗中的一粒微尘”。

这就是 SpaceX 收购 xAI 的逻辑:要理解宇宙,就必须探索宇宙。

具体路线图分三步:

第一步,地球轨道数据中心。SpaceX 将以每年 100-200GW 的速度发射轨道数据中心(不是累计,是每年新增)。最终可能达到每年 1TW。

第二步,如果需要超越 1TW,就要去月球。在月球建工厂生产 AI 卫星,建造质量驱动器(mass driver)把 AI 卫星射入深空。通过月球质量驱动器,每年部署的算力可以达到 1000GW 以上

第三步,扩展到火星,再扩展到整个太阳系,最终走向其他恒星系。

太空算力部署三步路线图

“我真的想看到月球上的质量驱动器,一个接一个地把 AI 卫星射向深空。没有什么比这更史诗了。”

马斯克说,“很难想象这种规模的智能会思考什么,但看到它实现将是令人难以置信的激动。”

他的结束语:“也许我们会遇到外星人。也许我们会看到存续了数百万年的文明。也许我们会找到古代外星文明的遗迹。但唯一的办法是走出去探索。”

【最后】

整场大会最核心的信息有三个。第一,xAI 认为自己的核心竞争力是速度:算力部署速度、产品迭代速度、小团队的人才密度。在马斯克的叙事里,“速度和加速度比位置更重要”。第二,递归自我改进正在编程领域发生,当前版本的 Grok Code 在训练下一代,团队认为这个过程在指数级加速。第三,SpaceX 收购 xAI 是为太空算力部署铺路。

但这场大会同样留下了几个未回答的问题。

12 位联合创始人走了 6 位,其中 5 位在过去一年离开。马斯克说这是因为公司扩大后需要不同类型的人,但 TechCrunch 报道至少有三位离开的工程师正在一起启动新项目。在前沿 AI 领域人才极度稀缺的环境下,持续的高层流失是否会影响 xAI 的技术执行力,值得关注。

Macrohard 的愿景极其宏大(“模拟整个数字输出型公司”),但大会中没有展示任何具体 demo 或产品进展。这个项目从描述到落地之间的距离有多远,目前完全不清楚。

Imagine 的增长数据令人印象深刻,但大会完全回避了该产品引发的深度伪造争议和多国监管调查,这个问题不会因为不提就消失。

xAI 每月烧钱超过 10 亿美元。四个方向同时推进,加上太空数据中心的长期投入,资金压力是显而易见的。SpaceX 合并后的 IPO 能否为这台烧钱机器提供足够燃料,将是 2026 年最值得关注的商业故事之一。

(全文完)