跳转至

北大联合Llama-Factory推出DataFlex:工业级数据动态训练系统

公众号: 机器之心 发布日期: 04月15日 抓取日期: 2026-04-16 URL: https://www.jiqizhixin.com/articles/7ae4af05-ba58-4b5b-b0bb-8bbae7772797


Title: 刚刚,李飞飞世界模型开源了个渲染神器 | 机器之心

URL Source: https://www.jiqizhixin.com/articles/7ae4af05-ba58-4b5b-b0bb-8bbae7772797

Markdown Content:

刚刚,李飞飞世界模型开源了个渲染神器 | 机器之心

机器之心

Image 1: 机器之心

Image 2: 未登录

登录

Image 3: empty_user 去登录

Image 4文章库Image 5PRO会员通讯Image 6SOTA!模型Image 7AI ShortlistImage 8: new-iconImage 9AI 好好用

Image 10: 机器之心

文章库PRO通讯会员SOTA!模型AI ShortlistImage 11: new-icon

AI 好好用

Image 12登录

Image 13: home

Image 14: logo文章库

Image 15: icon

Image 16: no-user登录

刚刚,李飞飞世界模型开源了个渲染神器

0%

Image 17: icon展开列表

2026具身智能数据赛道,卷出了一匹「黑马」

04月15日

觅蜂科技(Maniformer)

Image 18: img

从「片段生成」到「长视频漫游」:OmniRoam探索轨迹可控的长视频生成新范式

04月15日

视频生成

Image 19: img

阿里ATH发布AI开发工具Meoo,可一键开发一键部署

04月15日

Meoo(秒悟)

Image 20: img

构建跨越时空的微观实验室:KIMMDY 仿真器实现秒级生物化学反应的动态模拟

04月15日

AI for Science

Image 21: img

实测参考生之王Vidu Q3:这已经不叫AI生成了,这叫AI驱动整个剧组

04月15日

参考生视频

Image 22: img

刚刚,李飞飞世界模型开源了个渲染神器

04月15日

Spark 2.0

Image 23: img

北大联合Llama-Factory推出DataFlex:工业级数据动态训练系统

04月15日

DataFlex

Image 24: img

离谱!我的新上班搭子,居然是个超靠谱的AI

04月15日

TuriX Superpower

Image 25: img

昨天,英伟达开源个量子AI,拉爆美股量子计算概念

04月15日

量子计算

Image 26: img

可用即脆弱?VENOM击穿纵向联邦学习

04月15日

CVPR 2026

Image 27: img

腾讯轻量云独家上线Hermes Agent应用模板 AI智能体云端部署一云搞定

04月15日

Image 28: img

OccuBench 文档宣传: 15个前沿大模型,100个职业场景:谁才是最强AI打工人?

04月15日

OccuBench

Image 29: img

「国家队」下场,德塔智能连续三轮融资超亿元,押注原生人形机器人基础模型

04月15日

具身智能

Image 30: img

OpenAI也搞「Mythos」?刚刚,网络安全版GPT-5.4-Cyber亮相

04月15日

GPT-5.4-Cyber

Image 31: img

速来!巴西不仅有足球,也有蚂蚁的ICLR 2026学术派对

04月14日

蚂蚁集团

Image 32: img

数学的上帝粒子!一个运算符能导出所有基本函数

04月14日

EML

Image 33: img

迎接智能体的「觉醒时刻」:EverOS全球公测开启Agent Memory自进化序章

04月14日

EverOS

Image 34: img

写Verilog、调CUDA,总翻车?工业代码大模型开始学会「先想后写」了

04月14日

北京航空航天大学

Image 35: img

火山引擎:Seedance 2.0 API 服务全面开放

04月14日

火山引擎

Image 36: img

目标更重要?国内公司超越Generalist,进化到动作中心世界模型

04月14日

极佳世界

Image 37: img

Image 38: avatar

机器之心 原创

10小时前

刚刚,李飞飞世界模型开源了个渲染神器

编辑|杜伟

刚刚,李飞飞世界模型新成果来了,还是开源的!Image 39: 图片 就在今天凌晨,李飞飞空间智能独角兽公司 World Labs 官宣推出「Spark 2.0」,将最具野心的 3DGS(3D 高斯泼溅)世界带入到 Web

这意味着,原本只有专业设备才能运行的超大规模、高保真 3D 场景,现在变成任何人都可以在浏览器中访问的内容。

而随着高保真 3D 内容可以在任意设备上进行访问,包括手机、VR 设备等,空间叙事能力向前迈进了一大步。

Image 40: 图片 这个专为 3DGS 打造的渲染器还是开源的,可以流式加载 1 亿 + 的 3DGS 数据,将构建一个全新的 3D 物理世界。

Image 41: 图片 3D 高斯泼溅渲染神器,Spark 2.0 来了

作为一个面向 Web 的动态 3D 高斯泼溅(3DGS)渲染器,Spark 与当前最流行的 Web 3D 框架 Three.js 集成,并基于 WebGL2 运行,因此只要有浏览器,无论是桌面端、iOS、Android,还是 VR 设备,都可以使用。

在去年发布时,Spark 就带来了不少其他渲染器没有的能力:比如在同一场景中渲染多个 3DGS 对象、实时编辑与重光照,以及一个着色器图系统让用户可以基于 splat 创建完全动态的特效和动画。

而在 Spark 2.0 中,团队加入了一个细节层级(LoD)系统,可以在任意设备上流式加载并渲染超大规模的 3DGS 世界。当你在场景中移动时,Spark 会根据当前视角自动调整 3DGS 的细节等级,并通过网络按需加载所需数据。我们先来看以下几个场景的展示图:

Image 42: 图片Image 43: 图片 接着来看技术细节。

Spark 2.0 提供了一整套解决方案,用来在 Web 上为各类设备准备、传输并渲染超大规模的 3DGS 场景。为了解决规模化带来的挑战,它主要用了三类图形学和系统层面的技术:

  • Level-of-Detail(细节层级):为 splat 生成不同分辨率的版本,并根据当前相机视角决定实际渲染哪一部分。当对象距离较远、细节难以分辨时,就减少渲染的 splat 数量,从而提升性能。

  • 渐进式流加载(Progressive Streaming):随着数据下载,从粗到细逐步加载 3DGS 的细节内容,并优先加载那些最能提升当前视角清晰度的数据。

  • 虚拟内存(Virtual Memory):在 GPU 中分配一块固定大小的内存池,用作 splat 的页表,根据场景中的位置,自动换入和换出所需的 3DGS 数据块。这样一来,就能访问跨多个 3DGS 对象、通过网络获取的海量数据。

细节层级(LoD)高斯 splat 树

Spark 的 LoD 设计采用的是连续 LoD 方法,即所有 splat 都被组织在一个层级结构中,也就是一棵 LoD splat 树。Spark 会在这棵树上选择一条「切面」,从中逐个挑选 splat,使当前视口中的细节达到最优。

在这棵树里,每一个内部节点,都是由其子节点合并得到的低分辨率版本:通过把多个子 splat 合成为一个新的 splat,用来近似它们整体的形状和颜色。这个过程不断向上递归,直到树的根节点,也就是:一个单一的大 splat 汇总了整个对象中所有 splat 的整体形状与颜色。

Image 44: 图片 Spark 2.0 提供了两种用于生成 LoD splat 树的算法:

  • 一种轻量且速度更快的算法,叫做 Tiny-LoD,在 Web 端默认使用;

  • 一种质量更高的算法,叫做 Bhatt-LoD,在命令行环境中默认使用。

这两种方法都「无需训练」,不依赖参考图像或其他输入数据,而是直接基于 3DGS 数据本身进行处理。

渐进式流

Spark 2.0 定义了一种新的文件格式 .RAD(Radiance fields),用于压缩 3DGS 数据,并支持在网络传输过程中进行随机访问,实现逐步细化的流式加载。

在加载初期,3DGS 对象会以一个大约 6.4 万 splat 的粗略版本几乎瞬间呈现出来。随后系统会分块获取数据,优先细化当前画面中最粗糙、最需要提升细节的 LoD splat,并随着用户在场景中的移动动态调整加载优先级。

Image 45: 图片 虚拟内存

虚拟内存是一种内存管理技术,通过一小块固定的「物理内存」,来提供对海量虚拟内存的访问能力。系统通过页表,将虚拟地址与物理内存中的固定大小页进行映射。

Spark 2.0 将这一机制引入到 3DGS 中,在 GPU 上分配一个固定容量(约 1600 万 splat)的内存池,并自动管理 GPU 中 64K splat 的「页」与 .RAD 文件中对应的 64K 数据块之间的映射关系。

数据块会按照 LoD 遍历顺序加载进空闲页中;当页表已满时,如果有新的、更高优先级的数据需要加载,就会按照「最近最少使用」(LRU)的策略,把优先级较低的旧数据块替换出去。

Image 46: 图片

更多技术细节请参考博客原文。

博客地址:https://www.worldlabs.ai/blog/spark-2.0