新京报贝壳财经讯(记者罗一丹)关于大型AI模型的应用,人们已经很熟悉“文胜文”、“文胜图”和“文胜视频”。 12月17日,腾讯混元发布世界模型1.5(腾讯HY WorldPlay),提供“文声3D”和“图声3D”功能。具体来说,用户可以通过输入文字和图像描述来创建自己的交互世界,使用键盘、鼠标和方向盘实时控制虚拟摄像机的移动和方向,像玩游戏一样自由地探索人工智能生成的世界。这是中国第一个可以体验到的实时全球模型。用户可以通过腾讯混源3D官网(https://3d.hunyuan.tencent.com/sceneTo3D?tab=worldplay)申请使用。同时,混元世界模型1.5(WorldPlay)率先开放了time.or real的世界模型框架,涵盖了整个数据绑定和处理、训练和部署流式推理,并提出了重构记忆、长上下文蒸馏和基于 3D 自回归扩散模型的强化学习等算法模块。混元世界模型1.5为世界建模带来了新的可能性。用户可以自由移动并探索生成的世界。当他们离开特定区域并返回时,模型可以“记住”该区域的三维结构并呈现一致的场景。这种空间记忆能力代表了通过模型理解三维世界的巨大进步。此外,用户可以选择将用于交互的3D场景导出为可多次使用的3D点云。编辑:杨官娟、校对:刘宝庆