Lumine – 字节跳动推出的3D开放世界通用AI智能体

AI项目 2025-11-17

Lumine是什么

Lumine是字节跳动推出的在3D开放世界游戏中实时感知、推理和行动的通用AI智能体。Lumine基于Qwen2-VL-7B-Base模型,通过类人交互范式,将感知、思考和行动整合在一起。Lumine能实时感知游戏环境,执行复杂的任务,包括战斗、解谜、与NPC交互以及GUI操作等。Lumine在《原神》中表现出色,能完成长达数小时的主线任务,且在其他游戏中展现跨游戏泛化能力。Lumine通过多阶段训练,逐步提升自主思考和操作能力,为未来具身智能的发展提供新的方向。

Lumine

Lumine的主要功能

  • 任务执行:能自主完成复杂的长周期任务,如在《原神》中完成长达数小时的主线剧情。
  • 战斗能力:动态追踪敌人、精准射击、切换角色进行连招攻击,高效开启宝箱。
  • 解谜能力:支持应对各种解谜挑战,如收集风神瞳、激活元素方碑等。
  • NPC交互:能与NPC进行稳定对话,完成任务。
  • GUI操作:像人类玩家一样进行2D界面操作,如制作物品、使用传送锚点等。
  • 跨游戏泛化:无需额外微调,能在其他游戏(如《崩坏:星穹铁道》《鸣潮》)中完成任务。

Lumine的技术原理

  • 感知空间:以每200ms处理一帧游戏画面,保留历史推理轨迹,为决策提供上下文信息。
  • 混合思考策略:在关键场景(如环境突变、计划失效)进行推理,简单场景直接输出动作,提高效率。
  • 键盘与鼠标操作建模:将所有操作定义为鼠标位移和按键序列,通过高质量数据进行三阶段训练:
    • 预训练:学习基础视觉运动能力。
    • 指令跟随训练:关联语言指令与动作。
    • 决策推理训练:学会自主规划和修正,完成长周期任务。
  • 实时优化:通过上下文管理和多维度优化,降低延迟,确保实时交互。

Lumine的项目地址

  • 项目官网:https://www.lumine-ai.org/
  • arXiv技术论文:https://arxiv.org/pdf/2511.08892

Lumine的应用场景

  • 游戏开发与测试:用在游戏自动化测试,帮助开发者快速发现漏洞、性能问题及用户体验问题,同时辅助生成智能NPC行为和任务设计,提升游戏开发效率。
  • 游戏娱乐:作为AI队友或对手,为玩家提供更具挑战性和趣味性的互动体验,或在单人游戏中辅助玩家完成复杂任务,提升游戏完成度。
  • 教育与培训:用在虚拟训练环境,为学生或专业人员提供任务训练,或在教育游戏中辅助学习,通过任务和挑战帮助学生掌握知识和技能。
  • 虚拟世界与元宇宙:作为虚拟角色在元宇宙中与用户互动,提供陪伴或服务,帮助用户生成虚拟世界中的任务、剧情或互动内容,丰富用户体验。
  • 工业与制造业:在工业模拟环境中执行任务和优化流程,帮助设计高效工作模式,用在智能机器人训练,提升其自主决策和操作能力。
©️版权声明:若无特殊声明,本站所有文章版权均归AI工具集原创和所有,未经许可,任何个人、媒体、网站、团体不得转载、抄袭或以其他方式复制发表本站内容,或在非我站所属的服务器上建立镜像。否则,我站将依法保留追究相关法律责任的权利。

相关文章