3 月 23 日,英伟达在其开发者博客发布了一篇新的文章,称他们正在测试一个新的工具包—— Test Project Mellon,以探索创建由自然语言语音命令控制的免提扩展现实 ( XR ) 体验。
英伟达新技术:可使用语音 AI 交互创建 XR 体验
3 月 23 日,英伟达在其开发者博客发布了一篇新的文章,称他们正在测试一个新的工具包 Test Project Mellon,以探索创建由自然语言语音命令控制的免提扩展现实 ( XR ) 体验。
据了解,Project Mellon 是一个轻量级的 Python 包,能够利用语音 AI ( NVIDIA Riva ) 和大型语言模型 ( LLM ) (NVIDIA NeMo 服务)的重量级功能来简化沉浸式环境中的用户交互。
英伟达认为,言语可以做很多事情,此项目的目的,就是以实用的方式利用语音 AI 和 LLM 的力量打开虚拟世界的大门,做更多的事情。通过 Project Mellon,几乎任何应用程序的开发人员都可以轻松地将自然语言理解添加到他们的软件中。这不仅降低了协作 XR 技术的入门门槛,同时也能够使 IC.IDO Weave 中的用户体验更加人性化。
图源:nvidia