自12月初以来,人们一直在探索OpenAI推出的对话AI ChatGPT神经网络的深度。近日,一位开发者让这款对话AI吐出了可以工作的AR代码。
OpenAI的ChatGPT对话AI被优化为生成文本和回答问题。但12月初的初步测试很快表明,该系统不仅仅能回答几个措辞整齐的句子,还能回答编程代码。
由ChatGPT生成的AR应用ChatARKit
开发者Bart Trzynadlowski想知道他是否能用ChatGPT开发一个AR应用,只用语音命令就能自主地在环境中放置数字3D物体。他还使用OpenAI的人工智能模型Whipser来识别语音命令,然后将它们作为人工智能提示带入ChatARKit应用的JavaScript环境。
图源:Bart Trzynadlowski
因此,ChatGPT能从Sketchfab中选择符合语音命令的3D物体,并根据提示将它们放在桌面或地板上。如果提示它,ChatGPT甚至可以缩放和旋转3D模型。人工智能系统会自行生成这方面的代码。
据Trzynadlowski表示,这些是一些有效的提示样本:
- "在最近的平面上放置一个立方体"。
- "将一个旋转的立方体放在地板上。"
- "把一辆跑车放在桌子上并旋转90度"。
- "把一辆校车放在最近的平面上,让它沿着平面来回行驶。"
根据Trzynadlowski的说法,ChatGPT的工作并不可靠。对于相同的命令,人工智能模型会产生非常不同的输出,并在应用程序中放置不正确的JavaScript代码行。有时,ChatGPT会将对象描述变成代码标识符,这意味着无法再从Sketchfab检索到3D模型。
Trzynadlowski在Github上将他的ChatGPT AR应用作为开放源代码免费提供。
用自然语言在VR中生成3D物体
对于VR,开发者Jasmine Roberts最近展示了OpenAI新的3D人工智能Point-E,像图像人工智能DALL-E 2一样,它可以完全基于文本输入生成内容。然而,Point-E生成的不是图像,而是代表三维模型的三维点云。每次生成,Point-E在单个Nvidia V100 GPU上只需要大约一到两分钟。值得一提的是,Roberts的演示是实时运行的。
Point-E是OpenAI在文本转3D合成方面进一步工作的起点。谷歌与Dreamfusion,以及Nvidia与Magic3D最近也推出了文本转3D系统,这可能在未来3D内容的进一步传播中发挥重要作用,而这也是元宇宙理论的一个重要基础。
免责声明:名将VR全景的资讯页面文章、图片、音频、视频等稿件均为自媒体人、第三方机构发布或转载。如稿件涉及版权等问题,请与我们联系(邮箱:316865155@qq.com)删除或处理。稿件内容仅为传递更多信息之目的,不代表本网观点,也不代表本网站赞同其观点或证实其内容的真实性,更不对您的投资构成建议。我们不鼓励任何形式的投资行为、购买使用行为。
- 18922299980
- 扫一扫加我微信
-
- 公众号:名将VR全景
- 扫一扫在微信上关注我们
-
评论