AI杀入视频游戏领域!谷歌发布Genie世界模型 一张图就能变成游戏
2024-06-02 【 字体:大 中 小 】
AI领域的发展速度令人震惊,先是文本到语音、图片、再到视频,如今文本到交互都已经来了。谷歌本周发布了一种全新的AI模型Genie,它可以接收文本提示、草图或想法,将其变成一个可以互动和玩耍的虚拟世界。
谷歌称Genie是专门从互联网视频中训练出来的基础世界模型,可以根据图像提示,生成各种各样动作可控的2D世界。模型由三部分组成:一个时空视频标记器、一个自回归动力学模型以及一个简单且可扩展的潜在行动模型。
对用户而言,只要提供一段文本、一张草图,Genie就会完成剩下的工作,生成一款2D游戏。与Sora呈现出来的高清晰度、高真实度相比,Genie似乎不那么强调画面真实性,而是将重点放在潜在动作预测上。
谷歌DeepMind表示,Genie为生成和进入虚拟世界打开了大门。例如可以采用最先进的文生图大模型来生成初始帧,然后用Genie赋予它们“生命”。
目前Genie是一个研究项目,而不是最终产品。它的训练视频是160x90像素的超低分辨率视频,每秒只有10帧,它生成的“游戏”同样是低分辨率的,每秒只有1帧,离实时可玩还很远,但DeepMind表示,Genie引入了一个能从图像或文本生成整个交互式世界的时代,它将成为训练未来通才AI智能体的催化剂。
AI杀入视频游戏领域!谷歌发布Genie世界模型 一张图就能变成游戏。点击视频,一看究竟!
文章作者
视点
相关视频 03'23'' 谷歌四季度净利润大涨但广告表现不佳 盘后跌超5%丨从华尔街到陆家嘴 01-31 10:12 01'50'' 美国联邦贸易委员会将调查“微软+OpenAI”模式:须警惕可能存在的垄断行为 01-26 22:26 01'13'' 洪灏:新技术公司缺乏估值之锚 但价值将在泡沫中慢慢显现 2023-12-26 22:43 10'03'' 【早安元宇宙】巅峰对决?Gemini能否超越GPT-4近日,谷歌推出了他们认为最强大的人工智能模型Gemini,向竞争对手OpenAI的大模型GPT-4发出挑战。Gemini是否有谷歌宣称的那么完美?本期元宇宙研究院,䒕雅带你一探究竟!
2023-12-18 17:36 03'12'' 英特尔纽约召开发布会 加速实现“AI无处不在” 2023-12-15 22:42 一财最热 点击关闭猜你喜欢
上交所对对博天环境集团股份有限公司及有关责任人予以纪律处分
31省份亮出2023“成绩单”,2024年GDP目标也定了
红海局势升级风险陡增 英美拟联合打击胡塞武装
一条“一街两制”的街道,见证了中英两国的历史变迁
什么消息刺激名创优品股价走强?近两日累计涨超11%
港股医药股多数反弹,宜明昂科涨超20%
来了!农业农村部、中国文联部署12项活动推动乡村文化振兴
来番禺,正当时!东西庄城市设计国际竞赛专家研讨会举行
iPhone 16 迎来第 5 个按钮,越来越难用了
曝!王艺迪疑似和方博恋情曝光?方博:她不够吸引我
【ETF动向】8月12日华夏上证50ETF基金涨004%,份额增加8820万份
立方制药(003020)8月28日主力资金净买入316万元
学习导读 共同擘画新时代中非关系发展新蓝图
赵立坚妻子自曝患癌,称已分两次完成手术!晒照感谢丈夫陪伴
港股异动 心动公司(02400)涨超6% 《心动小镇》表现亮眼 TapTap有望持续受益大量新游戏上线
技术形态很“丑陋”!白银日内交易分析:除非突破这一阻力 否则银价仍可能大跌
异动快报:交运股份(600676)7月24日10点29分触及跌停板
深高速(600548)8月30日主力资金净买入57393万元
他信女儿登顶泰国政坛,一条影响东南亚全局的暗线浮出水面
它含20种氨基酸,再贵也要经常给孩子吃,家长不用再愁孩子的生长