当前位置:首页 >娱乐 >英特尔研究院发布全新 AI 扩散模型,可根据文本提示生成 360 度全景图 包含超过 4 亿个图文对

英特尔研究院发布全新 AI 扩散模型,可根据文本提示生成 360 度全景图 包含超过 4 亿个图文对

2024-06-30 15:03:37 [百科] 来源:避面尹邢网

英特尔研究院发布全新 AI 扩散模型,英特可根据文本提示生成 360 度全景图

作者:孤城 人工智能 LDM3D 是尔研业界领先的利用扩散过程(diffusion process)生成深度图(depth map)的模型,进而生成逼真的究院据文、沉浸式的发布 360 度全景图。

6 月 21 日消息,全新全景英特尔研究院今日宣布与 Blockade Labs 合作发布 LDM3D(Latent Diffusion Model for 3D)模型,扩散可根这一全新的模型扩散模型使用生成式 AI 创建 3D 视觉内容。

英特尔研究院发布全新 AI 扩散模型,可根据文本提示生成 360 度全景图 包含超过 4 亿个图文对

据介绍,本提LDM3D 是示生业界领先的利用扩散过程(diffusion process)生成深度图(depth map)的模型,进而生成逼真的成度、沉浸式的英特 360 度全景图。LDM3D 有望革新内容创作、尔研元宇宙应用和数字体验,究院据文改变包括娱乐、发布游戏、全新全景建筑和设计在内的许多行业。

英特尔研究院发布全新 AI 扩散模型,可根据文本提示生成 360 度全景图 包含超过 4 亿个图文对

英特尔表示,LDM3D 是在 LAION-400M 数据集包含一万个样本的子集上训练而成的。LAION-400M 是一个大型图文数据集,包含超过 4 亿个图文对。对训练语料库进行标注时,研究团队使用了之前由英特尔研究院开发的稠密深度估计模型 DPT-Large,为图像中的每个像素提供了高度准确的相对深度。LAION-400M 数据集是基于研究用途创建而成的,以便广大研究人员和其它兴趣社群能在更大规模上测试模型训练。

英特尔研究院发布全新 AI 扩散模型,可根据文本提示生成 360 度全景图 包含超过 4 亿个图文对

LDM3D 模型在一台英特尔 AI 超级计算机上完成了训练,该超级计算机由英特尔至强处理器和英特尔Habana Gaudi AI 加速器驱动。最终的模型和流程整合了 RGB 图像和深度图,生成 360 度全景图,实现了沉浸式体验。

责任编辑:庞桂玉 来源: IT之家 AI

(责任编辑:知识)

    推荐文章
    热点阅读