有详细论文 DALL·E 现实主义画师 我跪了!OpenAI AI 化身 发布 2 (论文详细要求)

文章编号:46016 资讯动态 2024-12-09 OpenAI AI画像 2.0 DALL·E

我跪了!OpenAI  DALL·E 2,AI 化身「现实主义画师」,有详细论文

大家还记得去年 1 月 OpenAI 发布

我跪了!OpenAI  DALL·E 2,AI 化身「现实主义画师」,有详细论文

只要「阅读」文本,DALL·E 就能根据文本的内容「自动」生成栩栩如生的大师级画像。因此,当时一经发布,DALL·E 就火遍了 AI 圈,吸粉无数,也让 Language-Vision(文本-视觉)方向又火了一把。

就在今天!时隔一年后,OpenAI 结合 CLIP,又发布了 DALL·E 的第二个版本——

相比 DALL·E 1.0,DALL·E 2.0 可以生成更真实和更准确的画像:综合文本描述中给出的概念、属性与风格等三个元素,生成「现实主义」图像与艺术作品!分辨率更是提高了4倍!

比如,当提示文本中分别包含「概念」“An astronaut ”(一个宇航员)、「属性」“riding a horse”(在骑一匹马)和「 风格」“in a phtprealistic style”(超现实风格)时:

文本提示:An astronaut + riding a horse + in a phtprealistic style(一个宇航员+骑马+超现实风格)

DALL·E 2可以生成如下这些同时包含三种元素的图像:

我跪了!OpenAI  DALL·E 2,AI 化身「现实主义画师」,有详细论文

我跪了!OpenAI  DALL·E 2,AI 化身「现实主义画师」,有详细论文

我跪了!OpenAI  DALL·E 2,AI 化身「现实主义画师」,有详细论文

在满足三种给定元素的基础上,它可是充分发挥了自己的「想象力」,不仅马的姿态各不相同,而且给宇航员穿上了样式各异的服装,场景也是十分丰富,草地上、山顶上、星空中......

神不神奇!牛不牛!



让我们来欣赏 DALL·2.0 的大师作品!

如果你想要变换文本中概念、属性和风格三个元素中的一个或多个,比如保留「概念」“一个宇航员”和「属性」“在骑一匹马”,而将超现实主义风格替换为波普艺术家安迪·沃霍尔的风格,DALL·E 2也可以「轻松」转换它的绘画风格:

文本提示:An astronaut + riding a horse + in the style of Andy Warhol (一个宇航员+在骑一匹马+安迪·沃霍尔的风格)

我跪了!OpenAI  DALL·E 2,AI 化身「现实主义画师」,有详细论文

文本提示:An astronaut + riding a horse + as a pencil drawing(一个宇航员+在骑一匹马+铅绘风格)

我跪了!OpenAI  DALL·E 2,AI 化身「现实主义画师」,有详细论文

文本提示:An astronaut + lounging in a tropical resort in space + in a vaporWave style( 一个宇航员+在太空热带度假胜悠哉地躺着+蒸汽波风格)

我跪了!OpenAI  DALL·E 2,AI 化身「现实主义画师」,有详细论文

文本提示:Teddy bears + mixing sparkling chemicals as mad scientists + as a 1990s Saturday morning cartoon(泰迪熊们+正在像疯狂的科学家一样混合着冒泡的化学物质+20世纪90年代的周六早间卡通片风格)

我跪了!OpenAI  DALL·E 2,AI 化身「现实主义画师」,有详细论文

文本提示:Teddy bears+shopping for groceries+in the style of ukiyo-e(泰迪熊+购买杂货+浮世绘风格)

我跪了!OpenAI  DALL·E 2,AI 化身「现实主义画师」,有详细论文

文本提示:Teddy bears+shopping for groceries+in ancient Egypt(泰迪熊+购买杂货+古埃及风格)

我跪了!OpenAI  DALL·E 2,AI 化身「现实主义画师」,有详细论文

文本提示:A bowl of soup+that is a portal to another dimension+as digital art(一碗汤+通往另一个维度的门户+数字艺术风格)

我跪了!OpenAI  DALL·E 2,AI 化身「现实主义画师」,有详细论文

文本提示:A bowl of soup+as a planet in the universe+as a 1960s poster(一碗汤+宇宙中的一个星球+1960年代海报风格)

我跪了!OpenAI  DALL·E 2,AI 化身「现实主义画师」,有详细论文

文本提示:A bowl of soup+as a planet in the universe+as digital art(一碗汤+宇宙中的一个星球+数字艺术风格)

我跪了!OpenAI  DALL·E 2,AI 化身「现实主义画师」,有详细论文




DALL·E 2.0 的其他功能

1、图像编辑

DALL·E 2 可以根据自然语言描述的标题对现有图像进行逼真的编辑,比如,在考虑阴影、反射和纹理的同时增加或删除图中的某个元素。示例如下:

文本描述的编辑需求:选择一个位置在图中添加火烈鸟。

我跪了!OpenAI  DALL·E 2,AI 化身「现实主义画师」,有详细论文

文本描述的编辑需求:选择一个位置在图中添加柯基。

我跪了!OpenAI  DALL·E 2,AI 化身「现实主义画师」,有详细论文

2、风格变体

DALL·E 2 可以拍摄一张图片,然后根据原图制作出同一个风格的不同画像。示例如下:

我跪了!OpenAI  DALL·E 2,AI 化身「现实主义画师」,有详细论文

我跪了!OpenAI  DALL·E 2,AI 化身「现实主义画师」,有详细论文

我跪了!OpenAI  DALL·E 2,AI 化身「现实主义画师」,有详细论文

我跪了!OpenAI  DALL·E 2,AI 化身「现实主义画师」,有详细论文

我跪了!OpenAI  DALL·E 2,AI 化身「现实主义画师」,有详细论文

我跪了!OpenAI  DALL·E 2,AI 化身「现实主义画师」,有详细论文

我跪了!OpenAI  DALL·E 2,AI 化身「现实主义画师」,有详细论文

我跪了!OpenAI  DALL·E 2,AI 化身「现实主义画师」,有详细论文

对于AI从文本生成的图像,我们非常看重的一点当然是图像的分辨率了,图像的分辨率越高,像素数量就越多,图像也就越清晰和逼真。与DALL·E 1相比,DALL·E 2的分辨率提高了4倍!

比如,对于同样的文本提示:

文本提示:a painting of a fox sitting in a field at sunrise in the style of Claude Monet(一只狐狸坐在日出时的田野里+克劳德·莫奈风格)

下面两张图分别是DALL·E 1 和DALL·E 2所生成图像的对比:

我跪了!OpenAI  DALL·E 2,AI 化身「现实主义画师」,有详细论文

对比之下,DALL·E 1 生成的图像可以说是很模糊了,甚至根本看不出「日出」在哪里,「狐狸」只显露出它的头部,「田野」也不太有田野的样子,而且在整体风格上与画家莫奈的印象派风格相去甚远。

而在DALL·E 2的魔法手笔下,图像质量显著提高,「日出」和「田野」都很生动,小狐狸端坐在草地上,姿态可爱。这幅画作色彩更加丰富,使用了更多的复色,对光影的描绘更加接近莫奈的风格。

总体来说,相比 DALL·E 1.0,DALL·2 显然能 hold 住元素更丰富、色彩更饱满的图像。不再是简单的单一物品描述,而是对一个场景的整体表达,故事更完整,想象力也更丰富!

更详细的内容,可以查看 DALL·E 2 的相关研究论文:

我跪了!OpenAI  DALL·E 2,AI 化身「现实主义画师」,有详细论文

我跪了!OpenAI  DALL·E 2,AI 化身「现实主义画师」,有详细论文

版权文章,未经授权禁止转载。详情见 转载须知 。

我跪了!OpenAI  DALL·E 2,AI 化身「现实主义画师」,有详细论文


本文地址: https://www.gpxz.com/article/435b44b61c4c86af5310.html
全局中部横幅
全局中部横幅
在线文本去重复

在线去重工具可以用于去除文本中的重复项,针对文本内容进行一键去重。

足球直播

⚽畅享足球直播ৡ多้้ꦿ᭄࿐『得发』推荐足球直播在线直播观看免费直播吧,高清画面足球直播、让球迷能够随时免费在线享受到足球的高清直播服务。24小时不间断更新让您可以随时随地通过我们的平台观看足球比赛直播!

萬卷书

优质mobi,epbu,azw3,pdf,kindle电子书,电子书下载,电子书网站

江西省设备工程监理有限公司

公司拥有较强的检测仪器、先进的自动化办公设备和一批理论知识扎实、实践经验丰富、专业技能娴熟的检验监督管理人才,为从事设备工程监理提供了可靠的技术支持和保障。

badam

Badam品牌致力于新疆的互联网市场,深研新疆市场的产品需求,为广大的新疆同胞(维族,哈族)提供优秀的移动机联网产品,帮助新疆的同胞更好的融入移动互联时代,拥抱移动互联时代带来的各项便利,提高生活质量。

兼职网

1010兼职网是领先的兼职招聘网站,提供网上兼职、大学生兼职、周末兼职、促销派发、家教、实习、在家兼职、网上赚钱、临时工等,免费发布招聘信息、查找兼职工作。

红酒杯

瑞信玻璃,13年来专注中高端红酒杯,高脚杯,玻璃杯,礼品红酒杯定制服务.已成功为100多家品牌进行代加工.专业设计团队,精细化生产管理体系,从设计到生产一站式服务

欧洲包车旅游网

欧洲包车网提供欧洲包车游.欧洲包车可选车型:5/7/10商务车:海狮/埃尔法等;欧洲各大机场接机送机服务,包括荷兰、意大利、西班牙、葡萄牙、希腊、英国等国家的包车旅行、机场接送机等信息,专注荷兰包车接机、阿姆斯特丹机场接送机、比利时包车接机、布鲁塞尔机场接送机、希腊包车、雅典机场接送机等。

心肺复苏模拟人

泽雅科教是专业从事心肺复苏模拟人,气管插管训练模型,心肺复苏模型等医学设备,医学模型方面的产品的生产与销售。热线电话:021-33513438

木工带锯机

江苏东巨机械科技有限公司主要生产木工带锯机、卧式带锯机,跑车带锯机等木工机械,纺织机械,环保机械、农业机械、工程机械等。生产的东巨牌、唐洋牌产品,运销东南亚、俄罗斯、非洲等国家和地区。

全局底部横幅