当前位置:首页 行业动态 正文

大厂AI Art进展

2022-09-30

在2022年五月,谷歌研究公司推出了 Imagen。这一次,谷歌的 Imagen放弃了传统的从文字特性到图形特性,然后利用 GAN或者扩展模式来产生图片,而采用纯粹的语言模式来对文字进行编码,将文字与图像的转化交给了图像产生模式。这个影像产生模式,依旧是一种扩散模式。这就意味着,它在获得纯粹的文字资料和全面性上要比文字和数据更容易,在文字上要比文字更好地理解数据。

在2022年六月,谷歌发布了一款 Parti文字图片电脑模型,它通过对几十亿个参数进行分析,从而呈现出一幅超现实的图片。Parti全称是“Pathways AutoregressiveText-to-Image”(Outoregressive Time Time)。当可用的参数数目增加时,它的输出就会变得更真实。这个模型对200亿个参数进行了分析,然后才产生最后的图片。

Parti和 Imagen (Imagen)是一个谷歌为扩展学习而设计的文字-图片发生器。这个程序将“噪声”加入到图片中,从而对电脑模型进行模糊处理。然后,这个模型就可以把静止的图片进行解码,从而重建出原来的图片。通过改进模型,可以把一组看似随意的点变成一张图片。

谷歌现在还没有公开 Parti或者 Imagen。

Microsoft NUWA

微软亚洲研究院于2022年三月发布了其最新的多模式模式 N WA。N WA支持八个主要的图像产生与编辑。在此基础上,提出了四种支持图片的工作:从文字到图形、素描到图形、完成、编辑;支持视频的四种类型:文字到视频、影像素描、影像、影像预测、影像编辑。今年七月,微软亚洲研究院发布了一项最新研究: NUWA的升级版本-NUWA-Infinity,它可以产生任何尺寸的高清晰度图片,也可以长期拍摄。

Facebook/Meta Make-A-Scene

Meta官方宣布了Make-A-Scene的存在,现在他们正对 Meta中的 Meta人员进行测试,并从 Meta中获取用户的意见。Make-A-Scene能够捕获预设的场景布局,让素描也能融入到其内容中。这个模式也可以通过文字的方式建立自己的版面,但是这也就意味着使用者要放弃一定的控制。

美图在人脸技术、图像分割、图像增强、图像生成等方面具有一定的优越性

具有长久的美学经验,能掌握美的潮流,达到艺术和技术的完美融合

尖端科技可迅速与产品融合,每日调剂使用超过一亿次,既稳定又实用

人工智能产生在社会媒体上的广泛讨论,总是带着一种科学道德的色彩,而对于图像产生技术的讨论,更多的是艺术爱好者、设计师、艺术家,所以 AI Art对艺术设计的生产效率、知识产权、图像数据复用的延伸和保护,将成为下一股潮流。

文心·一格。

文心·一格是在文心大模型基础上,对文生图进行了产品化的创新。于二零零八年八月十九日上线。这是百度在飞桨、文心大模型的基础上,通过技术创新,首款“AI作画”。百度AI-飞桨大模型,是一个大的工业知识强化模型。文生图领域中的大型模型服务,它可以通过输入文字的形式和解析度来实现对所需的图像的自动生成。

包括国风、民族风等多种风格

依托百度强大的计算能力,快速出图,高完成率

易于操作,还能进行高级定制

美图 AI开放平台(https://ai.meitu.com/index)

美图 AI开放平台是由美图公司开发的人工智能服务平台,致力于在人脸技术、人体技术、图像识别、图像处理、图像生成等方面,为用户提供经过市场检验的 AI算法和解决方案。

值得一提的是,最近在 Product Hunt这个世界最大的商品平台上,也有专门为 AI Art设计的艺术品交易平台。这也许是 NFT兴起后,另一种新型的在线版权交易。