怎么把真人照片画成二次元人物?为何会“翻车”将猫狗画成人?AI绘画的“小秘密”都在这一篇文章里!

日期:2023-02-12 16:39:47 / 人气:288

有了AI,人人都可以是艺术家。AI绘画的呈现,恰如瑞士艺术家保罗·克利所言:“艺术不是再现可见,而是使不可见成爲可见。”经过20年左右的开展,目前基于不同类型或许模态元素的AI绘画开展状况不尽相反,开展最久的是“以图生图”,再到近期火爆的“文+图”生图。当然,也有团队曾经研收回由语音生成图像的技术。上传一张图片,或许输出一些复杂的关键词,零碎就能自动生成一张卡通图像……最近一段工夫,AI绘画开端在互联网社交平台走红。视觉中国供图AI绘画,望文生义就是应用人工智能停止绘画,是人工智能生成内容的典型使用场景之一。其次要原理是搜集少量已有作品,经过算法对其内容和作风特征停止解析,最初再生成新的作品,所以算法是AI绘画的中心。目前,“凭空”生成图像的AI绘画,其实也会动辄“翻车”:也许上一秒AI经过你的照片绘出的是一张充溢艺术感的二次元画像,下一秒你的宠物猫、狗则能够被画成心爱少女或肌肉猛男。现实上,AI绘画早已火爆全球。第一张地下展出的、由人工智能创作的绘画作品《埃德蒙·贝拉米的肖像》曾于2018年在佳士得拍卖行以43.25万美元成交,那是一张由机器学习了从14世纪到20世纪的1.5万张肖像画之后自动生成的一张肖像画作品。AI绘画是如何完成“凭空”生图的?除了文娱外,AI绘画还有哪些潜在的使用前景?从“以图生图”到“语音生图”2022年,由人工智能创作的《太空歌剧院》一度火出圈。在美国科罗拉多州举行的新兴数字艺术家竞赛中,《太空歌剧院》取得“数字艺术/数字修饰照片”类别一等奖。它的构图、配色以及画面的细节可谓精致。但是,这个作品的创作者不是艺术家,而是来自美国科罗拉多州的游戏设计师。这位游戏设计师在一个名爲“Midjourney”的AI创作工具里,先输出几个关键词,如光源、构图、气氛等,失掉了100幅作品,再停止约80小时的修图修饰,最终选出3幅作品,最初把图像打印到画布上。经过复杂交互式对话在短工夫内生成的“艺术”作品,让人类艺术家展开了一场关于“AI绘画作品参赛能否属于作弊”的争论。这场大张旗鼓的争论也令群众直观地认识到如今的AI绘画程度曾经开展到了何种水平。“人工智能在艺术方面的创作最早可以追溯到上个世纪末,事先的人工智能绘画技术叫作‘图像的作风化滤镜’。”中国迷信院自动化研讨所多模态人工智能零碎全国重点实验室研讨员董未名说,最后的AI绘画办法比拟复杂,比方一张普通的照片,经过一些图像处置的算法,把照片像素停止几何或许颜色上的变换,然后再调理不同参数,就可以模仿出相似油画或许水彩画的作风。经过20年左右的开展,目前基于不同类型或许模态元素的AI绘画开展状况不尽相反,开展最久的是“以图生图”,再到近期火爆的“文+图”生图。当然,也有团队曾经研收回由语音生成图像的技术。AI绘画次要依托三种技术形式完成董未名引见,目前AI绘画次要借助图像作风迁移技术、图文预训练模型和分散模型完成。“图像作风迁移技术指的是图像处置算法经过对输出的真实图像内容特征和对参考的艺术图像作风特征的提取,完成真实图像内容特征和艺术图像作风特征的交融,从而生成新的艺术图像。”董未名举例,假如将美国旧金山艺术宫的内景照片和印象派开创人莫奈绘制的作品,经过图像作风迁移技术停止交融,就能失掉一张看起来像是由莫奈绘制的美国旧金山艺术宫的绘画作品。最后的AI绘画采用的正是这种技术。不过,在董未名看来,图像作风迁移技术大多依赖的是生成式对立网络(GAN)算法,它最大的成绩是生成的绘画作品艺术性不强,笔触和构图让人觉得与真实的绘画有差距,所以持久以来,AI绘画不断“籍籍无名”。当图像作风迁移技术还在挣扎于输入作品的审美成绩时,图文预训练模型的呈现,减速了AI绘画的崛起。“依托图文预训练模型,只需输出一句话或许上传一幅作风分明的图片,算法就能将图像特征和文字特征‘对齐’。生成的绘画作品的内容特征和上传图片的内容类似,艺术性也比图像作风迁移技术生成的图片强很多。”董未名举例,比方支撑图文预训练模型的可比照言语—图像预训练(CLIP)算法,就是应用图文特征“对齐”的才能,再结合已有的生成模型,完成“以图生图”或许“图+文”生图。不过,董未名坦言,图文预训练模型的推行也存在一些争议,有局部人以为,该模型在训练后期,需求用少量的图形处置器(GPU)停止数据训练,耗电量大、本钱很高,而该模型的使用场景却不够明晰。但也有人以为,也许该模型将来可以打造爲通用的人工智能模型,用它完成更多的算法作业,只是这还需求工夫的验证。固然没有一项技术是完满的,这也爲人类探求更先进的技术提供了有限动力。当下最盛行的分散模型便是其中之一。“目前最新的AI绘画技术采用的就是分散模型,这种模型可以把一个随机采样的噪声输出模型,然后尝试经过去噪来生成图像。”董未名表示,分散模型也存在弱点,由于模型对图片内容辨认的才能缺乏,或许难以完全了解辨认文字的意义,以及训练数据的偏向,有时便会生成“四不像”的作品。此外,分散模型生成图片的速度比拟慢,目前还达不到实时生成图片。互联网管理、元宇宙

作者:杏耀注册登录平台




现在致电 5243865 OR 查看更多联系方式 →

杏耀注册登录平台 版权所有