量子位
整合编辑:太平洋科技
发布于:2024-10-10 16:29
华盛顿大学的研究团队开发了一项名为Inverse Painting的AI技术,能够逆向绘画梵高《星空》等名作。该项目通过学习真实艺术家的绘画过程,结合文本和区域理解来定义绘画指令,并使用基于扩散的渲染器生成类似人类艺术家的绘画过程视频。
|
梵高名作也能被AI逆向破解了?! 直接喂一张原图,AI就能化身梵高·本高一点点重绘整张图画(原图可任意)。
仔细对照两边,AI几乎实现了1:1复刻,还为我们这些绘画小白清晰展示了整幅图的构建过程。
这项魔法来自华盛顿大学,项目名为Inverse Painting,相关论文已入选SIGGRAPH Asia 2024,其中两位作者还是东北大学(Bowei Chen )和上海科技大学(Yifan Wang)的校友。
项目一经发布后即在Reddit引起热议,最高赞更是为艺术家群体操起了心(doge)。
不过也有人表示,这对于人们学习如何绘画非常有帮助。
甚至可以用来“破解”一些大师遗作,提取隐藏或失传的技术。
基于扩散模型 从原图→绘画过程延时视频,Inverse Painting采用基于扩散的逆绘画方法。
进一步拆解,这一过程主要包括以下步骤: 学习艺术家的绘画过程。收集了294个丙烯酸风景画绘画过程视频(平均时长9分钟),并进行视频帧分割、裁剪和筛选等预处理操作,让模型学习绘画过程; 定义绘画指令。基于对画作不同元素(比如天空、树木、人物等)以及元素相互关系的理解,模型会生成一组“绘画指令”,告诉模型应该先画什么,后画什么; 使用扩散模型。用扩散模型生成逼真图像,并逐步在画布上添加细节,就像艺术家绘画时一样; 文本和区域理解。模型还会生成文本指令和区域掩码,前者告诉模型要绘制的内容,后者用来指定内容的确切位置; 逐步渲染。从一个空白画布开始,逐步生成完整绘画过程; 时间控制。为了模拟真实世界中艺术家的绘画速度,模型还会考虑每步之间的时间间隔; 这些步骤整体可归为两阶段训练+测试,如下所示:
第一阶段:指令生成(Instruction Generation)这个阶段主要生成两个关键指令集,文本指令生成器(Text Instruction Generator)和区域掩码生成器(Mask Instruction Generator)。 前者通过比较目标画作和当前画布的状态,生成一个简短的文本指令,比如“画天空”或“加花朵”,以此决定下一步应该添加哪些元素。 后者是一个二进制图像,指明了画布上应该更新哪些部分。 两者一结合,确保模型只在画布上合适的区域进行绘制。
|
IT百科
网友评论
聚超值•精选
