- 人工智能也要进击二次元界了:深度学习简化素描 So Easy!
- 来源:雷锋网
雷锋网按:本文为 AI 研习社编译的技术博客,原标题 Simplifying Rough Sketches using Deep Learning,作者为 Ashish Sinha。
翻译 | 周静 整理 | 凡江
素描是表达艺术思想重要的第一步,并迭代地进行设计优化。它使得艺术家们迅速地把他们的思想呈现在纸上。优先考虑尽快地将概念和想法表达出来,而非精美的细节,因而得到是粗略的草图。从最开始的草图,根据反馈迭代地进行细化直到产生最后的作品。迭代求精的过程使得艺术家们不断地清除他们的草稿成为简化版的图画,因此也意味着额外的工作量。正如人们所料的那样,手动的临摹草图以产生一幅干净的图画的过程是非常的沉闷耗时的。
那么,如果存在一种方法可以从草图中得到干净的草图,那岂不是更好?立刻,无论使用什么样的画笔。很奇妙,是不是?在这篇文章里,我将讨论一个深度学习技术,使用全卷积网络从粗糙的草图中生成干净的草图。
好,并不是说之前没有这样的软件来做完成这样的工作,确实有,但问题是,它们通常用来做矢量图像(vector images)而不是光栅图像(raster images)。让我们从什么是矢量和光栅图像开始吧!
矢量图像和光栅图像?
光栅图像,也称位图,由颜色的单个像素组成。每个颜色像素组成了整幅图像。
光栅图像可以与点绘画相比,它们由一系列单独的彩色点组成。点绘画中的每个画图点可以代表光栅图像中的单个像素。当被看成一个单独的点时,它只是一种颜色;但当被看成一个整体时,有颜色的点构成了一幅生动而细致的画。光栅图像中的像素的作用类似,它提供了丰富的细节和逐像素的编辑。
光栅图形由根据显示图像而排列的彩色像素组成,与它不同的是,矢量图像由路径组成,每一个路径具有一个数学公式(向量),来告诉位置形成方式,以及如何填充该位置的颜色。
由于数学公式决定了如何渲染图像,无论大小,矢量图像能够保持其外观。因而它们可以被无限地缩放。
模型结构
这个模型最好的部分在于,它与光栅图像一起,将多个粗略的草图线条转化成一个干净的线条。
这个结构的另外一个优点是,任何维度的图像都可以作为网络的输入,并且得到与输入图像相同尺寸的输出。网络结构十分简单,第一部分作为编码器,在空间上压缩图像,第二部分,处理并提取图像中的基本线条,第三和最后一部分作为解码器,将小的或者更简单的特征转换成与输入同样分辨率的灰度图。所有的这些全部用卷积来完成。
向上或者向下卷积结构跟一个简单的滤波器组很相似。然而,重要的是要认识到,当分辨率低的情况下,通道数量会更大。例如,当尺寸变成 1/8 时,则需要 1024 个。这保证得到干净线条的信息由低分辨率的部分执行;训练网络来选择编码-解码结构需要携带哪些信息。
填充被用于补偿卷积核的大小,并确保在步长为 1 时,输出的尺寸和输入尺寸一致。池化层被增加步长的卷积层代替,以此来降低由前一层得到的分辨率。
损失函数
使用加权的均方准则作为模型的损失。
Y 是模型的实际输出,Y*是目标输出,M 是损失图,使用逐像素的矩阵乘法运算来计算损失。现在,通过对作者论文中使用的各种损失图进行测试,他们发现下面给出的一个性能最好。为了避免模型关注较粗的线而放弃较细的线,损失图减少了较粗线的损失。
我们通过查看每个像素真实(目标)标签的直方图来构造损失图。H(i,u,v) 是像素 I(u,v) 的局部归一化的位值。直方图通过中心距离的所有 d_h 个像素值的 b_h 位来构造。
由于用于训练的图像数目相当的少,因而使用各种数据增加技巧来扩充数据集。传统的变换方法,例如旋转,以及使用 Adobe Photoshop 来改变色调,删除图像,并添加噪声来产生更多的样本等。
这是一个最先进的模型,甚至优于 Prortrace 和 Adobe Live Trace。
参考
Torch 代码:https://github.com/bobbens/sketch_simplification
文章://hi.cs.waseda.ac.jp/~esimo/publications/SimoSerraSIGGRAPH2016.pdf
注:我会实现 pytorch 版本的代码,因为很难得到文章中的数据集。同时,作者提供了预训他们代码的预训练模型。
原文链接:https://medium.com/coinmonks/simplifying-rough-sketches-using-deep-learning-c404459622b9
号外号外~
一个专注于
AI技术发展和AI工程师成长的求知求职社区
诞生啦!
欢迎大家访问以下链接或者扫码体验
https://club.leiphone.com/page/home
雷锋网雷锋网
动漫
-
-
- 强强联手!酷狗音乐与优秀国漫《魔道祖师》合作强推精品定制皮肤
- 近期备受好评的《魔道祖师》动画目前非VIP已播出4集,前尘篇的少年主角们也开始进入了仗剑江湖除魔卫道的“打怪”模式。从开播至今,《魔道祖师》动画在腾讯视频的播放量已突破7亿。动画精美的空镜、流畅的打斗
- 华声娱乐频道
-
-
-
- 彭昱畅公开秘密惹哭张子枫,《快把我哥带走》北京首看片笑中带泪
- 由郑芬芬执导,张子枫、彭昱畅领衔主演,改编自中国人气漫画家幽·灵姐妹畅销漫画的同名电影《快把我哥带走》近日在北京举办了“我哥的秘密”全国首次看片分享会。导演郑芬芬、漫画原作者幽·灵姐妹、演员张子枫、彭
- 淘票票
-
-
-
- 用漫画推广围棋《女九段》首次曝光柯洁漫画形象
- 二次元经济火爆的当下,越来越多的优秀国漫崛起。其中,以真实人物为原型改编创作的各类作品也越来越多。近日,腾讯动漫官方微博和柯洁微博曝光了一组漫画《女九段》的番外内容。在番外内容中,以柯洁形象直接创作的
- 弈城围棋网
-
-
-
- 萌空你的血槽!《苍之纪元》短篇动画“奥罗拉剧场”上线
- 苍穹彼端,心之所向!《苍之纪元》官方出品的短篇动画“奥罗拉剧场”已在B站火热上线。想了解各位英雄平日在奥罗拉大陆上的日常趣事?快来了解一下吧~冒险的轨迹绽放于苍穹之上,即刻下载《苍之纪元》,踏上前所未
- 便玩家游戏
-
-
-
- 十大最催泪的日本动漫,这么排行吗?
- 新世界日语学习交流群:333488529免费直播课丨日语学习资料丨日娱资讯丨日语共读丨日本留学在日本的动漫作品中,有很多常常让我们或感动或忧伤的落下泪水,不管动漫作品的结局如何,动漫带给我们的感动是最
- 新世界日语
-
-
-
- 境外直播|日本设计基础及动漫学习营 Day4
- 2018年7月27日,终于迎来了上课的第一天,生动形象的配音课让日语课程变得更加生动有趣。下午还参观了京都区的伏见稻荷大社,也是收获满满的一天。 学游精彩瞬间 第一堂课!吃完早饭后,终于迎来了第一堂课
- 启德学游
-
-
-
- 境外直播|日本设计基础及动漫学习营 Day5
- 在结束了上午的日语配音课后,日本老师带我们来到位于京都有百年历史的果子店——甘春堂,开始学习制作日本点心的料理,从实践活动中提高日语能力,同学们还互相赠送了自己制作的小点心。地点:日本 ● 甘春堂活动
- 启德学游
-
-
-
- 动漫《路人女主的养成方法》与AVG游戏开发
- 文/杨智专栏:https://zhuanlan.zhihu.com/p/40589865引子我最早接触到《路人女主的养成方法》说来有趣,既不是丸户老贼的小说,也不是动画,而是手办。几年前在逛淘宝的时候
- GameRes游资网
-
-
-
- 恐怖漫画《女神答应追求的条件》
- 点个关注吧!
- 搞笑内涵之神
-
-
-
- 《复仇者联盟3》删减片段首曝光!星爵:葛摩菈还活着
- 《复仇者联盟3:无限之战》片长虽然长达2个半小时,仍有不少删减片段,因应本片即将推出DVD,漫威便在这阵子释出删减画面,其中一段可以看到星爵和德克斯在葛摩菈被萨诺斯捉走后,在船上争吵,导演罗素兄弟(A
- 我没有猫也没有你
-
-
-
- 佐良娜到底有多喜欢博人?赞美他的蓝色眼睛就行了
- 相信各位小伙伴盼星星盼月亮,终于盼来了博人传第66集,因为65集的出色表现,这一集66集也吸引了许多人观看,而本集也是有许多小亮点。当然有一段是佐良娜和博人巳月在石岩上的对话,一直以来佐良娜都是很崇拜
- 毒舌ACG
-
-
-
- 改变币圈的忍者之中忍考试(中)第四节
- 卡卡西在三代到达不久之后也赶到了鸣人的旁边,面对鸣人坚定地提问,卡卡西对鸣人讲了关于宇智波鼬的事情,而现在鸣人正在用复杂的眼神看着佐助。三代和大蛇丸也已经开始战斗,双方都是影级别的忍者,寻常忍者无法插
- 比特侠炒币日记
-
-
-
- 金木小天使壁纸头像来一波~
- 嘿!喜欢金木小天使的小仙女小仙男们往这里看!作为喜欢金木四年的小可爱,我收集了一些金木小天使的美图(//∇//),喜欢的孩子就来收藏吧~你此时的表情▼最后,以和可爱的董香姐姐的壁纸头像来结尾下次
- 晴栀
-
-
-
- 人工智能也要进击二次元界了:深度学习简化素描 So Easy!
- 雷锋网按:本文为 AI 研习社编译的技术博客,原标题 Simplifying Rough Sketches using Deep Learning,作者为 Ashish Sinha。翻译 | 周静 整
- 雷锋网
-
-
-
- 《新哥斯拉》:教你如何杀掉一只神
- 文/驱逐舰叢云改二导语:《シン・ゴジラ》是今年著名动画导演庵野秀明拍摄的电影。作为哥斯拉家族第十只成员,这只哥斯拉表现出了几乎可以吹成神的强度,今天向大家介绍一下,这只号称是“神”的巨兽。虽然是菲律宾
- 中国数字科技馆
-