一位知识博主的AI极简漫画：在长文章中保持角色一致性

1. 引言

大多数情况下，我们看到的AI 绘画都是极其炫彩的，特效感十足，比如下图这样。

但我个人还是偏好线条感强的，朴素的极简画风，比如下图这些。

我原本以为这种朴素画风对AI绘画来说会简单一些，但事实并非如此，后来我想通了。

一个素颜明星和一个浓妆艳抹的明星哪个更容易打造？
对于计算机来说，无论是一张简单线条画，还是酷炫特效图，背后都是m*n*3 的一个数学矩阵。计算量其实都是一样的。

如果你也喜欢这种风格的绘画，可以往下看，虽然最终结果距离设计师的水平差了一点，但经过几次的尝试，我也稍稍总结了一些经验，和大家分享。

2. 场景描述：科学人物肖像设计

先说说我做极简线条漫画的应用场景，我的目的是用漫画讲人工智能科普故事(可以翻阅公众号中讲人工智能历史的文章）。因为是知识为主，漫画是辅助、强化读者记忆的，所以画面不能太酷炫导致喧宾夺主，故事中的科学家的角色，我也希望用极简漫画表示。我先放几张成品图来表达一下这个意思（当然距离我的理想效果还有差距，相信随着AI技术的深入，会有改进）。

不难看出，在这种场景下，作为知识博主对AI绘画人物有几个诉求：

能根据真人图片提取出面部特征。
同一人物能展现不同表情，比如科研受阻时的失望，取得成功时的喜悦。
同一人物能展现出年轻到年老的不同阶段。

我们一个个来说。

3. 第一步：根据真人图片提取面部特征

这一步是最重要，也是最费时的一步。我们先不要夹杂动作、表情等复杂描述，就像在动画制作流程中，我们会先给每个人物做个T-pose，然后才开始修改面部表情和动作。

3.1 首先，准备垫图

垫图有两种：一是角色本人的真实照片，二是直接使用提示词生成的“大众脸”照片。

真人相片的垫图准备上有几点注意：

露出五官的人物照片的正面照片，以我的体会目前对图片的分别率其实要求并不高，当然在允许范围内尽可能找五官清晰的照片。这些科学人物一般都可以google 搜索到。
我的插画中一般都是黑白线条，所以先对图片进行黑白处理。
裁去人物身体部分，只露出肩膀与头的部分。

举例如下，左图为深度学习教父Geoffrey年轻时的一张真人照，右图为处理后的垫图。

直接使用提示词生成的“大众脸”照片在说完提示词后的3.3部分有示例图展示。

3.2 撰写提示词

提示词分文字描述中变化的部分（主要是人物描述部分）、不变的部分（主要是风格描述）以及参数部分（可选部分）

1）提示词中变化的部分

身份：身份有助于对人物气质的塑造，比如我的文中大多数是名校博士生，或者是教授等科研工作者。身份就是“a MIT male student in 1980s” ，当然我的角色不一定都来自于麻省理工，只是麻省理工比较出名，大模型很容易就可以识别。
性别：male，这属于基础逻辑，不做过多说明。
发型，穿着描述。

为什么强调发型和穿着？在服饰方面：因为要保持极简风格，一般会让角色穿着纯白白色T恤衫这种百搭基础款。提示词为：wearing clean white T shirt with crewneck（穿着纯白圆领T恤衫）。其次是因为发型和服饰比五官更能塑造视觉印象。我们不妨再仔细看看开头极简风这张图片，你会发现人物的五官大体是一致的，只是发型、服饰大不相同，从视觉上就能将人区分开。所以在提示词当中稍微加重发型、服饰的比例，使得人物更容易识别。

2）提示词中不变化的部分

不变的部分主要是风格限定，我写的是以下提示词：

保持背景单一：100% white background
手绘线条风格：hand-drawing style, hand illustration ,simple fine line art,line drawing portrait of a <woman/man>, black and white illustration
极简风格：minimalism style, –no details