一位知识博主的AI极简漫画:在长文章中保持角色一致性

1. 引言

大多数情况下,我们看到的AI 绘画都是极其炫彩的,特效感十足,比如下图这样。

一位知识博主的AI极简漫画:在长文章中保持角色一致性

但我个人还是偏好线条感强的,朴素的极简画风,比如下图这些。

一位知识博主的AI极简漫画:在长文章中保持角色一致性

我原本以为这种朴素画风对AI绘画来说会简单一些,但事实并非如此,后来我想通了。

  • 一个素颜明星和一个浓妆艳抹的明星哪个更容易打造?

  • 对于计算机来说,无论是一张简单线条画,还是酷炫特效图,背后都是m*n*3 的一个数学矩阵。计算量其实都是一样的。


如果你也喜欢这种风格的绘画,可以往下看,虽然最终结果距离设计师的水平差了一点,但经过几次的尝试,我也稍稍总结了一些经验,和大家分享。

2. 场景描述:科学人物肖像设计

先说说我做极简线条漫画的应用场景, 我的目的是用漫画讲人工智能科普故事(可以翻阅公众号中讲人工智能历史的文章)。因为是知识为主,漫画是辅助、强化读者记忆的,所以画面不能太酷炫导致喧宾夺主,故事中的科学家的角色,我也希望用极简漫画表示。我先放几张成品图来表达一下这个意思(当然距离我的理想效果还有差距,相信随着AI技术的深入,会有改进)。

一位知识博主的AI极简漫画:在长文章中保持角色一致性

一位知识博主的AI极简漫画:在长文章中保持角色一致性

一位知识博主的AI极简漫画:在长文章中保持角色一致性

不难看出,在这种场景下,作为知识博主对AI绘画人物有几个诉求:

  • 能根据真人图片提取出面部特征。

  • 同一人物能展现不同表情,比如科研受阻时的失望,取得成功时的喜悦。

  • 同一人物能展现出年轻到年老的不同阶段。

我们一个个来说。

3. 第一步:根据真人图片提取面部特征

这一步是最重要,也是最费时的一步。我们先不要夹杂动作、表情等复杂描述, 就像在动画制作流程中,我们会先给每个人物做个T-pose,然后才开始修改面部表情和动作。

一位知识博主的AI极简漫画:在长文章中保持角色一致性

3D动画制作中的T-pose

3.1 首先,准备垫图

垫图有两种:一是角色本人的真实照片,二是直接使用提示词生成的“大众脸”照片。

真人相片的垫图准备上有几点注意:

  • 露出五官的人物照片的正面照片,以我的体会目前对图片的分别率其实要求并不高,当然在允许范围内尽可能找五官清晰的照片。这些科学人物一般都可以google 搜索到。

  • 我的插画中一般都是黑白线条,所以先对图片进行黑白处理

  • 裁去人物身体部分,只露出肩膀与头的部分。

举例如下,左图为深度学习教父Geoffrey年轻时的一张真人照,右图为处理后的垫图。

一位知识博主的AI极简漫画:在长文章中保持角色一致性

准备真人垫图

直接使用提示词生成的大众脸照片在说完提示词后的3.3部分有示例图展示。

3.2 撰写提示词

提示词分文字描述中变化的部分(主要是人物描述部分)、不变的部分(主要是风格描述)以及参数部分(可选部分)

1)提示词中变化的部分

  • 身份:身份有助于对人物气质的塑造,比如我的文中大多数是名校博士生,或者是教授等科研工作者。身份就是“a MIT male student in 1980s” ,当然我的角色不一定都来自于麻省理工,只是麻省理工比较出名,大模型很容易就可以识别。

  • 性别:male,这属于基础逻辑,不做过多说明。

  • 发型, 穿着描述。

为什么强调发型和穿着?在服饰方面:因为要保持极简风格,一般会让角色穿着纯白白色T恤衫这种百搭基础款。提示词为:wearing clean white T shirt with crewneck(穿着纯白圆领T恤衫)。其次是因为发型和服饰比五官更能塑造视觉印象。我们不妨再仔细看看开头极简风这张图片,你会发现人物的五官大体是一致的,只是发型、服饰大不相同,从视觉上就能将人区分开。所以在提示词当中稍微加重发型、服饰的比例,使得人物更容易识别。

一位知识博主的AI极简漫画:在长文章中保持角色一致性

发型和穿着使人物更易区别


2)提示词中不变化的部分

不变的部分主要是风格限定,我写的是以下提示词:

  • 保持背景单一:100% white background

  • 手绘线条风格:hand-drawing style, hand illustration ,simple fine line art,line drawing portrait of a <woman/man>, black and white illustration

  • 极简风格:minimalism style, –no details

3.3 生成大众脸垫图与真人垫图融合

首先用3.2中的提示词不加任何垫图生成照片如下,当然这一轮你可以看到四张图片差异非常大,这一步重复几次,找到最接近你预期的大众脸照片,这一步有点像“抽卡”,随机性很强。

然后将刚刚生成大众脸照片和真人照片使用Blend命令融合,mid journey中的Blend的命令非常稳定,可控性非常强,这一点绝对不是“抽卡”实验。

以上两步的示例图如下:

一位知识博主的AI极简漫画:在长文章中保持角色一致性

使用大众脸和真人垫图进行Blend(融合)

(注:因为文中使用的人物都是侧面出现,所以在blend 之后加了side view-侧面照作为提示词)

3.4 参数部分(可选步骤)

这一部分不是在所有图中有用到,如果前两部分可以满足诉求,这一步可以省略,但这一部分在很多情况下还是很重要的。

1)使用种子参数(推荐用此方法来控制风格)

当你得到了一个人物的风格之后,想以此风格做出其他角色,目前我的测试结果是以已确定的图片作为种子方式来设定能最快达到你想要的风格。

比如下图中,我们将已经确定的角色风格作为种子,和待转换风格的人物原图,再加上必要的提示词,就可以得到风格一致的另外一个角色。

一位知识博主的AI极简漫画:在长文章中保持角色一致性

使用真人垫图,风格图片做种子

关于种子的介绍,稍后会有详细分享,之后会把链接更新在这里,也欢迎大家关注,随时发现我的更新。

2. 指定垫图比例(可选):

MJ中用双冒号指定比例,[普通人原图]::<所占比例> [风格参考图片]::<所占比例>。

这里使用另外一篇文章中的图片作为示例,下图中真人原图比例为3, 参考图片比例为1。使用过程中可以调整比例值来得到想要的效果。

一位知识博主的AI极简漫画:在长文章中保持角色一致性

真人加参考图适配比例

第二步:同一人物能展现不同表情

这里只需要采用第一步生成的图像作为垫图,把第一步生成的图像种子作为Seed 参数加进去,然后加上表情表述,就可以得到比较好的结果。

一位知识博主的AI极简漫画:在长文章中保持角色一致性

使用垫图+seed,调节表情

如果需要动作,加上动作描述。如果你的动作需要肢体,而第一步生成的图像没有肢体部分,可以考虑去掉Seed 参数。

一位知识博主的AI极简漫画:在长文章中保持角色一致性

使用垫图+seed调节动作

第三步 展现出年轻到年老的不同阶段

其实和之前的方法类似,提示词中加上年龄,比如45-years-old, 或者年轻照片中提示词输入 —no wrinkles, 这里输入 with wrinkles,这里不再举例。

第四步 不同角色合成一张图片

这一步使用的都是传统工具,主要是完成以下工作:

  • 把图像做镜像转换,这样看起来两人是面对面在说话。

  • 加上气泡,文字。

一位知识博主的AI极简漫画:在长文章中保持角色一致性

合成两个人对话的图片

我自己体验了一些传统工具,最好的是figma-jam工具,免费版可以有三个画板,对于一个小知识博主来说,目前够使用了。

总结

刚开始使用Mid-journey的时候,总觉得是在“抽卡”,也被人物风格不一致所困扰,但是在真正深入使用之后,在抽卡的同时的确有些方法来控制。相信AI工具在确定性和不确定性之间会有一个平衡,来满足不同应用的诉求。


我是关注AI产品的产品二姐,致力于带来丰富的AI学习分享、体会,欢迎关注、点赞、转发、收藏。

原创文章,作者:产品二姐,如若转载,请注明出处:https://www.agent-universe.cn/2023/12/8550.html

Like (0)
Previous 2023-12-03 22:38
Next 2023-12-05 10:25

相关推荐

  • 大模型日报(1月4-5日 学术篇)

    我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。 「奇绩大模型日报」知识库现已登陆飞书官方社区: https://www.feishu.…

    2025-01-05
    66
  • 大模型日报(11月11日 资讯篇)

    我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。 「奇绩大模型日报」知识库现已登陆飞书官方社区: https://www.feishu.…

    2024-11-11
    71
  • 一探究竟ChatGPT和DeepSeek推理能力

    打开ChatGPT发现,新版已经支持推理功能了,或许是针对DeepSeek不得已而为之吧。我迫不及待地想一试究竟,看看ChatGPT的推理能力如何。 下列文字是本人在笔记本上写的几…

    2025-02-16
    73
  • DeepSeek,成了文科生的意难平

    内容丨特工少女 江离 审核丨特工小天 刘慈欣在 2003 年发表了一篇科幻短篇《诗云》,文中提到,宇宙高等文明“神族”以能量形态存在,自诩为终极艺术的主宰。他们偶然发现人类文明,对…

    2025-02-13
    61
  • 来自真格基金的AI英雄帖

    此刻,我们都已经知道未来即将发生深刻的改变。我们即将加速进入一个新的周期。 有人说 ChatGPT 的发布对于 AI 行业来说如同浏览器时代的网景时刻,也有人觉得黑莓或者 iPho…

    2023-02-14
    144
  • 发布即开源,又一大厂入局 AI 视频生成

    昨日,腾讯科技发布了一篇题为《AI 视频的后 Sora 时代》的文章,里面详细介绍了 AI 视频技术的发展以及各家的产品和发展历程。 回望这近一年的发展,未免有些吊诡而又有些欣慰。…

    2024-12-03
    594
  • 大模型日报(10月12日 资讯篇)

    我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。 「奇绩大模型日报」知识库现已登陆飞书官方社区: https://www.feishu.…

    2024-10-12
    73
  • 聆听出海创业者的故事原声|「真格精酿·出海冒险家」回顾

    3 月 25 日,真格基金在深圳举办了「抬头看路|真格精酿·出海冒险家」活动,邀请到了相关一线创业者和资深从业者,从东南亚电商、Global FinTech、跨境 Saa…

    2023-04-07
    146
  • 国内首个 AI IDE,今日上线

    内容丨特工少女 技术支持丨特工小鹏 特工小天 今年春节前夕,字节在海外上线了 Trae,The Real AI Engineer,一款对标 Curso…

    2025-03-03
    44
  • MolarData| AI领域资讯速递

    MOLAR NEWS 2021年第6期   MolarData人工智能每周见闻分享,每周一更新。 学界丨图灵奖得主 Yann LeCun 最新文章 :自监督学习,人工智能世界的“暗…

    2021-03-29
    195