Tusiart简易上手教程
💡
本简易教程包含三部分
- 概念与功能说明(能看懂)
- 简明操作流程(能生图)
- prompt简易技巧(能简单控制图)
注意正文加粗的部分是重点。本篇的效果意图达到可以自行使用tusiart的在线SD,如果看完之后不明白,说明我写得不清楚,请评论区激情开麦,或者添加我的微信:designurlife1st后沟通。
吐司(已更新到最新链接)点击蓝字,进入可以免费在线生图的吐司ღ( ´・ᴗ・` )
概念与功能说明
概念说明
- 首页-模型\帖子\排行榜:发布了其他大手子炼成的模型、图片。不同的模型有checkpoint和lora两种不同的标签,有些模型的标签后面还有第二个XL的标签,这是属于SDXL这个新模型的意思。点击后可以看模型的详细信息。模型详情信息的下方,是用这个模型生成的图片,俗称返图区。
- 基础模型:生图必需的,英文名Checkpoint。任何生图操作必须要选定一个checkpoint模型才能开始操作。注意,checkpoint区别于lora,这两个东西在模型广场都是混着展示的。checkpoint必选,lora可选可不选,任何主题的作图需求,都可以试着在模型广场上搜索或者浏览,然后收集到模型库中用于生图。
- lora:低阶自适应模型,你可以理解为checkpoint的小插件,生图的时候lora可有可无。但是lora的价值还是很明显的,基本上你看到一些精细的控制,如面部、材质、物品等等细节都常见于用相应的lora进行控制。旁边的数值是lora的权重。
- ControlNet:控制图片中一些特定的图像,可以用于控制人物姿态,或者是生成特定文字、艺术化二维码等等。也是高阶技能,后面再学不迟。
- VAE:是个编码器,功能类似于我们熟悉的滤镜,调整生图的饱和度。无脑选择右侧截图中840000这个即可。
- Prompt提示词:想要AI生成的内容(不绝对有效,需要多费功夫学习,哪怕从照抄别人开始)。
- 负向提示词Negative Prompt:想要AI避免产生的内容(不绝对有效,也需要费功夫学,哪怕从照抄别人开始)。
- 图生图:上传图片之后,sd将根据你的图片和你选择的模型以及输入的prompt等等信息进行重绘。重绘幅度越大,输出的图和输入的图差别就越大。
- 尺寸:图片生成的尺寸大小。太小了AI生成不了什么内容,太大了AI开始放飞自我。如果你要高清图,可以设置中等的尺寸并用高分辨率修复。
- 采样算法:使用何种采样器,通俗说就是让AI用什么算法生图。
- 采样次数:AI调整图片内容的次数。步骤越多,调整越精密,出图效果理论上更好,生图耗时越长。但是并非越多越好,效果的提升非线性,多了以后效果的增长曲线就放平并开始震荡了。
- 提示词相关性:指图像与prompt的匹配程度。数字增大将导致图像更接近你的提示,但过高会让图像质量下降。
- 随机种子seed:生成的每张图都有随机种子,在固定好种子以后,可以对图片进行“控制变量”效果的操作,比如说修改提示词等操作。如果你第二次生图用来上张图的种子,但是其他设置都不改,就会出一样的图片。(注意,第一次生成图的时候是还没有种子的,不用动这里,空着就行)
- Clip Skip:可以用于在生成图片之后控制、调整构图变化,一般设成2就行了,早期不用花太多精力在这里。
- ENSD: eta 噪声种子增量,这个会改变种子直接默认0就好。
- 高清修复:在本来设置的图像分辨率基础上,让图像分辨率变得更加精细。我理解是和原来的图像分辨率设置形成了两次绘图的流程,第一次绘图出内容,第二次绘图添加画面精细。
- 修复方式:这个我没懂,每次学别人的操作,还不知道影响在哪,等我学会了我会回来改这里的哈哈哈。读者老爷们可以催更。
- 高清修复采样次数:和前面采样次数一样理解就好。
- 重绘幅度:相当于图生图的重绘。在原有的内容上,如果重绘幅度不是0,那么就会在变得高清的同时有一部分内容上的变动,不过用户看不到中间过程。
- ADetailer:面部修复插件,治愈脸部崩坏的超强小工具,高阶技能,后面再学。
功能说明
- 生图入口1:网页顶部的右方有生图按钮,点击进入生图界面。
- 生图入口2:点进首页任意一个模型(checkpoint或lora),有运行按钮。
- 生图入口3:点进任意一个模型下面的返图区(相关帖子),点开一张你喜欢的图片,右侧有做同款的按钮。点开之后可以选择自动复制他所有的设置,尝试复现他的图,体验他的设置效果。注意啊注意,这个生图是直接复现大佬操作,但是肯定不会复现大佬的图。好在大概率能出与大佬同水平同要素的图。快速建立起满足感与信心。学累了就来用这个按钮开心一下,加油ヾ(◍°∇°◍)ノ゙
简明操作流程
文生图
- 定主题:你需要生成一张什么主题、什么风格、表达什么信息的图。
- 选择基础模型Checkpoint:按照你需要的主题,找内容贴近的checkpoint。一般我喜欢用模型大佬麦橘、墨幽的系列模型,比如说麦橘写实、麦橘男团、墨幽人造人等等,效果拔群。
- 选择lora:在你想要生成的内容基础上,寻找内容重叠的lora,帮助你控制图片效果及质量。可以多看看广场上做得好看的帖子里面,他们都在用什么lora。
- ControlNet:控制图片中一些特定的图像,可以用于控制人物姿态,或者是生成特定文字、艺术化二维码等等。也是高阶技能,后面再学不迟。
- 局部重绘:下篇再教,这里不急。
- 设置VAE:无脑选择前面提到的840000这个即可。
- Prompt提示词:用英文写你想要AI生成的内容,不用管语法也不要写长句,仅使用单词和短语的组合去表达你的需求。单词、短语之间用英文半角逗号隔开即可。
- 负向提示词Negative Prompt:用英文写你想要AI避免产生的内容,也是一样不用管语法,只需单词和短语组合,中间用英文半角逗号隔开。
- 采样算法:这玩意儿还挺复杂的,现在我一般选DPM++ 2M Karras比较多。当然,最稳妥的是留意checkpoint的详情页上,模型作者是否有推荐采样器,使用他们推荐的采样器会更有保障。
- 采样次数:要根据你采样器的特征来,一般我选了DPM++ 2M Karras之后,采样次数在30~40之间,多了意义不大还慢,少了出图效果差。
- 尺寸:看你喜欢,看你需求。
- 提示词相关性:指图像与用户输入prompt的匹配程度。数字越大,图像就越接近你的提示。但数字过高会让图像质量下降。在5~15之间为好,我看其他人一般用7,9,12。
- 随机种子:生成的每张图都有随机种子,在固定好种子以后,可以对图片进行“控制变量”效果的操作,比如说修改提示词、修改clip跳过层等等。
- ADetailer:面部修复插件,预防或解决脸部崩坏的超强小工具,高阶操作后面再学,没事勾上也OK。
- CLIP skip:设成2就行。
图生图
图生图其实不难了,在你会用文生图之后,上传图片就可以开始尝试了。但是注意重绘幅度,最小选0.01的重绘也可以的。输出的图片差别还挺明显。
📌
其他诸如局部重绘等高阶功能不在本简明操作流程中,后续进阶内容的教程再展开
prompt简易技巧
认识prompt
好说,你就这么理解——用户是甲方,SD是乙方,prompt就是甲方输出的需求书。
使用prompt
和写LLM的prompt一样,为了用户更好控制效果,建议是结构化书写prompt。
下面用Markdown文本格式,中文来说明prompt的八大结构。注意这里为了学习理解方便用中文来做示例,实操中写prompt必须用英文。详细的prompt教程请见prompt的专场教程-基础篇
##画面词:
这个一般比较固定,常见是大师杰作,最高画质,超高分辨率、8k、极致细节等等
##艺术风格词:
比如是照片还是动漫
##图片的主题:
画的主体是人,还是一只大脑斧,是男性女性,职业是白领或学生
##人物的外表:注意从上到下描述
发型(双马尾,直发,卷发,长发,短发),
发色(黑发,金发,末端挑染彩色),
衣服(长裙,T恤,过膝袜,室内鞋),
头部(首饰,五官),
颈部(项链等装饰),
手臂(露肩等),
胸部(emmm……),
腹部(胖瘦松紧),
屁股(emmm……),
腿部(长腿短腿等等),
皮肤(纹身、出汗之类)
##人物的情绪:
表情的信息(哭,笑,喜悦,悲伤)
##人物的姿势:
基础动作(站,坐,跑,走,蹲,趴,躺),
眼神动作(看观众,看上看下看左看右)
头动作(歪头,仰头,低头),
手动作(拢头发,插兜,放在胸前),
腰动作(弯腰,鞠躬),
腿动作(交叉站,二郎腿,盘腿,跪坐),
整体动作(JOJO立,背对背站)
##图片的背景:
室内,室外,环境如何
##杂项:
比如说NSFW或SFW
顺便推荐一位群友@小天 的提示词字典工具https://ops.jk.cm/#/apps/ops/,选中stable diffusion webui就能用对应的字典了。