基础教程: Coze “图像流” 抢先体验
原创: Stuart + 来来 背景: Coze.cn 于 5.13 晚上上线了“图像流”功能, 一个多小时后因不知名原因, 光速下架, 现已重新上架。 本文的目的是对工具做个快速试用, 让没用过的小伙伴们快速了解“图像流”, 迅速上手, 构建自己的创意。
“图像流”概念
图像流, 有点难理解, 但是从它出现的位置就能理解, 它被 coze 定位成种类似于“工作流”的 agent 工具之一。
熟悉使用 Comfyui 画图的小伙伴应该比较熟悉 SD 的工作流的概念, 但是这里的 “图像流” 和 comfyui 不同的是, 它提供的更适合普罗大众: 一眼就能看懂的工具名称, 不太难理解的输入输出参数, 都展示了 coze 产品经理对于用户体验的深刻理解。 (这里请 coze 的产品经理联系下我提供下赞助:P)
以下为所有“图像流”提供的工具节点:
分三类, 第一类纯 AIGC 工具, 第二类传统的修图工具,可能用到 AI, 可能没有, 第三类就完全传统的图片编辑工具了。
以下对各个节点进行简单的试用, 让大家快速理解实际效果, 为大家的创意提供更好的思路。
PS: 一想到创意我就想到关键词学社的 xixi, 珠珠, 阿朔, 是怎么回事? 😓
体验视频:
文生图
开始和结束节点就不多说了, 熟悉 coze 的小伙伴都知道, coze 要求工作流中必须有这两个节点。 直接进入正题, 说文生图。
节点参数
默认画 1088*1088 的方图 (Coze.cn 的产品经理, 或者程序员肯定是个中国人!)
最大能画 1728*1728 的方图, 最小 576*576, 当然这个像素区间以内的各种比例任你挑选。
Ratio 是一个程序员常用的“枚举”操作, 用几个数字代表了不同图的比例 -- 应该是一个程序员设计的。
试用效果
来个“祖传”提示词: 1 girl
。 实测效果偏向网红 x 动漫风。
试用中文提示词“一个现实风格的女孩”, 可以看到可以支持中文:
再复杂点, 来点摄影词汇 (貌似欧美人照片依旧是模型的主要数据)
双重曝光, 大光圈, 小女孩在里面, 母亲作为轮廓
最后从关键词学社要了点词过来, 苏绣:
embroidery art ,Suzhou gardens, landscape painting, Luminous colors, exquisite workmanship maximalism
最后来一个更专业的:
Double exposure Photography, Guangzhou Tower blending with a woman's face, Photographed through the window, dreamy misty atmosphere,rolleiflex photo, Portra 800 film --ar 3:4 --style raw
左边是关键词学社大神用 MJ 画的, 右边是 coze 画的, 对比下效果: (大家可以感受下哪些词没产生效果) 😂
MJ 画的:
Coze 画的:
意外事件
😯 我遇到了风控: 在写入现实主义时, 遇到了 risk control, 看起来应该是“主义”触发的风控。
尝试去掉关键字, 再来一次, 成果了。 验证了猜测。
智能换脸
节点参数
这里有 3 个参数: 这个节点需要 2 个图, 一个是脸图,一个是底稿图。
第一个 reference 指的是参考的脸, 也就是会换上去的脸。
第二个 template 指的是背景图, 也就是脸会被换掉的图。
skin 指的是美肤。
节点参数
这里我尝试生成了一张图做底稿, 用了一个真人图片 (如侵删) 来尝试换脸:
真人图:(如侵删)
换脸结果: (眼睛睁开了, 风格挺像)
美肤拉到 1, 再来一次:
古风美女, 有手就行。 不过美肤的效果就是导致脸部磨皮涂抹痕迹严重。
可以帮你实现抱上皮卡丘的愿望哦!
当然, 图片反过来也是可以的, 效果就是写实的照片上, 有一点动漫风格的脸。 使用场景大家自己想。 😂
也可以自己放进两张真实的图来替换脸, 添加方式在开始框加上一个输入参数, 类型为 image 即可:
意外事件
⚠️ 在没有很明显的人脸的时候会报错哦!
纯动漫风格的时候好像也不太行:
💡小技巧: 在文生图的提示词里加上写实风格, 能提高成功率
背景替换
节点参数
这个节点参数围绕着 3 个核心参数展开:
- Base_image_url: 这个就是主体图, 说明里说是要透明背景, 但是实测背景可以不透明, 节点会自动扣图。 输出的图和这张输入的图分辨率/尺寸保持一致。
- ref_image_url: 这个参数是参考图, 和下面那个参考提示词参数至少二选一, 甚至可以都选😓。 参考图就是背景图, 可以由其他参数控制它的权重 (也就是和参考图片的相似度)
- ref_prompt: 这个参数是参考提示词, 可以在完全没有图的情况下, 用语言画出背景, 属于抽卡类型。
额外参数:
- noise_level: 背景和参考图的相似度, 和我们常规思路相反, 数值越大, 相似度越低。 0-999 取值, 默认 300。
- ref_prompt_weight: 当同时有图和提示词的时候, 控制两者融合中各自的权重, 总和为 100%也就是 1, 这个值代表的是提示词的权重, 剩下的给图。
- scene_type: 这个参数是个场景参数, 就很有电商风格了, hhhhhh
试用效果
虽然提示说要透明背景的图, 但是当尝试用了一张带背景的图, +提示词“夏威夷海岛上”, 实测不需要自己加抠图节点, 直接会抠出主体, 然后把背景换成提示词。
效果意外的还不错, 有时候抠图会有些毛刺, 但是有时候就很不错。
💡有没有很像 AVG 游戏图? 可以大幅度降低 AVG 游戏的制作成本!
再来尝试下, 动漫风格立绘和实景结合, 用生成图结合实景图。 -- 去掉提示词, 用以下纯实景图, 并且结合不同权重的效果。
权重=0
权重=默认 300
权重=999
可以发现, 权重的在 0 和 300 时差的不多, 同时 0 页没有严格的复制原背景图, 依旧只是参考了风格, 300 时画了好多吃瓜群众, 999 干脆就不参考, 连色调都不一样了。
让我们来测试下, 同时结合提示词和图片, 提示词输入“天空中一群白鹭飞过”, 图中正好空中没有白鹭。
实测不输入权重值时, 没有画出白鹭:
而输入参数的情况下, 直接不可用, 目测有 bug, 平衡图和提示词的权重参数不可用。
⚠️ 建议在修复之前都不用。
再来试试最后一个参数, 电商常用的场景参数。 采用提示词生成背景: “沙滩边, 海鸥”
默认通用场景
室内场景
美妆场景
除了第二张室内场景出现了场景崩坏,其他都还好, 猜测应该是用一定的默认触发词对应加了权重, 或者加了一些对应的 LoRA。
意外事件
在我放入一个普通家具沙发作为底图, 背景提示词用了“家里火炉和窗户边”时被判定为“violent_armedForces”。 估计是“火”这个字导致的。 判定相当严格。
去除火
字后再次尝试, 证实了我的猜测:
多图融合
多图融合, 介绍上说: 在目标图上添加参考图的风格, 从语意上理解, 猜测是类似 SD 的 ip adapter 插件 -- 垫图神器。 (甚至有可能就是。 😄)
节点参数
核心参数就是两个图, image2 是目标图, image1 是参考风格的。
两个图的权重, 以及提示词, 以及对应权重。
ratio 是输出的图片比例。
style 只能选动漫还是写实。 (和之前的试用结果差不多, 基础模型偏动漫风格)
试用效果
实际使用发现它参考的更多的风格在衣服, 人物姿势上。 总之它的效果让你美美的不难, 适合非美术专业的普通人使用。
参考图
目标图
合成图
这里看到默认输出的方形, 我们给 ratio 设置上 5,竖着 9:16 的手机竖屏拍照图如约而至:
再加上动漫风格, 会出现动漫图, 这里就不放图了, 有点不适合放....
如果加上提示词, 如果和两个图都无关, 可能出来的结果会奇奇怪怪。
💡 小技巧: 建议只写一些和图片相关的提示词, 比如这个美女的提示词可以写她的动作, 你将得到同一位美女的不同动作, 很适合用于保持风格的图片集制作。
突然想到前几天有人问我是不是可以做男生+女生未来的孩子的脸部预测, 来试试:
结果么, 很好很抖音, 至于像不像, 见仁见智了。 至于美不美, 至少我觉得挺好看的, 哈哈😂。
+
人像风格化
这个所谓的人像风格化, 就是指把人物的照片改成某种风格的照片。
节点参数
参数核心的反而是最后一个参数 style_prompt, 提供了 5 种风格如下:
必须参数 url 是指要改风格的图, user_prompt 是指图片中添加的内容。 剩下的参数是图片出来以后的长和宽。
⚠️ 实测这个长宽参数有个 bug, 长宽不生效, 画出来和原图比例一致。
试用效果
默认的不填, 就是变成新海城风格。
我们尝试输入 1。 提示词“海边” 2。 长宽都是 888, 3。 默认风格 0
用之前常用的图垫图:
可以发现长宽不生效, 提示词生效了, 画了海边, 风格还不错:
以下是 1。 提示词 “山顶” 2。 风格水彩风格 -- 和原图不太像了
以下是 1。 提示词 “海岛” 2。 风格穆夏 -- 有点崩坏
以下是 风格 2.5d -- 脸部 95%崩坏, 不建议用
以下是风格水墨--- 画出来也是奇奇怪怪的。
💡 如果不在意是否和原图相似度, 只是单纯做个水墨风格的插画, 人的姿态比较相似的, 这种可以用。
⚠️ 5 个风格中, 有时候手的动作或者脸部或多或少地会崩坏, 还是需要多次抽卡。
空间风格化
从描述上看是建筑或者室内设计风格的变更, 风格也是法式美式啥的。
节点参数
那和人物风格化一样, 核心参数一定是风格 style:
试用效果
试用打算分特色建筑, 普通民房和室内装修两类: 以下为垫的图
特色建筑
东南沿海高级农民房一套
普通一线城市室内装修
测试结果, 建筑的比如图一和图二, 在没有任何提示词的情况下, 除了中国风画出来有点像没加纹理的 3d 白模型
但是提示词可以修改墙面颜色, 但是修改纹理还不清楚提示词, 比如这个提示词“绿色外墙”的农民房:
即使是家装而言, 也很素, 或许通过特定的提示词能用, 目前犹未可知, 以下风格对应 0-3, 第二行 4-6
|
||
|
|
|
智能扩图
这个节点适合用于构图不太对想改变构图的图片。
节点参数
参数分别是往 4 个方向扩图, 只能选择扩或者不扩, 不能选择扩多少像素。
试用效果
我们先来文生图, 生成一个方图, 然后向左扩图, 效果如下, 变成了一个新构图的长图, 效果不错。
再来左边和上面同时扩图, 效果也不错。
来个实景照片试试, 比如下图虽然很美, 方形构图可能不讨喜, 我们来把它变成长图。
实景图扩图效果粗看, 尤其是天上的云很震撼, 细看有些复杂的画面, 完全经不起推敲
💡小技巧: 扩图的部位尽可能的简单, 不容易出现崩坏。 要加提示词的话也一样, 建议加些简单的, 不建议画人之类的, 崩坏结果惨不忍睹
举个例子, 以下这个图, 最简单的部位就是路面, 扩图就扩路面, 对于构图也加深了道路的引导线, 效果还行。
向下扩图后的效果, 还行。
提示词优化
节点参数
这个节点还是比较容易理解的, 如果我们觉得自己提示词需要优化, 加入它进行优化。 参数也很简单, 就一个要优化的提示词。
试用效果
通常这一类的节点很好用。 我们用一开始就在用的文生图提示词: 1 girl in real world
来试试。 这里我们用优化前和优化后都生成一张图, 也做个效果对比:
它给我把提示词优化成以下内容:
1girl, ultra-detailed, realistic photo style, reading a book with curiosity, in a sun-dappled library, soft lighting, warm color palette
翻译下: 一名女孩,超精细写实照片风格,带着好奇心阅读书籍,置身于阳光斑驳的图书馆内,柔和的光线,温馨的色彩搭配。
它为我们添加了很多具体的信息, 比如在带着好奇心看书, 环境中有阳光, 色彩搭配的特点。 来看下实际文生图效果对比: --- 修改后的提示词貌似很难把图片控制在真实照片的感觉, 测试结果中它的文生图模型中“in real world”来控制更真实的图片生成效果比“realistic”效果好的多。
(😂喜欢哪个见仁见智了, 不过也有抽卡的因素在。 至少右边的打光的感觉不错。)
|
|
智能抠图
节点参数
参数只有一个, 就是要抠的图片, 如果是前一个节点连线进来, 只要引用输出的图片即可。
试用效果
如果是随便生一张图, 会发现抠图效果一般, 因为头发的关系, 抠的边缘没有到极致:
💡 小技巧: 如果用生成的图, 可以在提示词里要求背景是和图中主体呈现大对比度的纯色, 比如“背景是白色”:
💡 小技巧: 如果是自己上传的图, 尽量选择边缘比较平整, 背景和主体有明显对比的图。
画质提升
节点参数
也是很简单的一个节点, 就一个参数是要改的图。
试用效果
嗯, 效果有一点, 图片分辨率变大了, 文件大小也变大了, 从 25k 的图变成了 1.5m
|
|
美颜
节点参数
这个没啥好说的了, 和手机美颜差不多。
试用效果
做个简单效果对比, 反正就是美图秀秀效果, 还是看的出来的。
拉伸修复
节点参数
参数很简单, 使用也是传统的图片智能修复工具, 就不做试用了。
透视矫正
节点参数
参数很简单, 使用也是传统的图片智能修复工具, 就不做试用了。
裁剪
节点参数
这个节点简单说明下它的参数逻辑, 它的裁剪有个坐标概念, 也就是下图中的 location, 加上 x, y。
Location 提供了常用的 8 个初始坐标如下图所示, 加上 x, y 坐标轴偏移来确定开始裁剪的坐标。
添加文字
节点参数
参数很多, 逻辑也是从 8 个常用点出发, 偏移一定的参数量来确定文本的位置, 剩下就是字体, 阴影之类的。
试用效果
尝试在一个毕业证书上加个名字。 可以提高批量做证书, 打水印的效率。
叠图
节点参数
参数主要对要叠的图进行设置, 调整它的透明度, 缩放, 摆放位置。
其次就是两张图, 一张底图, 一张叠上来的图。
试用效果
对于这个功能, 最常用的就是打图片型的水印了。 测试下效果, 以下我填的参数, 供大家参考:
|
|
亮度
节点参数
就是做到提亮或者变暗, 和大部分图片编辑软件做的一样。
对比度
节点参数
和大部分图片编辑软件做的一样, 修改对比度。
旋转
节点参数
和大部分图片编辑软件做的一样, 旋转图片。
缩放
节点参数
图片的放大缩小, 和前面的画质提升不同的是, 它不改变图的清晰度, 如果放的很大就全是马赛克了。
实操演示图像流(来来)
前情提要
1》大家现在已经知道了图像流中每个节点的作用,我们现在实际演示几个完整的图像流给大家。
2》图像流必须有的两个节点是开始和结束,每个节点要连接起来。
趣味换脸【适用个人娱乐】
https://www.coze.cn/work_flow?space_id=7366298586058850358&workflow_id=7372563849125363751
核心节点:多图融合+智能换脸【红色标注】
多图融合:用来融合参考图和用户上传图片
智能换脸:换脸
毛坯房变精装修【适用建筑行业】
https://www.coze.cn/work_flow?space_id=7366298586058850358&workflow_id=7372559633988206644
核心节点:空间风格化【红色标注】
多图融合:用来给毛坯图加上各种建筑风格,支持6种风格
穿越变宫女【适用个人娱乐】
https://www.coze.cn/work_flow?space_id=7366298586058850358&workflow_id=7372562982607421475
核心节点:提示词优化,文生图,智能换脸【红色标注】
提示词优化:用来把用户写的提示词智能扩充并翻译
文生图:使用用户的提示词自动生成图片
自动生成产品图【使用电商行业】
https://www.coze.cn/work_flow?space_id=7366298586058850358&workflow_id=7372562785181646889
核心节点:提示词优化,文生图,背景替换【红色标注】
背景替换:替换为我们指定的背景
父母照片推测生成小孩照片【适用个人娱乐】
https://www.coze.cn/work_flow?space_id=7366298586058850358&workflow_id=7372563496745189417
核心节点:多图融合【红色标注】
多图融合:用来融合爸爸和妈妈的照片
制作中文海报【适用各行业】
https://www.coze.cn/work_flow?space_id=7366298586058850358&workflow_id=7372560505291964443
核心节点:添加文字
颜色代码:https://www.zhongguose.com/,但是有个BUG不支持有彩色