景淮:儿童眼力大考验-GPTs 实战
嘿,大家好呀,我是景淮,一个加拿大的程序员,沉迷 AI 不能自拔中。
欢迎大家关注公众号: 景淮AI探索之旅
一晃一个月过去了,只字不提我的孩子王系列内容啊,大家是不是以为我要假装忘记了... 其实并没有,做为一个有思想、有觉悟的新青年。我最多就是太忙,有点懒,没写而已。
但不要慌,我景淮又回来了!
没错,今天我们的主题又回到孩子王系列了!
GPT 儿童脑力大开发之眼力大考验
本文会根据以下内容顺序进行:
- 需求分析
- 分步实现需求
- 提示词编写测试
- GPTs 使用链接
- 总结
一、需求分析
如图所示为眼里大考验小游戏。游戏由两部分内容组成,一部分为提问的问题,另一部分为一张又很多相似的小物件拼成的图片。
一)图片
图片由 3-5 个物品组成。通过观察图片,我们不难发现,同样的物品也存在相似性。
例如,图中的帽子,有的样式会有些区别,有的颜色会有区别。
总结下来,改变如下:
- 样式细节
- 颜色
- 物品大小
- 物品的角度
然后把这些图片无规则的拼在一起,组成大的图片,即打乱顺序。
二)提问
关于提问的方式,我们可以换一下逻辑。这次我们先完成画图,然后再基于生成的图片,来提问题。(也就是利用GPT 的读图能力)
二、分步实现需求
关于物品的图片生成,可以直接在网上搜索相关的图片素材或者是利用 D3,MJ 画图都可。但要注意物品的图片背景颜色最好是白色,一图一物品。
一)第一次失败的尝试
1、准备材料
比如我们可以选择任何我们想要的场景,让 GPT 提示我们。
画图后依次生成以下五个图片。
利用在线 AI 自动扣图工具处理一下图片,如:https://www.remove.bg/zh。
处理后的图片
2、Python 绘图
我们需要结合前面内容的特点编写提示词。
- 打乱原有的上传顺序。
- 必须保证绘图中使用的物品至少出现2次,并且每个物品出现的次数为偶数次。
- 使用从左至右,从上到下的熟悉依次放入图片。使用图片每次从五个物品中随机出现。
- 随机到的图片可以经过以下处理:
- 原图 60% 概率,图片改动 40%
- 图片改动:
- 任选图片中的某一细节部分,改变其颜色 50%
- 任选图片中的某一细节部分进行微调,如增加简单的花纹等。50%
- 图片改动:
- 图片缩放:原图概率 50%,图片放大1.2倍 25%,图片缩小1.2倍
- 图片旋转:原图概率 50% ,图片进行任意角度旋转 50%
- 原图 60% 概率,图片改动 40%
提示词
请使用上传的五个物品图片根据下面的要求处理后完成一幅新的图片,要求新的图片中至少包含 20 个上述图片的原图或变形后的图片。保证图片的背景为白色。同时使用Python完成上述图片要求。
1. 缩放所上传的所有图片到统一大小。
2. 打乱原有的上传顺序。
3. 必须保证绘图中使用的物品至少出现2次,并且每个物品出现的次数为偶数次。
4. 使用从左至右,从上到下的熟悉依次放入图片。使用图片每次从五个物品中随机出现。
5. 随机到的图片可以经过以下处理:
501. 原图 60% 概率,图片改动 40%
502. 图片改动:
5021. 任选图片中的某一细节部分,改变其颜色 50%
5022. 任选图片中的某一细节部分进行微调,如增加简单的花纹等。50%
503. 图片缩放:原图概率 50%,图片放大1.2倍 25%,图片缩小1.2倍
504. 图片旋转:原图概率 50% ,图片进行任意角度旋转 50%
完成后展示生成的新图片给用户,同时确保新图片的高宽比为1:1
测试失败
没有按照要求进行绘画,而且图片也失真了。
跟想象中的不太一样...
二)尝试直接使用 Dalle3
1、 绘图提示词
画一幅图片:要求包含要求新的图片中至少包含 5 个物品或变形后的物品。图片的背景为白色。
物品依次为 电动牙刷、漱口水、抗菌压线、洗面奶、毛巾
1. 所有物品设定为统一大小。
2. 打乱原有的物品顺序。
3. 必须保证绘图中使用的物品至少出现2次,并且每种物品出现的次数为偶数次。
4. 使用从左至右,从上到下的熟悉依次放入图片。使用图片每次从五个物品中随机出现。
5. 随机到的物品图片可以经过以下处理:
501. 原图 60% 概率,图片改动 40%
502. 图片改动:
5021. 任选图片中的某一细节部分,改变其颜色 50%
5022. 任选图片中的某一细节部分进行微调,如增加简单的花纹等。50%
503. 图片缩放:原图概率 50%,图片放大1.2倍 25%,图片缩小1.2倍
504. 图片旋转:原图概率 50% ,图片进行任意角度旋转 50%
完成后展示生成的新图片给用户,同时确保新图片的高宽比为1:1,图片中可出现的总数量为20个
儿童插画风格(极简风格)
Create an image with a minimalist children's illustration style on a white background, featuring 20 items arranged from left to right and top to bottom in a random sequence.
测试之后,只能对原有的需求进行微调。比如现有 Dalle-3 的效果就肯定没有使用 Python 画出来的效果好。最主要的问题是稳定性上,不如 Python 效果好,没法准确的按照要求绘制出对应数量的图片。
而且很难找到一样的两个“牙刷”。所以我们可以尝试在提出问题时使用“同类物品来定义” 比如有几个牙刷等。
2、提出问题
针对上图,提出5个适合锻炼 3-5岁小朋友观察力的问题。
- 你能数一数有多少个蓝色的电动牙刷吗?
- 画中有几个漱口水瓶子?它们的颜色都一样吗?
- 能找到所有的洗面奶并说出它们的颜色吗?
- 图中有多少条毛巾?毛巾上有没有花纹?
- 你能找到所有的抗菌牙线吗?它们放在哪里?
三、提示词编写测试
写提示词之前,我们要想到我们的重置步骤:
- 用户输入某一场景。
- 生成 5 种场景内有的,并且学前孩子知道的物品。
- 结合绘画提示词绘制图片
- 根据生成的图片给出5个问题。
一)初版提示词
# Workflows:
1. 输入:等待用户输入一个场景。
2. 物品:根据用户提供的场景,给出五个此场景中常见的、学前孩子了解且熟悉的物品。
3. Dalle-3绘图:结合选择的五个[物品],和下面的[绘图提示词]和[要求]创建出新的提示词,并使用新的提示词绘制图片。
- 要求:
```
画一幅图片:要求包含要求新的图片中至少包含 5 个物品或变形后的物品。图片的背景为白色。
1. 所有物品设定为统一大小。
2. 打乱原有的物品顺序。
3. 必须保证绘图中使用的物品至少出现2次,并且每种物品出现的次数为偶数次。
4. 使用从左至右,从上到下的熟悉依次放入图片。使用图片每次从五个物品中随机出现。
5. 随机到的物品图片可以经过以下处理:
501. 原图 60% 概率,图片改动 40%
502. 图片改动:
5021. 任选图片中的某一细节部分,改变其颜色 50%
5022. 任选图片中的某一细节部分进行微调,如增加简单的花纹等。50%
503. 图片缩放:原图概率 50%,图片放大1.2倍 25%,图片缩小1.2倍
504. 图片旋转:原图概率 50% ,图片进行任意角度旋转 50%
完成后展示生成的新图片给用户,同时确保新图片的高宽比为1:1,图片中可出现的总数量为20个
儿童插画风格(极简风格)
```
- 绘图提示词:永远使用下面的内容做为绘画提示词的开头部分:“Create an image with a minimalist children's illustration style on a white background, featuring 20 items arranged from left to right and top to bottom in a random sequence. ”
4. 提问:根据绘制出的图片,针对于图片中的细节进行提问。
- 每次给出五个问题,要求适合锻炼学前小朋友的观察力锻炼。
- 提问中对物品名称的使用,使用最常见,最笼统的叫法。比如电动牙刷只使用牙刷即可。
二)迭代后的提示词
# Workflows:
1. 输入:等待用户输入一个场景。
2. 物品:根据用户提供的场景,给出五个此场景中常见的、大家了解且熟悉的物品。
3. Dalle-3绘图:结合选择的五个[物品],和下面的[绘图提示词]和[要求]创建出新的提示词,并使用新的提示词绘制图片。
- 要求:
```
画一幅图片:要求包含要求新的图片中至少包含 5 个物品或变形后的物品。图片的背景为白色。
1. 所有物品设定为统一大小。
2. 打乱原有的物品顺序。
3. 必须保证绘图中使用的物品至少出现2次,并且每种物品出现的次数为偶数次。
4. 使用从左至右,从上到下的熟悉依次放入图片。使用图片每次从五个物品中随机出现。
5. 随机到的物品图片可以经过以下处理:
501. 原图,图片改动
502. 图片改动:
5021. 任选图片中的某一细节部分,改变其颜色
5022. 任选图片中的某一细节部分进行微调,如增加简单的花纹等。
503. 图片缩放:原图,图片放大1.2倍,图片缩小1.2倍
504. 图片旋转:原图 ,图片进行任意角度旋转
完成后展示生成的新图片给用户,同时确保新图片的高宽比为1:1,图片中可出现的总数量为20个
儿童插画风格(极简风格)
```
- 绘图提示词:永远使用下面的内容做为绘画提示词的开头部分:“Create an image with a minimalist children's illustration style on a white background, featuring 20 items arranged from left to right and top to bottom in a random sequence. ”
4. 提问:根据绘制出的图片,针对于图片中的细节进行提问。
- 每次给出五个问题,要求适合锻炼大家的观察力锻炼。
- 提问中对物品名称的使用,使用最常见,最笼统的叫法。比如电动牙刷只使用牙刷即可。
- 提问时不要提起任何有关于图片旋转和缩放的问题。
- 示例:
找到一个黄色的牙刷。
图片中有多少个毛巾?
分别说出香皂是什么颜色的?
找到一个红色的洗手盆。
指出马桶都在哪一列?
## Constrains :
- 提示词的使用者都是成年人,但是这些人属于残障人士,智力水平处于5岁左右儿童的水准。所以出题时,要参考5岁左右儿童来出题。
## Initialization :
永远使用中文和用户进行对话。
不得不吐槽这个限制 13 岁以下儿童不能使用,真的做起 GPTs 来太难受了。
强行结合特殊方法 + 示例。
好讨厌!
三)效果展示
四、GPTs 链接
https://chat.openai.com/g/g-i1rS3llrm-yan-li-da-kao-yan
五、总结
游戏的制作流程比较简单,没有每次的内容复杂,主要也是因为很多小伙伴反馈,我的内容好像越做越复杂了。看起来比较吃力。
所以,我这个系列的内容就尽量尝试用简单清晰的流程来完成我们想要的内容就好啦。
最后还是想吐槽一句,这个 13 岁以下孩子的限制实在是太烦人了!
好啦,写到这里我们今天的内容也结束啦,感谢大家的观看,也希望我的内容能够让大家喜欢,有所收获。感兴趣的小伙伴可以点个关注跟随我一起学习,观看更多往期文章。
下次见,我是景淮,祝你有个开心美好的一天~