有关于AI绘画的经验分享

三月 31, 2025 / Ming / 7阅读 / 0评论/ 分类: 默认分类

有关于AI绘画-stable diffusion的经验分享
本篇是对于目前AI绘画的一些经验分享

话不多说,开始:
梳理一下本篇文字大概流程:
一、概念普及
二、安装教程
三、模型下载
四、插件使用
五、提示词书写
六、预测前景


一、概念普及:


目前市面上AI绘画多如牛毛,主流以midjourney与Stable diffusion为主,MJ不多说了,会科学上网,会打字,就能画出作品,这方面对小白极其友好,因为只要能上网,无所谓设备,手机电脑都可以,而且出图都还不错,很精细,不过,缺点就是,需要氪金。因此体验一下我就被劝退了,所以本篇心得主要就是针对SD的教程。


1.优劣势比较
MJ优势:使用方便,不限设备,出图精细
MJ劣势:费用高,科学上网,不支持NSFW(你懂得的那种图),封闭开发。
SD优势:开源,模型众多,支持NSFW,插件多,图可控性强。
SD劣势:学习成本高,只能电脑端,显卡要求高,需要具备一稍微点的linux,windows,python的知识。
2.前期准备

使用SD有三种方案。
2.1本地部署:需要独立显卡,且显存大于6G。4G勉强也行,但不建议,别折腾了。
2.2云端部署:有阿里云,Autodl,青椒云,谷歌云,还有很多,基本都是按时收费,我使用的是阿里云的,因为有个试用,前期免费,具体价格自己比对,我没做太多研究。
2.3在线生图网站:我知道的国内有liblib(哩布哩布),吐司,注册都有免费使用次数。


二、安装教程


本地安装:
我只描述一下流程,具体的安装方案,点击链接,基本都是B站资源。
最早是在github下载的AUTOMATIC1111的webui,自行git部署安装的,后来有了一众大佬制作整合包,基本是把饭喂到嘴里了,下载即可用。我本地用的是秋葉启动包,就用这个演示了。
1.下载后,点击A启动器.exe根据设备情况调整参数

2.点击一键启动,黑色命令框便是本体,中途不可关闭,启动后会打开一个网页,这便是webui的由来,一切作图都在ui界面输入。


1.B站UP主:秋葉aaaki 一键整合包
2.B站UP主:独立研究员-星空 一键整合包
3. Github部署:安装Git,安装Python3.10后续版本 不推荐,太麻烦

还有很多,不再一一赘述
云端安装:
看我参考了这个UP主


三、模型下载


这儿提到的模型,英文是chickpoint,一般称大模型,底模,基本在2G以上,还会有Lora小模型(特定风格,特定人物),通常在30多M与100多M之间,大模型必不可少,Lora
模型没有也可以,chickpoint下载到“models\Stable-diffusion”这个路径下,Lora下载到”models\Lora”这个路径下,此外还有embeddings、扩展模型,提到了再说。

之前通常在C站抱脸下载,现在C站已被墙,所幸国内也有一批做模型的网站,上面提到的liblib,吐司等。
常用的有二次元的模型(anything),真人模型(chilloutmix),2.5D模型(Ghostmix),这些都算老模型了,可以自己去找喜欢的模型下载。
再夹带个私货,我自己炼的丹,几个平台都发了,都是Lora,感兴趣的可以看看。
乡|江南水乡-烟雨朦胧-建筑篇
乡村_建筑篇-villageV1.0
酷女孩_人物篇-KusGirl


四、插件使用


插件通常在webui的扩展中下载,值得一提的是,整合包已整合了多款插件,包括汉化插件contolnet插件,需要其他插件我可再开一期,单独介绍,插件是sd区别与mj最核心的关键。

此外,还有自行下载扩展包放入,也可在从网址安装中输入网址,通常是github的地址
,扩展文件在根目录这个路径“extensions”下。
常用插件如下:
1)controlnet插件:可约束姿势,修复身体,线稿上色,高清修复等
地址:https://github.com/Mikubill/sd-webui-controlnet
插件模型地址:https://huggingface.co/lllyasviel/ControlNet-v1-1/tree/main

2)openpose编辑器:编辑人体骨骼图,配合controlnet使用:
地址:https://github.com/fkunn1326/openpose-editor.git

3)prompt-all-in-one:提示词英转文,输入中文自动翻译
地址:https://gitcode.net/ranting8323/sd-webui-prompt-all-in-one

4)4)SadTalker:制作数字人,可使图片中的人张口说话
地址:https://gitclone.com/github.com/OpenTalker/SadTalker

5)adetailer:修复人脸,手
地址:https://ghproxy.com/https://github.com/Bing-su/adetailer


五、提示词书写


提示词是AI绘画的核心,你能画出一个什么样的作品,就在于你的提示词是否合适,请注意,是合适,不是标准,提示词没有一个固定的标准,需要魔法师们自行领会。
不过,我这儿提供一个关于提示词的通用的语句,通常是摄影的属于,适合真人时使用:
(HDR,UHD,8K, best quality, masterpiece, Highly detailed, Studio lighting, ultra-fine painting, sharp focus, physically-based rendering, extreme detail description, Professional, Vivid Colors, art gallery, Cinematic Lighting,)
还有一段反向提示词,表明你不需要什么,就加进去,这是一个示例:
((((extra arms and legs))), (((extra arms))), (((extra legs))), (((missing arms))), (((missing legs))), (((simple background))), ((grayscale)), ((monochrome)), (bad anatomy:1.21), (bad proportions:1.331), (disfigured:1.331), (duplicate:1.331), (extra legs:1.331), (fused fingers:1.61051), (low quality:2), (missing), (arms:1.331), (morbid:1.21), (mutilated:1.21), (normal quality:2), (too many fingers:1.61051), (tranny:1.331), (ugly:1.331), (unclear eyes:1.331), (worst quality:2), acnes, age spot, Black background, bad anatomy, bad feet, bad hands, bad legs, bad proportions, badhandv4, blurry, cloned face, cropped, deformed, disfigured, duplicate, error, error legs, extra digit, extra limbs, fewer digits, gross proportions, hermaphrodite, jpeg artifacts, long neck, low quality, lowres, malformed limbs, missing fingers, monochrome, morbid, mut ilated, mutated hands, (poorly drawn hands:1.5), mutation, NSFW, normal quality, plump, poorly drawn face, poorly drawn hands, pregnant, pubic hair, signature, simple background, skin blemishes, skin spots, text, tran nsexual, ugly, username, vore, watermark, worst quality,)


六、前景预测


1.目前AI绘画及其他AI都在发展阶段,个人认为,AI应该是我们这代人遇到的最大的机遇,如同上个世纪互联网一样,其中的商业逻辑,生活,法律等等都还没有完善,全部处于模糊阶段,虽然说距离真正的如电影中的人工智能还有极其遥远的距离,但是,当产业发展起来,会带动整个社会高速运转。
当然,即使做不到预测中那样,在现阶段,也能够极大的提高效率,相信很多人都体验过chatGPT的功能了,已经是足够颠覆以前互联网的认知了。
2.谈下商业变现
目前都还不明朗,头部如sd,mj,Google,微软等企业,做最底层的服务和前沿技术引领,至于国内,小公司做开源没活路,大公司只会一个比一个贪婪,让他们服务社会,探索前沿技术可算了吧,因此,我们个人应该首先具备语言,学习的能力,尽可能不再次被西方人落下。回到商业角度,B端,C端,G端都是全新的,针对B端,应该是国内的一些头部互联网公司,或者会发展出新的独角兽企业;服务于C端的,类似于我上面提到的liblib,吐司,在绘画行业,收集众多作者模型,只独家生产。至于G端,我了解并不多,特定的企业,特定的条件太多了,搞不懂。
个人如果只是画画图,那只能是个兴趣的玩具,至于能画图赚个小钱,或者通过这个噱头做自媒体,都还只是传统互联网的方式,其他的商业仍需发展后才会显现。

写不动了,未完待续吧。。。


去年就接触AI了,但没有深入,也没当回事,体验了chatGPT,用了用也就过去了,年初也接触过SD,MJ,也是在最近这两个月疯狂迷入了进去,基本上三点前没睡过觉,最长熬到了早上7点,就沉迷其中,各种技术,各种疑难问题解决,这两天才算是缓了下来,能够正常作息,保持晨跑的节奏了。所以静下来后也就写了这么些文字,当个简短的总结,并且审视一下自己以及未来。


评论