AI 绘图工具整理 - Midjourney, DALL-E 2,DreamStudio
这几个月来 AI 绘图差不多就是最热门的话题,这篇文章针对「一般使用者」实测几个常用的 AI 绘图工具:Midjourney, DALL-E 2,DreamStudio,简单介绍和做比较
Midjourney
官网:https://www.midjourney.com/
有在注意新闻的人应该对 Midjourney 都不陌生,最有名的就是一名男子使用 Midjourney 人工智能创作的绘图参加科罗拉多州博览会举办的「Fine Arts Exhibition」美术展获奖。
得奖作品:《Théâtre D’opéra Spatial》
图片来源:wikimedia
这篇文章不讨论 AI 绘图到底会对艺术造成什么影响,只打算单纯介绍要怎么使用 Midjourney
使用方法:
需要先加入 Midjourney 的 Discord 频道,点选官网右下角的「Sign In」
如果之前已经有 Discord 帐号,直接登入就行,如果没有的话,就注册一个
进入 Discord 的 Midjourney 频道后,随便找一个 newbies-XX 的聊天频道进入
频道是大家共用的,所以会同时看到其他人产生的图片
使用方式很简单,于下方的聊天输入栏位中,输入 /imagine,会出现以下方框
然后在 prompt 填入测试的文字,这次我们都使用同样的关键字「cute Ragdoll, infinity pool, swimming, high mountain, simulation」
等一会就可以看到产生出来的图片,因为同时也不少人也在产生图片,需要找一下自己的图片产生在哪里
如上图截图,每次都会有四张图片,在图片下方会有 U1、U2、U3、U4 以及 V1、V2、V3、V4 图示,数字部分,左上为 1、右上为 2、左下为 3、右下为 4。 U 是 Upscale 的缩写,当你满意这张图片时,就可以点选取得大图片,V 是 Variation 的缩写,会根据这张图片再继续下去延伸变化。最右边图示则是重新运算:
ex 选择 V1,以第一张图再往下延伸四张图
ex 选 U4,则产生最后结果的大图
免费次数
新注册会员只能产生 25 张图
3/31 更新,文章才写完没多久,Midjourney 就宣布因为免费服务造成大量的一次性帐号,而停止免费服务。价格
月付如下,年付打 8 折
DALL-E 2
官网:https://openai.com/product/dall-e-2
DALL-E 2 是顶顶大名的 OpenAI (就是做 ChatGPT 那间公司)的产品,而且和 ChatGPT 共用 API Key,如果会写程式的话,可以同时串接 ChatGPT 和 DALL-E 2
使用方法Ⅰ:Web
用和刚才在 Midjourney 生成图片同样的关键字「cute Ragdoll, infinity pool, swimming, high mountain, simulation」,产生图片如下:
没有很仔细研究,但是用 DALL-E 2 常常产生有点猎奇或品质不太好的图片,和 Midjourney 的图片品质有点落差,如上图截图,或许要调整一下咏唱的咒语吧,因为图片品质不好,就不放大图了
免费额度
新注册有免费 50 credits,之后每个月有免费 15 credits,产生 4 张图会使用 1 credits
使用方法Ⅱ:API
API 说明:https://openai.com/blog/dall-e-api-now-available-in-public-beta
DALL-E 2 最大的优势就是提供 API,而且和 ChatGPT 共用 OpenAI 的 API Key,已经有实作的专案可以参考了, 不过目前还是 Beta 版,有什么变化还很难说
价格
一张 1024x1024 的图,价格 0.02 美金
DreamStudio
大家比较熟悉的应该是 Stable Diffusion 这个名词,事实上 Stable Diffusion 指的是图像生成的模型,完全开源,初创公司为 Stability AI,而 DreamStudio 就是 Stability AI 网页版工具
DreamStudio 网址:https://beta.dreamstudio.ai/
同样的关键字「cute Ragdoll, infinity pool, swimming, high mountain, simulation」,Model 选 SDXL Beta (选不同的 model 产生出来的图片差异还蛮大的)
大图
价格
新注册会有免费的 25 credits,约可产生 125 张图,之后 10 美金可买 1000 credits,网页的说明虽然写 1 credit 可产生约 5 张图,但我实际产生一张图就要约 0.8 credit,大概和选择的 model 有关吧
Stable Diffusion Web UI
Stable Diffusion Web UI 不在这篇文章的讨论范围内,这个比较偏向给工程师的玩具,不是一两篇文章写得完的,先简单写个笔记
和前三者单纯使用关键字文成生图片的模型比较,特色就是弹性的多,包括可自行建模生成固定的脸,可以指定生成人物的姿势... etc
Github:https://github.com/AUTOMATIC1111/stable-diffusion-webui
因为是 open source,使用上没有费用问题,一般建议安装在自己的话电脑(需要有独立显卡,一般建议 NVIDIA RTX 3060 以上),如果电脑等级不够的话,可以使用 google colab
有整理好的 colab:https://github.com/camenduru/stable-diffusion-webui-colab
其实我也还没有玩熟,有空的话会陆续的整理一些笔记心得