這幾個月來 AI 繪圖差不多就是最熱門的話題,這篇文章針對「一般使用者」實測幾個常用的 AI 繪圖工具:Midjourney, DALL-E 2,DreamStudio,簡單介紹 和做比較
Midjourney
官網:https://www.midjourney.com/
有在注意新聞的人應該對 Midjourney 都不陌生,最有名的就是一名男子使用 Midjourney 人工智能創作的繪圖參加科羅拉多州博覽會舉辦的「Fine Arts Exhibition」美術展獲獎。
得獎作品:《Théâtre D’opéra Spatial》
圖片來源:wikimedia
這篇文章不討論 AI 繪圖到底會對藝術造成什麼影響,只打算單純介紹要怎麼使用 Midjourney
使用方法:
需要先加入 Midjourney 的 Discord 頻道,點選官網右下角的「Sign In」
如果之前已經有 Discord 帳號,直接登入就行,如果沒有的話,就註冊一個
進入 Discord 的 Midjourney 頻道後,隨便找一個 newbies-XX 的聊天頻道進入
頻道是大家共用的, 所以會同時看到其他人產生的圖片
使用方式很簡單,於下方的聊天輸入欄位中,輸入 /imagine,會出現以下方框
然後在 prompt 填入測試的文字,這次我們都使用同樣的關鍵字「cute Ragdoll, infinity pool, swimming, high mountain, simulation」
等一會就可以看到產生出來的圖片,因為同時也不少人也在產生圖片,需要找一下自己的圖片產生在哪裏
如上圖截圖,每次都會有四張圖片,在圖片下方會有 U1、U2、U3、U4 以及 V1、V2、V3、V4 圖示,數字部分,左上為 1、右上為 2、左下為 3、右下為 4。U 是 Upscale 的縮寫,當你滿意這張圖片時,就可以點選取得大圖片,V 是 Variation 的縮寫,會根據這張圖片再繼續下去延伸變化。最右邊圖示則是重新運算:
ex 選擇 V1,以第一張圖再往下延伸四張圖
ex 選 U4,則產生最後結果的大圖
免費次數
新註冊會員只能產生 25 張圖
3/31 更新,文章才寫完沒多久,Midjourney 就宣佈因為免費服務造成大量的一次性帳號,而停止免費服務。價格
月付如下,年付打 8 折
DALL-E 2
官網:https://openai.com/product/dall-e-2
DALL-E 2 是頂頂大名的 OpenAI (就是做 ChatGPT 那間公司)的產品,而且和 ChatGPT 共用 API Key,如果會寫程式的話,可以同時串接 ChatGPT 和 DALL-E 2
使用方法Ⅰ:Web
用和剛才在 Midjourney 生成圖片同樣的關鍵字「cute Ragdoll, infinity pool, swimming, high mountain, simulation」,產生圖片如下:
沒有很仔細研究,但是用 DALL-E 2 常常產生有點獵奇或品質不太好的圖片,和 Midjourney 的圖片品質有點落差,如上圖截圖,或許要調整一下詠唱的咒語吧,因為圖片品質不好,就不放大圖了
免費額度
新註冊有免費 50 credits,之後每個月有免費 15 credits,產生 4 張圖會使用 1 credits
使用方法Ⅱ:API
API 說明:https://openai.com/blog/dall-e-api-now-available-in-public-beta
DALL-E 2 最大的優勢就是提供 API,而且和 ChatGPT 共用 OpenAI 的 API Key,已經有實作的專案可以參考了, 不過目前還是 Beta 版,有什麼變化還很難說
價格
一張 1024x1024 的圖,價格 0.02 美金
DreamStudio
大家比較熟悉的應該是 Stable Diffusion 這個名詞,事實上 Stable Diffusion 指的是圖像生成的模型,完全開源,初創公司為 Stability AI,而 DreamStudio 就是 Stability AI 網頁版工具
DreamStudio 網址:https://beta.dreamstudio.ai/
同樣的關鍵字「cute Ragdoll, infinity pool, swimming, high mountain, simulation」,Model 選 SDXL Beta (選不同的 model 產生出來的圖片差異還蠻大的)
大圖
價格
新註冊會有免費的 25 credits,約可產生 125 張圖,之後 10 美金可買 1000 credits,網頁的說明雖然寫 1 credit 可產生約 5 張圖,但我實際產生一張圖就要約 0.8 credit,大概和選擇的 model 有關吧
Stable Diffusion Web UI
Stable Diffusion Web UI 不在這篇文章的討論範圍內,這個比較偏向給工程師的玩具,不是一兩篇文章寫得完的,先簡單寫個筆記
和前三者單純使用關鍵字文成生圖片的模型比較,特色就是彈性的多,包括可自行建模生成固定的臉,可以指定生成人物的姿勢... etc
Github:https://github.com/AUTOMATIC1111/stable-diffusion-webui
因為是 open source,使用上沒有費用問題,一般建議安裝在自己的話電腦(需要有獨立顯卡,一般建議 NVIDIA RTX 3060 以上),如果電腦等級不夠的話,可以使用 google colab
有整理好的 colab:https://github.com/camenduru/stable-diffusion-webui-colab
其實我也還沒有玩熟,有空的話會陸續的整理一些筆記心得