Home 軟體 【跟著 jimmy 玩 AI】( 1 ) AI 繪圖簡介及 Midjounery、DALL-E、Stable Diffusion 和 NovelAI 4種 AI 的使用心得

【跟著 jimmy 玩 AI】( 1 ) AI 繪圖簡介及 Midjounery、DALL-E、Stable Diffusion 和 NovelAI 4種 AI 的使用心得

by jimmy
0 comment
AI 繪圖簡介

好一陣子沒更新了。最近沈迷於 AI 繪圖的世界,不可自拔啊~

其實很早就聽過 AI 繪圖的相關訊息,但一直到今 ( 2022 ) 年 8 月的時候,有一個叫做 Jason Allen 的人,用 AI 做的圖參加了 Fine Arts Exhibition 而且獲得首獎,被媒體報導出來,jimmy 才開始認真關注相關技術。

由 AI 產生的冠軍的作品
Jason Allen 使用 Midjounery AI 產生出的作品,在美國科羅拉多州博覽會的美術競賽中獲得數位藝術類別的冠軍。畫作名為《歌劇院空間》(Théâtre D’opéra Spatial)

使用 AI 生成的作品參賽,而且獲得第一名,讓很多藝術家覺得不以為然;然而因為比賽並沒有規定不能使用 AI 作為創作工具,所以最終還是核可他的首獎資格。然而很多藝術相關的人士已經開始產生危機感。

對所有新玩意兒都感興趣的 jimmy,當然不會放過這個有趣的主題,立馬測試了現在幾種熱門的 AI。以下就大略分享一下使用心得。由於技術不停進步,本篇文章所有資料為 2022 年 10 月現況。

AI 繪圖機制

先來聊聊 AI 的繪圖機制。

很多人都知道要先讓餵很多圖片讓 AI 來學習,然後它就可以畫出很厲害的圖了。大致上是這樣沒錯啦,不過,AI 可不是直接從資料庫的圖像中取材,用剪貼的方式拼出一張圖喔。

那麼,AI 的繪圖機制到底是怎麼樣的呢?

首先,要用有著 大量的圖片 對應著 文字的訊息 的資料庫來訓練 AI。
AI 首先會對圖片的內容找出特徵,然後為這張圖片的特徵標定數值。

舉個例子,這裡有一張紅色氣球的照片,為求說明方便我們先假設只有 形狀、顏色、材質 三種特徵,然後 AI 就針對每個特徵標定一個數值,比方 形狀-01 是圓形,顏色-01 代表紅色,材質-01 表示光滑。
另一張圖片是紅色的磚塊,AI 可能給定他的數值為 形狀-02 方形,顏色-01 紅色,材質-02 粗糙。
你可以把每一種特徵可以看做一個維度,這樣上面這個例子就可以變成一個三維座標系,其中氣球在 (1,1,1) 的位置,磚塊在 (2,1,2) 的位置。
每當讀入一張新的圖片,AI 便透過這個方式將之歸類在這個空間的某個相應位置,AI 就是用這個方式來認識圖片。

當然僅僅三個維度是遠遠不足以描述世間萬物的各種特徵的,所以實作時會是一個巨大的多維度的空間。在這個空間中,類似的物體,位置也會相對集中,不同類的物體則距離較遠。這裡說的物體,不只是有形的東西,也包含了風格這種抽象的概念,其實應該說是特性或特徵比較適合。

當這個多維空間建構完成之後,比方說我要做一張 cyberpunk 女孩 的圖片,那麼只要找到 cyberpunk 風格 的維度 和 女孩 的維度 的交集,就可以以此為基礎產生出新的圖像了。
所以,我們可以把 AI 繪圖看成是在這個巨大多維空間中,尋找各種維度交集的過程。

*上面的說明並不精確,是為了容易理解而簡化過的結果*

AI 繪圖實作

由 StableDiffusion AI 生成的圖像
AI 可以依照輸入的提示生成各種不同風格的影像

目前的 AI 繪圖大概分為 Text2Img 和 Img2Img。

前者是輸入一串關鍵字 ( prompt),接著 AI 根據這些文字產生出圖案。你可以不停地修改關鍵字,以縮限圖片發展的方向,讓最終得結果往你想要的方向靠近。

而 Img2Img 則是輸入一張圖片作為參考,讓 AI 以此為基礎加強,並且可以輔以關鍵字,最終得到想要的圖像。

使用經驗

jimmy 最近試用了 Midjounery、DALL-E、Stable Diffusion 和 NovelAI 這幾種 AI,在這裡分享一下心得。

Midjounery:

大概是最為人知的一種,上面所提到參賽得冠軍的就是它。

使用介面:
透過 Discord 連上伺服器,然後在對話框輸入 prompt 就可以產生圖像。
費用:
每個人有 25 張免費額度,超過就要付費。採訂閱制,每個月 10 美金起跳,價格依照提供服務不同而異。
使用心得:
我覺得是最有創意的一個 AI,少少的關鍵字也能產出不錯的作品,氛圍也掌握得很好。
官網:
https://www.midjourney.com/home/

DALL-E:

由 OpenAI 開發,一開始擔心該系統遭到濫用而採用封閉測試,但在 2022.09.28 日之後已經全面開放,只要用電子郵件帳號註冊帳號以後就可以使用。

使用介面:
官方網站。
費用:
首月有 50 張免費額度,之後每個月會補充 15 張免費額度;額度需當月用完,不可累積。也可以付費購買額度,最低 15 美金,使用期間一年。
使用心得:
我覺得表現最不好的一個。你給什麼他就出什麼,很僵硬、很死板。
官網:
https://labs.openai.com/

Stable Diffusion:

由 StabilityAI 開發的的一個 AI,代碼和模型都完全開源,也就是說你可以在自己的機器上安裝他,完全免費。據說這個 AI 的背後團隊與資金都非常神秘。

使用介面:
這個 AI 有很多方式可以執行。
你可以在 Dream Studio 網站使用,一開始有免費點數 200 點,生成每張圖片所需的點數依照大小與複雜度而不同。點數用完一樣要收費。也可以到 Hugging Face 免費使用,缺點是算圖要排隊。人少的時候很快,要是使用的人多,那就要多花一點時間。
另外,也有 可以下載到桌面的客端版本,同樣是利用雲端算力,但是不需連到網站,而是在桌面的 app 輸入 prompt。Windows 版 和 Mac 版 都有。
下載點在這裡,點選 Download Now,再來看你願不願意贊助他們一些費用,如果不要,就點 No thanks, just take me to the downloads,然後就可以下載了。這個方式因為也是用到別人的硬體計算,又免費,所以也是要排隊的。

當然,人在屋簷下,不得不低頭。用別人的機器算圖,總是有很多限制;除了免費張數限制、課金、排隊等不便之外,最大的問題就是內容的管制。除了一些色情暴力的限制級詞語被屏蔽掉是當然的之外,政治因素也介入了。這一則新聞提到某些 AI 無法輸入習近平作為關鍵字,實在讓人哭笑不得。要徹底解決這個問題,最好的方法就是在自己的機器上建立一套 AI!只要你的硬體夠 OK,要用什麼 prompt 都沒人管,可以讓你從早算到晚,一直算一直爽。而正因為 Stable Diffiusion 是一個開源的系統,所以讓這件事成為可能。

jimmy 將在下一篇文章手把手帶你安裝一套 Stable Diffusion 在自己的電腦上。


費用:
基本是免費,但是如果運用他人硬體算圖,那麼就會被收取一些費用。
使用心得:
這是 jimmy 用得最多也最喜歡的一個 AI,也覺得最順手。一開始可能會覺得有些門檻,但熟悉下 prompt 的技巧之後,可以做出很棒的圖像。
官網:
https://stability.ai

NovelAI:

這是一套來自日本的 AI 模型。日本可是動漫之鄉,所以 NovelAI 的強項就在動漫風格的圖像。
NovelAI 以 Stable Diffusion 作為基礎,搭配上自己訓練出來的模型,推出訂閱制的雲端服務。但是他用來訓練 AI 的素材來源,是一個非法搬運網站,因此很多繪師覺得自己受到侵權而抗議,也因次這個 AI 在日本具有爭議性。


使用介面:官方網站。
費用:
生圖好像都是要收費的,沒有免費額度。費用的話從一個月 10 美元開始。
使用心得:
果然是動漫專業的 AI,如果你想要做出動漫風格的圖像,NovelAI 不會讓你失望的
官網:
https://novelai.net

然後…應該算報應嗎?NovelAI 用版權有問題的素材訓練出來的模型,現在也被外流公布出來了。然後因為是以 Stable Diffusion 作為基礎,所以,要安裝在自己的機器上也是沒問題的。下下一期 jimmy 就教你怎麼安裝 NovelAI,耐心等一等囉~

世間對 AI 繪圖的反應

目前比較反對 AI 繪圖的,大部分都是畫家、繪師一類的藝術工作者,大概是感受到了工作將要被搶走的壓力吧。人類畫師要花費數小時到數天才能產出一張作品,AI 只要幾秒鐘就可以完成,還可以依據需求調整出不同風格,這樣的競爭力誰都會擔心,這可以理解。

但是要說因為參考了其他畫家的作品所以 AI 繪圖是侵權,這好像說不太過去。人類在學畫圖的過程中,不也都是臨摹或是參考其他大師的作品嗎?這本來就是學習的過程,只是這個過程太短太快,成果又太強太屌,所以才讓 “人” 覺得不公平吧。


總之,用 AI 來產生視覺產物應該是未來的趨勢;不只是繪圖,還有攝影、影片應該都是會受影響的領域。要逆勢而為是不可能的,能做的只是提早做好準備,跟趨勢站在同一邊。

你可能也會有興趣的文章

Leave a Comment