好久以前,我就想玩看看子不語大人推薦的Stable Diffusion。
這契機的來源起於今年過年前,不知道被掃上了什麼風,好像許多東西都到了壽終正寢的時間。而這股歪風也吹到我這台用了許久的電腦……
水冷漏液了。
算了,倒楣的事就不多談。
新電腦終於可以跑得動Stable Diffusion的需求,也花了好一陣研究它的流程與思路,下載了一狗票資源。動輒十幾G的內容,全部加一加,可能都有過往好幾年的份。
過去,我都習慣用Midjourney,它的構圖顯然相對有意境,唯一缺點沒有每日的免費額度,有興趣的,不妨可以上該網站看看。
最近,我正在研究 COMFYUI 這款開源的 AI 繪圖工具,它以 Stable Diffusion 為基礎。Stable Diffusion 具有極高的自由度,可以搭配各種風格化的介面,使構圖更加靈活,讓使用者能更精確地控制 AI 的風格,但相對地,隨機生成帶來靈感的機會也減少。23Please respect copyright.PENANAEwnwQTxcvS
目前使用的是FLUX的CHECKPOINT,在我的理解是繪圖核心。程式會按照核心的訓練來構思圖案,目前該款被評價比Midjourney稍高。我目前使用上也有同感。
兩者相較之下,我發現Midjourney在廣角的視野裡,人物的臉部控制常常會出包,機會高達八成。當然FLUX也會,但顯然前者的機會更大。
至於人物錯位,好像都一樣,這應該是AI有時無法避免的規則。
經過一陣子的試驗,以及各位大師的視頻,漸漸知道AI的邏輯與模式。它儘管有優秀的判斷,但仍沒有人那樣的視覺邏輯能力。大概理解為何Midjourney出包的機會頗大。23Please respect copyright.PENANAB4AcSDd967
這部分的知識可能太過艱澀,先略過不談。
我揪了一段提示詞,試著比較兩者之間的差異。
(MIDJOURNEY)
(FLUX)
哦~~天吶,太讓我驚艷了。
雖然氛圍有些不同,但以我這小白來看其實構圖、氛圍……已經很讚了。那是不是……以後都不用光顧Midjourney啦~~
我後來試過幾張,FLUX顯然與Midjourney有得拼比,也更細緻。
綜上,我大概整理一下Stable diffusion與Midjourney以及市面上其他的差異。
Stable diffusion(FLUX checkpoint):23Please respect copyright.PENANATyev7LIqqW
操作複雜度:★★★★★23Please respect copyright.PENANALKNXTY22ce
可控因素:★★★★☆23Please respect copyright.PENANAV9bksq28Rf
構圖美感:★★★★☆23Please respect copyright.PENANAH15ieeB0lP
23Please respect copyright.PENANASV2uFrTUZe
Midjourney:
操作複雜度:★★☆☆☆23Please respect copyright.PENANA5AJOCMaifk
可控因素:★★☆☆☆23Please respect copyright.PENANA2vVEHcVfEA
構圖美感:★★★★☆23Please respect copyright.PENANAvR3RQ9WpAY
23Please respect copyright.PENANAh5xwmc6Ez8
由於兩者的性質不同,所以造成前面兩項產生差異。一個是主打多元化的自由使用;一個是更貼近使用者方便。後者由於可控因素減少,使得AI出亂的機會就會增大,但這是一把雙刃刀,各有好壞。
無論是哪一種,都有你無力可及的地方。23Please respect copyright.PENANA4ZTxn3rh4w
目前我使用COMFYUI,這種開源的程式穩定度以及掛件使用上有時略顯繁瑣,且當模組一多,衝突的機會也大增。雖然功能眾多,但相對而來的是複雜的工作流與思維邏輯,必須要花大量時間研究。
反觀線上的便利AI出圖(Midjourney、GPT、Leonardo、PixAi……)方便又快速,且操作介面簡單,比較適合新手或者不想搞這麼複雜的使用者。若說較麻煩的地方,可能就在於受限大眾使用,所以一些遊走在條例邊緣的圖樣可能就沒辦法。
再者,兩種類形最終還是落在錢包的容許度。畢竟一個是砸錢買設備,一個是付錢買算力與服務,以重度或著重構圖思維來說,也許Stable diffusion會是不錯的選擇;但偶爾跑幾張,玩一下抽抽樂,使用網站上的即可。
最後我的感想是……想像很美好,現實很骨感。
ns 15.158.61.50da2