Paano Magpatakbo ng Stable Diffusion sa Iyong PC upang Bumuo ng AI Images


Buod: Upang lokal na patakbuhin ang Stable Diffusion sa iyong PC, i-download ang Stable Diffusion mula sa GitHub at ang pinakabagong mga checkpoint mula sa HuggingFace.co, at i-install ang mga ito. Pagkatapos ay patakbuhin ang Stable Diffusion sa isang espesyal na kapaligiran ng python gamit ang Miniconda.

Ang sining ng Artificial Intelligence (AI) ay kasalukuyang kinahihiligan, ngunit karamihan sa mga generator ng imahe ng AI ay tumatakbo sa cloud. Iba ang Stable Diffusion — maaari mo itong patakbuhin sa sarili mong PC at makabuo ng maraming larawan hangga't gusto mo. Narito kung paano mo mai-install at magagamit ang Stable Diffusion sa Windows.

Ano ang Stable Diffusion?

Ang Stable Diffusion ay isang open-source na modelo ng machine learning na maaaring bumuo ng mga larawan mula sa text, magbago ng mga larawan batay sa text, o punan ang mga detalye sa mga larawang may mababang resolution o mababang detalye. Ito ay sinanay sa bilyun-bilyong larawan at makakapagdulot ng mga resultang maihahambing sa mga makukuha mo mula sa DALL-E 2 at MidJourney. Ito ay binuo ng Stability AI at unang inilabas sa publiko noong Agosto 22, 2022.

Ang Stable Diffusion ay walang malinis na user interface (pa) tulad ng ilang mga AI image generators, ngunit mayroon itong napaka-permissive na lisensya, at — higit sa lahat — ito ay ganap na libre upang magamit sa iyong sariling PC (o Mac.)

Huwag matakot sa katotohanan na ang Stable Diffusion ay kasalukuyang tumatakbo sa isang command-line interface (CLI). Ang pagbangon at pagtakbo ay medyo diretso. Kung maaari mong i-double click ang isang executable at mag-type sa isang kahon, maaari mo itong patakbuhin sa loob ng ilang minuto.

Ano ang Kailangan Mo Para Magpatakbo ng Stable Diffusion sa Iyong PC?

Hindi tatakbo ang Stable Diffusion sa iyong telepono, o sa karamihan ng mga laptop, ngunit tatakbo ito sa karaniwang gaming PC sa 2022. Narito ang mga kinakailangan:

  • Isang GPU na may hindi bababa sa 6 gigabytes (GB) ng VRAM
    • Kabilang dito ang karamihan sa mga modernong NVIDIA GPU

    • Maaari ding patakbuhin ang Stable Diffusion sa Linux at macOS

    Kung wala kang hardware, isaalang-alang ang paggamit ng isang web-based na AI image generator. Maaari ka ring magpatakbo ng demo ng Stable Diffusion sa web.

    Paano Mag-install at Magpatakbo ng Stable Diffusion sa Windows

    Mayroong dalawang piraso ng software na kailangan mo: Git at Miniconda3.

    Pag-install ng Git

    Ang Git ay isang tool na nagbibigay-daan sa mga developer na pamahalaan ang iba't ibang bersyon ng software na kanilang ginagawa. Maaari silang magpanatili ng maraming bersyon ng software na kanilang ginagawa sa isang sentral na imbakan nang sabay-sabay at payagan ang iba pang mga developer na mag-ambag sa proyekto.

    Kung hindi ka developer, nagbibigay ang Git ng maginhawang paraan para ma-access at ma-download ang mga proyektong ito, at ganoon namin ito gagamitin sa kasong ito. I-download ang installer ng Windows x64 mula sa website ng Git, pagkatapos ay patakbuhin ito upang i-install ang Git.

    Mayroong ilang mga opsyon na ipo-prompt kang pumili habang tumatakbo ang installer — iwanan ang mga ito sa kanilang mga default na setting. Ang isang pahina ng opsyon, Pagsasaayos ng Iyong PATH Environment, ay partikular na mahalaga. Dapat itong itakda sa Git Mula sa Command Line At Gayundin Mula sa 3rd-Party Software.

    Pag-install ng Miniconda3

    Ang Stable Diffusion ay kumukuha sa ilang iba't ibang mga library ng Python. Kung wala kang masyadong alam tungkol sa Python, huwag masyadong mag-alala tungkol dito — sapat na para sabihin, ang mga aklatan ay mga software package lamang na magagamit ng iyong computer upang magsagawa ng mga partikular na function, tulad ng pagbabago ng imahe, o paggawa ng kumplikadong matematika.

    Ang Miniconda3 ay karaniwang isang convenience tool. Hinahayaan ka nitong i-download, i-install, at pamahalaan ang lahat ng mga library na kinakailangan para gumana ang Stable Diffusion nang walang masyadong manu-manong interbensyon. Ito rin ay kung paano namin aktwal na ginagamit ang Stable Diffusion.

    Tumungo sa pahina ng pag-download ng Miniconda3 at i-click ang Miniconda3 Windows 64-bit upang makuha ang pinakabagong installer.

    I-double click ang executable kapag na-download na ito upang simulan ang pag-install. Ang pag-install ng Miniconda3 ay nagsasangkot ng mas kaunting pag-click sa mga pahina kaysa sa ginawa ng Git, ngunit kailangan mong bantayan ang pagpipiliang ito:

    Tiyaking pipiliin mo ang “Lahat ng User” bago i-click ang susunod at tapusin ang pag-install.

    Ipo-prompt kang i-restart ang iyong computer pagkatapos i-install ang Git at Miniconda3. Hindi namin nalaman na kailangan ito, ngunit hindi ito masasaktan kung gagawin mo ito.

    I-download ang Stable Diffusion GitHub Repository at ang Pinakabagong Checkpoint

    Ngayong na-install na namin ang pre-requisite na software, handa na kaming mag-download at mag-install ng Stable Diffusion.

    I-download muna ang pinakabagong checkpoint — ang bersyon 1.4 ay halos 5GB, kaya maaaring tumagal ito ng ilang sandali. Kailangan mong gumawa ng account para i-download ang checkpoint, ngunit kailangan lang nila ng pangalan at email address. Ang lahat ng iba pa ay opsyonal.

    I-click ang “sd-v1-4.ckpt” para simulan ang pag-download.

    Pagkatapos ay kailangan mong i-download ang Stable Diffusion mula sa GitHub. Mag-click sa berdeng Code na buton, pagkatapos ay i-click ang Download ZIP. Bilang kahalili, maaari mong gamitin ang direktang link sa pag-download na ito.

    Ngayon ay kailangan naming maghanda ng ilang mga folder kung saan namin i-unpack ang lahat ng mga file ng Stable Diffusion. I-click ang Start button at i-type ang miniconda3 sa Start Menu search bar, pagkatapos ay i-click ang Buksan o pindutin ang Enter.

    Gagawa kami ng isang folder na pinangalanang stable-diffusion gamit ang command line. Kopyahin at i-paste ang bloke ng code sa ibaba sa window ng Miniconda3, pagkatapos ay pindutin ang Enter.

    cd C:/
    mkdir stable-diffusion
    cd stable-diffusion

    Kung naging maayos ang lahat, makakakita ka ng ganito:

    Panatilihing bukas ang window ng Miniconda3, kakailanganin namin itong muli sa isang minuto.

    Buksan ang ZIP file, stable-diffusion-main.zip, na na-download mo mula sa GitHub sa iyong paboritong file archive program. Bilang kahalili, maaari ding buksan ng Windows ang mga ZIP file nang mag-isa kung wala ka nito. Panatilihing bukas ang ZIP file sa isang window, pagkatapos ay buksan ang isa pang window ng File Explorer at mag-navigate sa C:\stable-diffusion na folder na kakagawa lang namin.

    I-drag at i-drop ang folder sa ZIP file, stable-diffusion-main, sa folder na stable-diffusion.

    Bumalik sa Miniconda3, pagkatapos ay kopyahin at i-paste ang mga sumusunod na command sa window:

    cd C:\stable-diffusion\stable-diffusion-main
    conda env create -f environment.yaml
    conda activate ldm
    mkdir models\ldm\stable-diffusion-v1

    Huwag matakpan ang prosesong ito. Ang ilan sa mga file ay mas malaki kaysa sa isang gigabyte, kaya maaaring tumagal ng kaunti upang ma-download. Kung hindi mo sinasadyang maantala ang proseso, kakailanganin mong i-delete ang folder ng environment at patakbuhin muli ang conda env create -f environment.yaml. Kung nangyari iyon, mag-navigate sa C:\Users\(Your User Account)\.conda nvs at tanggalin ang folder na ldm, pagkatapos ay patakbuhin ang nakaraang command.

    Ang mga linyang pinatakbo namin ay lumikha ng bagong environment na pinangalanang ldm, na-download at na-install ang lahat ng kinakailangang Python library para gumana ang Stable Diffusion, na-activate ang ldm environment, pagkatapos ay binago ang direktoryo sa isang bagong folder. Nasa huling hakbang na kami ng pag-install. Mag-navigate sa C:\stable-diffusion\stable-diffusion-main\models\ldm\stable-diffusion-v1 sa File Explorer, pagkatapos ay kopyahin at i-paste ang checkpoint file (sd-v1-4.ckpt) sa folder.

    Hintaying matapos ang paglilipat ng file, i-right-click ang “sd-v1-4.ckpt” at pagkatapos ay i-click ang “Rename.” I-type ang model.ckpt sa naka-highlight na kahon, pagkatapos ay pindutin ang Enter upang baguhin ang pangalan ng file.

    At iyon na - tapos na kami. Handa na kaming aktwal na gumamit ng Stable Diffusion ngayon.

    Paano Gamitin ang Stable Diffusion

    Ang ldm environment na ginawa namin ay mahalaga, at kailangan mo itong i-activate anumang oras na gusto mong gamitin ang Stable Diffusion. Ilagay ang conda activate ldm sa Miniconda3 window at pindutin ang “Enter.” Ang (ldm) sa kaliwang bahagi ay nagpapahiwatig na ang kapaligiran ng ldm ay aktibo.

    Pagkatapos ay kailangan nating baguhin ang direktoryo (kaya ang commandcd) sa C:\stable-diffusion\stable-diffusion-main bago tayo makabuo ng anumang mga imahe. I-paste cd C:\stable-diffusion\stable-diffusion-main sa command line.

    Paano Gumawa ng Imahe na may Stable Diffusion

    Tatawag kami ng script, txt2img.py, na nagpapahintulot sa amin na i-convert ang mga text prompt sa 512×512 na mga imahe. Narito ang isang halimbawa. Subukan ito upang matiyak na gumagana nang tama ang lahat:

    python scripts/txt2img.py --prompt "a close-up portrait of a cat by pablo picasso, vivid, abstract art, colorful, vibrant" --plms --n_iter 5 --n_samples 1

    Bibigyan ka ng iyong console ng progress indicator habang ginagawa nito ang mga larawan.

    Ang command na iyon ay gagawa ng limang larawan ng pusa, lahat ay matatagpuan sa C:\stable-diffusion\stable-diffusion-main\outputs xt2img-samples\samples.

    Hindi ito perpekto, ngunit malinaw na kahawig nito ang istilo ni Pablo Picasso, tulad ng tinukoy namin sa prompt. Ang iyong mga larawan ay dapat magmukhang magkatulad ngunit hindi kinakailangang magkapareho.

    Anumang oras na gusto mong baguhin kung anong larawan ang nabuo kailangan mo lang baguhin ang tekstong nakapaloob sa mga double-quotation mark kasunod ng --prompt.

    python scripts/txt2img.py --prompt "YOUR, DESCRIPTIONS, GO, HERE" --plms --n_iter 5 --n_samples 1

    Sabihin nating gusto naming bumuo ng isang makatotohanang mukhang gopher sa isang mahiwagang kagubatan na may suot na sumbrero ng wizard. Maaari naming subukan ang utos:

    python scripts/txt2img.py --prompt "a photograph of a gopher wearing a wizard hat in a forest, vivid, photorealistic, magical, fantasy, 8K UHD, photography" --plms --n_iter 5 --n_samples 1

    Napakadali lang nito — ilarawan lang kung ano ang gusto mo nang partikular hangga't maaari. Kung gusto mo ng photorealistic, tiyaking magsama ng mga terminong nauugnay sa isang makatotohanang larawan. Kung gusto mo ng inspirasyon ng istilo ng isang partikular na artist, tukuyin ang artist.

    Ang Stable Diffusion ay hindi limitado sa mga portrait at hayop, maaari rin itong gumawa ng mga kapansin-pansing landscape.

    Ano ang Kahulugan ng Mga Pangangatwiran sa Utos?

    Ang Stable Diffusion ay may napakalaking bilang ng mga setting at argumento na maaari mong ibigay upang i-customize ang iyong mga resulta. Ang ilang kasama dito ay karaniwang kinakailangan upang matiyak na ang Stable Diffusion ay tatakbo sa isang karaniwang gaming computer.

    • –plms — Tinutukoy kung paano isa-sample ang mga larawan. May isang papel tungkol dito, kung gusto mong tingnan ang matematika.
    • –n_iter — tumutukoy sa bilang ng mga pag-ulit na gusto mong buuin para sa bawat prompt. Ang 5 ay isang disenteng numero upang makita kung anong uri ng mga resulta ang iyong nakukuha.
    • –n_samples — tumutukoy sa bilang ng mga sample na bubuo. Ang default ay 3, ngunit karamihan sa mga computer ay walang sapat na VRAM upang suportahan iyon. Manatili sa 1 maliban kung mayroon kang partikular na dahilan para baguhin ito.

    Siyempre, ang Stable Diffusion ay may isang tonelada ng iba't ibang mga argumento na maaari mong ipatupad upang i-tweak ang iyong mga resulta. Patakbuhin ang python scripts/txt2img.py --help upang makakuha ng kumpletong listahan ng mga argumento na magagamit mo.

    Mayroong isang toneladang pagsubok at pagkakamali na kasangkot sa pagkuha ng magagandang resulta, ngunit iyon ay hindi bababa sa kalahati ng kasiyahan. Siguraduhing isulat o i-save mo ang mga argumento at paglalarawan na nagbabalik ng mga resultang gusto mo. Kung hindi mo nais na gawin ang lahat ng pag-eksperimento sa iyong sarili, mayroong lumalaking mga komunidad sa Reddit (at sa ibang lugar) na nakatuon sa pagpapalitan ng mga larawan at mga senyas na nabuo sa kanila.