Paano Protektahan ang Iyong Mga Larawan Mula sa Mga AI Art Generator


Buod: Maaari mong subukan ang ilang bagay upang maprotektahan ang iyong sining mula sa mga generator ng AI:

  • Mag-opt out sa mga dataset ng pagsasanay na may tool tulad ng HaveIBeenTrained.com.
  • Gumamit ng robots.txt na file upang itakwil ang mga web crawler, marami sa mga ito ay ginagamit upang lumikha ng mga dataset sa unang lugar.
  • I-copyright ang iyong likhang sining at hamunin ang mga developer ng mga tool na ito sa korte (o pagsali sa mga umiiral nang class-action na demanda).
  • Mag-upload lamang ng mga larawang may agresibong watermark.
  • Iwasang ilagay ang iyong sining sa internet sa unang lugar.

Maaaring hindi magawa ng mga AI art generators ang pagkamalikhain ng tao, ngunit siguradong masisira ka nila. Ito ay isang pag-aalala para sa parehong mga artista at sa mga natatakot sa pagkuha ng AI, ngunit ang lahat ay maaaring hindi mawala.

Paano Protektahan ang Naka-copyright na Sining mula sa AI

Ang mga AI art generator ay wala nang walang mga dataset kung saan sila sinanay. Kabilang dito ang pagkuha ng malaking sample ng umiiral na likhang sining at pagsasaayos nito sa paraang nagbibigay-daan sa mga tao na gumamit ng natural na mga senyas ng wika upang lumikha ng katulad na likhang sining. Maaari mo itong subukan para sa iyong sarili gamit ang isang generative art app tulad ng OpenAI's DALL-E 2 o Midjourney.

Hiniling namin sa DALL-E 2 na gumawa ng isang larawan ni Elmo mula sa Sesame Street sa istilo ni Pablo Picasso at narito ang nakuha namin (oo, ito ang pinakamahusay sa grupo):

Ang kakayahang lumikha ng likhang sining sa istilo ng mga patay na artista ay maaaring hindi magtaas ng masyadong maraming alarma, lalo na sa isang istilong napakakilala. Ngunit para sa mga modernong artist na nagbabahagi ng kanilang mga nilikha sa pamamagitan ng mga tulad ng ArtStation, DeviantArt, Behance, mga personal na website, at mga pahina sa social media tulad ng Instagram o Facebook, ito ay higit na nakakabahala.

Kaya ano ang maaari mong gawin upang maprotektahan ang iyong sariling mga nilikha mula sa paggamit upang sanayin ang isang AI na maaaring idura ang mga nilikha nang mas mabilis kaysa sa magagawa mo?

Mag-opt Out sa Mga Dataset ng Pagsasanay

Maaari mong piliing mag-opt out sa dalawa sa pinakamalaking open image training dataset sa internet, LAION-400M at LAION-5B gamit ang HaveIBeenTrained.com. Ang mga dataset na ito ay ginagamit ng ilan sa mga pinakamalaking generator ng imahe sa web kabilang ang Stable Diffusion at Google Imagen. Dahil sila ay tunay na bukas, maraming iba pang mga generative AI tool ang gumagamit din sa kanila.

Sa kasamaang palad, ang proseso ng paggawa nito ay mabagal at nakakapagod. Kakailanganin mo munang mag-sign up para sa isang account at pagkatapos ay maghanap o mag-upload ng larawan upang makahanap ng mga tugma sa loob ng dataset. Pagkatapos ay maaari mong i-right-click ang larawan sa iyong desktop web browser at piliin ang opsyong Idagdag sa Aking Mga Opt-Out. Bilang kahalili, maaari mong bigyan ang dataset ng tahasang pahintulot na gumamit ng larawan sa pamamagitan ng pag-click sa Idagdag sa Aking Mga Opt-In sa halip.

Kakailanganin mong gawin ito para sa bawat larawang makikita mo, kaya maaari itong maging isang maingat na proseso kung isa kang artist na may malaking gawain. Kung gaano katagal ito sa huli ay depende sa kung gaano kadaling i-filter ang iyong trabaho, na maaaring mas madali kung mayroon kang trabaho na nauugnay sa isang natatanging pangalan o proyekto, isang malaking online na pagsubaybay, at iba pa.

Kahit na ang dalawang napakalaking dataset na ito ay isang magandang lugar upang magsimula, malayo ang mga ito sa mga ginagamit lamang. Ang mga indibidwal ay maaaring gumawa ng sarili nilang mga dataset, at ang ilan ay gumagawa upang gayahin ang isang partikular na artist o istilo ng sining. Ang ilang mga kumpanya tulad ng OpenAI ay hindi nagbubunyag kung aling mga dataset ang ginagamit ng kanilang mga tool, kaya walang paraan upang labanan ang mga ito.

Gamitin ang Robots.txt para Iwasan ang mga Crawler

Ang robots.txt file ay isang maliit na text na dokumento na inilalagay sa root directory ng isang website upang sabihin sa mga web crawler kung saan sila pinapayagan o hindi pinapayagang pumunta. Bagama't tahasang sinabi ng Google na ito ay hindi isang mekanismo para sa pag-iwas sa isang web page sa labas ng Google maaari mo pa ring subukan at gamitin ito upang ilayo ang mga web crawler sa iyong artwork kung iho-host mo ito sa iyong sariling website.

Gaya ng iminumungkahi ng pangalan, ang mga web crawler ay nagko-crawl sa web sa paghahanap ng nilalaman para sa pag-index. Ang mga search engine ay malayo sa mga nag-iisang crawler, at ang mga crawler ay ginagamit din upang lumikha ng mga dataset katulad ng LAION-400M at LAION-5B na mga dataset na binanggit sa itaas. Ang pangunahing problema sa robots.txt ay umaasa ito sa web crawler ayon sa iyong kahilingan.

Ang isa sa pinakamalaking dataset sa paligid ay ang Common Crawl, ang data kung saan ginamit upang bumuo ng mga dataset ng LAION. Ang proseso ng pag-crawl sa web ay isang patuloy, kung saan ang LAION ay nagsasaad ng kasalukuyan nitong (sa oras ng pagsulat) ng LAION-400M na dataset ay nilikha mula sa mga random na web page na na-crawl sa pagitan ng 2014 at 2021.

Sinasabi ng Common Crawl na iginagalang nito ang robots.txt at ang Robots Exclusion Protocol kapwa sa mga tuntunin ng pagharang ng nilalaman at pagkaantala sa pag-crawl (upang makatipid sa bandwidth). Magagawa mo ito sa pamamagitan ng paggawa ng panuntunan para sa ahente ng gumagamit ng “CCBot” sa iyong Robots.txt file. Siyempre, wala sa mga ito ang makakatulong kung hindi mo self-hosting ang iyong likhang sining.

Ang Google Search Central ay may madaling gamitin na gabay para sa paggawa ng robots.txt file, o maaari kang gumamit ng website tulad ng Ryte's Robots.txt Generator upang gumawa ng isa para sa iyo. Maaari mong payagan o huwag paganahin ang mga partikular na ahente ng gumagamit mula sa mga partikular na direktoryo, o i-block lang ang lahat gamit ang isang wildcard (*). Halimbawa, ang isang robots.txt file na humaharang sa lahat ng mga file sa iyong /images/ directory mula sa Common Crawl habang pinapayagan pa rin ang ibang mga crawler na i-index ang iyong website ay mababasa:

User-agent: CCbot
Disallow: /images/

User-agent: *
Allow: /

Sitemap: https://www.example.com/sitemap.xml

Hindi nito matatalo ang mga crawler na bumisita na sa iyong website, ngunit dapat nitong pigilan ang Common Crawl na i-index ang iyong /images/ folder (at anumang mga bagong pag-upload mula noong huling pag-crawl) sa hinaharap.

Copyright Iyong Artwork

Kahit na ang copyright ay ipinahiwatig sa gawa na iyong nilikha, ang paggawa ng iyong paraan upang i-copyright ang iyong gawa ay maaaring sulit din ang pagsisikap. Sa US magagawa mo ito sa pamamagitan ng pagrehistro ng iyong mga gawa sa Copyright.gov. Maaari kang magsumite ng hanggang 10 hindi nai-publish na mga gawa sa isang application, tandaan lamang na maaaring tumagal ng ilang sandali (sa kasalukuyan mga isang taon) bago maproseso ang iyong mga gawa.

Ang pagkakaroon ng nakarehistrong copyright sa iyong gawa ay nagbibigay sa iyo ng higit na kakayahang manindigan sa mga usaping may kinalaman sa mga korte. Iyan ang ideya sa likod ng class-action lawsuit na isinampa laban sa Stability AI (developer ng Stable Diffusion at DreamStudio, funder ng LAION), DeviantArt (isang platform para sa mga artist at developer ng DreamUp), at Midjourney, isang generative art app sa ngalan ng mga apektadong artist .

Mababasa mo ang lahat tungkol sa demanda sa StableDiffusionLitigation.com, at kung naniniwala kang nagamit ang iyong trabaho para sanayin ang mga generator na ito, maaaring may dahilan ka para sumali sa class action sa pamamagitan ng pakikipag-ugnayan sa legal team. Ang pag-apply upang mairehistro ang iyong sining sa U.S. Copyright Office ay isang mahalagang unang hakbang kung gusto mong pumunta sa rutang ito.

Tulad ng iba pang mga kasanayan na nakaakit ng mga abogado sa nakaraan-pandarambong, jailbreaking, pagbabahagi ng mga file-malamang na ang isang kaso ay ganap na ihinto ang pagsasanay. Ang depensa ay malamang na magtaltalan na ang mga tool na ito ay sinanay sa patas na paggamit na materyal na natipon mula sa mga website na nakaharap sa publiko. Kailangan nating maghintay at tingnan upang malaman kung ano ang magiging epekto ng mga demanda tulad nito kung mayroon man.

Agresibong Watermarking

Kung ia-upload mo lang ang iyong artwork na may ilang agresibo o borderline na self-destructive watermarking, makikita ito ng artwork na kasama sa mga dataset. Sa huli, ito ay higit na nakasalalay sa kung bakit ang iyong likhang sining ay ina-upload sa unang lugar. Kung gumagawa ka ng artwork na hindi pangkomersyal para sa kasiyahan sa internet, ito ay tila nakakatalo sa sarili.

Gayunpaman, kung nagbebenta ka ng mga real-world na painting at gusto mo ng paraan ng pagpapakita ng mga ito online bago ibenta, maaaring makatulong ito. Ito ay tiyak na makakabawas sa natapos na likhang sining, kaya ito ay isang bagay na kailangan mong isaalang-alang para sa iyong sarili.

Huwag I-upload ang Iyong Sining sa Internet

Ito ay maaaring mukhang katawa-tawa (at ito ay) ngunit kung ang iyong likhang sining ay hindi kailanman na-upload sa internet sa unang lugar, walang pagkakataon na ito ay mahuli sa net at ginagamit upang sanayin ang AI. Siyempre, ang paghahanap-buhay bilang isang artista nang hindi gumagamit ng internet upang ibahagi ang iyong likhang sining ay maaaring halos imposible (lalo na kung nagtatrabaho ka sa isang digital na medium).

Para sa mga artista na nagtatrabaho sa musika, ito ay isang imposible. Kahit na gumamit ka ng mga tradisyunal na materyales tulad ng langis o watercolor, hindi masasabi kung may kukuha ng larawan ng isang natapos na piraso at mag-a-upload nito mismo.

Maaari bang Maging Copyright ang AI Art?

Ang tanong kung ang output ng generative AI ay maaaring ma-copyright ay isang kumplikado. Ang isang bagay na karaniwang tinatanggap ay ang AI tool na ginamit upang makabuo ng sining ay bihirang magkaroon ng anumang mga karapatan sa output.

Ito ay malinaw na nakasaad sa mga tuntunin ng serbisyo ng karamihan sa mga tool, kabilang ang Stable Diffusion:

Maliban sa itinakda dito, walang karapatan ang Licensor sa Output na nabuo mo gamit ang Modelo. Pananagutan mo ang Output na iyong nabuo at ang mga kasunod na paggamit nito. Walang paggamit ng output ang maaaring lumabag sa anumang probisyon tulad ng nakasaad sa Lisensya.

Ipinagbabawal ng lisensya ang anumang paggamit na lumabag sa anumang naaangkop na pambansa, pederal, estado, lokal o internasyonal na batas o regulasyon na kinabibilangan ng batas sa copyright.

Midjourney:

Pagmamay-ari mo ang lahat ng Asset na iyong nilikha gamit ang Mga Serbisyo, hangga't maaari sa ilalim ng kasalukuyang batas. Ibinubukod nito ang pag-upscale ng mga larawan ng iba, kung aling mga larawan ang nananatiling pagmamay-ari ng mga orihinal na tagalikha ng Asset.

At OpenAI (DALL-E 2):

Sa pagitan ng mga partido at sa lawak na pinahihintulutan ng naaangkop na batas, pagmamay-ari mo ang lahat ng Input, at napapailalim sa iyong pagsunod sa Mga Tuntuning ito, itinatalaga sa iyo ng OpenAI ang lahat ng karapatan, titulo at interes nito sa at sa Output.

Sa mga tuntunin ng pag-copyright ng anumang nilikha mo gamit ang naturang tool, sinabi ng US Copyright Office na ang copyright ay nalalapat lamang sa sining na nilikha ng mga tao (kasama ang iba pang mga kinakailangan, tulad ng pagka-orihinal):

Sa mga kaso kung saan inaangkin ang pagiging may-akda na hindi tao, natuklasan ng mga hukuman sa paghahabol na hindi pinoprotektahan ng copyright ang mga pinaghihinalaang mga nilikha.

Ang batas ay patuloy na nagbabago, kaya ito ay maaaring matagumpay na hamunin sa hinaharap. Kapansin-pansin din na ang mga elemento ng isang panghuling produkto na hindi produkto ng isang generator ng AI (tulad ng plot, o diyalogo) ay maaari pa ring ma-copyright kahit na ang ibang mga elemento (tulad ng artwork o musika) ay hindi.

Magagamit ba ng mga AI Art Generator ang Aking Naka-copyright na Sining?

Ang tanong ay hindi kinakailangang maaari gamitin ng mga generator ng AI ang iyong naka-copyright na sining, ngunit ginagamit ba nila ang iyong naka-copyright na sining na. Ang sagot sa tanong na iyon, tulad ng nalaman ng maraming artista, ay isang matunog na oo. Sa itaas ay tinalakay namin ang ilang paraan ng pag-opt out sa mga dataset at pagpigil sa mga crawler na i-index ang iyong content, ngunit ang mga diskarteng ito sa huli ay nakadepende sa sinumang namumuno sa paggalang sa iyong mga kagustuhan.

Maaari mong malaman kung ang iyong sining ay kasama sa pinakamalaking pampublikong dataset ng mga larawan gamit ang HaveIBeenTrained.com. Mag-upload ng isa sa iyong mas kilalang mga likhang sining o hanapin ang iyong pangalan, pamagat ng likhang sining, webcomic, o iba pang paglikha at tingnan. Kung nakikita mong lumabas ang iyong artwork sa website, kasama ang iyong sining sa isang dataset na ginagamit ng Stable Diffusion at iba pa.

Iyon ay walang sasabihin tungkol sa iba pang mga application ng pagbuo ng sining na hindi nagbubunyag kung aling mga dataset ang ginagamit (tulad ng DALL-E ng OpenAI). Maaari mong subukan anumang oras ang isang prompt tulad ng artwork sa estilo ng Iyong Pangalan upang makita kung anumang pamilyar na lalabas.

Maaaring Tumulong ang Mga Paparating na Tool na Talunin ang AI Art Generators

Maaaring may ilang pag-asa para sa mga artist na darating sa anyo ng mga tool na maaaring maging mas mahirap para sa isang generative AI na magparami ng likhang sining batay sa mga larawan sa isang dataset. Sa kasamaang palad, ang mga solusyon na ito ay wala pa (sa oras ng pagsulat) at walang nagsasabi kung gaano kabisa ang mga ito sa pangmatagalang panahon. Mabilis na nag-evolve ang mga tool ng AI, kaya posibleng mag-evolve ang mga ito para iwasan ang mga naturang pag-iingat.

Ang una ay Glaze, isang proyekto mula sa Unibersidad ng Chicago na nagdaragdag ng napakaliit na pagbabago sa likhang sining bago i-upload. Tinutukoy ng mga developer ang mga pagbabagong ito bilang isang style cloak at itinala na ang likhang sining ay lumilitaw-sa mata ng tao-halos magkapareho sa orihinal habang nagiging sanhi ng maling interpretasyon ng AI sa estilo bilang ng iba.

Ire-release ang Glaze bilang isang application para sa Mac at Windows, kaya ang artwork ay maaaring cloaked nang hindi umaalis sa computer ng artist. Sinasabi ng mga developer na hindi nila ikomersyal ang tool, kaya libre itong gamitin para sa sinuman. Tinitingnan ng proyekto ng Glaze ang tool bilang isang kinakailangang unang hakbang patungo sa mga tool sa proteksyon ng artist-centric upang labanan ang AI mimicry.

Ang isa pang pamamaraan na nakabalangkas sa blog ng Pursuit ng Unibersidad ng Melbourne ay naglalarawan sa banayad na paggamit ng ingay na nagbabago lamang ng sapat na mga pixel sa isang imahe upang malito ang AI, at gawin itong isang 'hindi matutunan' na imahe. Sinasabi ng institusyon na nakagawa sila ng isang pamamaraan na nagsasamantala sa isang kahinaan sa mga modelo at umaabot sa paglalarawan ng mga tool tulad ng Stable Diffusion bilang mga tamad na nag-aaral.

Ang diskarteng ito ay may malawak na hanay ng mga potensyal na paggamit kabilang ang visual na likhang sining ngunit pati na rin ang audio at mga larawan na personal na nagpapakilala sa iyo. Mahalagang kilalanin na ang mga diskarteng ito ay maaga pa rin sa mga tuntunin ng pag-unlad kaya kailangan nating maghintay at makita kung ano ang tunay na kakayahan ng mga ito.

Pagbangon ng mga Robot

Makakagawa ng mga artwork ang mga generative art app nang wala sa oras, ngunit hindi sila tunay na malikhain sa paraang katulad ng mga tao. Maaaring maisulat ng ChatGPT ang iyong resume, ngunit kailangan mong i-proofread ito nang mabuti dahil madalas ay may kumpiyansa na mali ang chatbot.

Ang pangunahing punto ay ang kasalukuyang mga solusyon sa AI ay maaaring maging kapaki-pakinabang ngunit mahina rin ang mga ito.