Strona główna Analizy Deepfake (nie)doskonały. Czy AI tworzy realistyczne obrazy?

Deepfake (nie)doskonały. Czy AI tworzy realistyczne obrazy?

Jak potężne są dziś generatory grafik? Czy nadal nie radzą sobie ze szczegółami?

Deepfake (nie)doskonały. Czy AI tworzy realistyczne obrazy?

Obrazy wygenerowane przez sztuczną inteligencję / Midjourney / Modyfikacje: Demagog

Deepfake (nie)doskonały. Czy AI tworzy realistyczne obrazy?

Jak potężne są dziś generatory grafik? Czy nadal nie radzą sobie ze szczegółami?

Przed wami para z Werony – Marco i Sofia. Dziennikarze, freelancerzy. Na co dzień zajmują się fotoreportażem. Późną jesienią 2021 roku kupili aparat Canon EOS R6. W jeden z ostatnich słonecznych piątkowych wieczorów w roku postanowili sprawdzić jego możliwości. Wyszli na ulice miasta i zrobili sobie kilka zdjęć. Delikatnie je przerobili i zastanawiali się: czy wyszło im dobre zdjęcie?

Obraz włoskiej pary na starym mieście we Włoszech – wygenerowany przez Midjourney.

Obraz wygenerowany w Midjourney

Poznajcie też Roberta (dla znajomych „Robot”), mieszkańca Krakowa w średnim wieku i pracownika korporacji, który udał się na krótki wypad do znajomych do Kijowa. 23 lutego 2022 roku przechadzał się uliczkami i zrobił sobie kilka fotek przy użyciu iPhona 13 pro, później przesłał je do kolegów. Przyjaciele z rozbawieniem komentowali nowe filtry Instagrama. „Całkiem nieźle radzą sobie z redukcją zmarszczek” – pisali na WhatsAppie.

Obraz mężczyzny na zatłoczonej starówce – wygenerowany przez Midjourney.

Obraz wygenerowany w Midjourney

Co łączy wszystkie te postacie? Każda z nich, przy odrobinie naszej pomocy, została wygenerowana przez sztuczną inteligencję – dokładniej przez Midjourney. Niektórzy zorientują się od razu. Inni będą mieli trudności. Niemniej jednak fałszywe obrazy generowane przez AI są coraz doskonalsze.

Ten tekst, autorstwa Aleksego SzymkiewiczaAdama Majchrzaka – analityków Stowarzyszenia Demagog, to już drugi z serii trzech artykułów nt. weryfikacji fałszywych obrazów generowanych przez AI. W poprzednim tekście przeczytasz o tym, czym jest deepfake i jak zmieniały się one w ciągu ostatnich lat. Z tego tekstu dowiesz się, jak potężne są współczesne narzędzia AI do tworzenia grafik, jak zwodnicze mogą być takie obrazy i czy AI nadal ma duże problemy z generowaniem detali, takich jak dłonie i zęby.

Marco i Sofia zbliżają się do stacji kolejowej, a „Robot” kręci się w kolejce do kas

Na szyby pociągu padały drobne krople deszczu. „Ściągniesz mi plecak?” – zapytała Sofia. Marco tylko skinął głową i czym prędzej wstał po bagaż, który leżał na półce. Przez moment słychać było pisk kół pociągu trących o szyny. Po chwili nieznośny dźwięk zastąpił gwar, płacz dzieci i wszechobecne echo nieznanych głosów. Na zegarku Marco wyświetlała się godzina 13:30. Zapomniał przestawić czas w trakcie podróży. W oddali na starym dworcowym zegarze wybiła 14:30. Był 27 lutego 2022 roku i właśnie dojechali na stację w Kijowie.

Tłum na dworcu – wygenerowane przez Midjourney.

Obraz wygenerowany w Midjourney

Decyzja była szybka. Para wyruszyła z Włoch do Ukrainy, by na zdjęciach udokumentować ból mieszkańców kraju zaatakowanego przez Rosję. W tym samym czasie Robert, któremu wojna przerwała urlop, próbował wydostać się z Ukrainy.  Ustawił się na końcu jednej z długich kolejek do kas i niecierpliwie tupał nogą, czekając, aż przesunie się o kolejny metr. 

Nie wiedział, że stoi w kolejce, którą Sofia uchwyciła na zdjęciu przy użyciu swojego Canona. Było to jej pierwsze zdjęcie wykonane w Ukrainie.

Kolejka do kas na dworcu – wygenerowane przez Midjourney.

Obraz wygenerowany w Midjourney

Historia tych postaci została zmyślona, ale fałszywe fotografie wygenerowane przez AI mogą wzbudzać ogromne zainteresowanie. W zalewie informacji na platformach społecznościowych szczegóły mogą umknąć naszej uwadze.  Tworzenie i osadzanie opowieści wokół takich obrazów może skutecznie uśpić naszą czujność. Co istotniejsze, detale obrazów są coraz trudniejsze do uchwycenia. Niekiedy wręcz nie sposób odróżnić wygenerowane grafiki od prawdziwego zdjęcia.

Nawet jeżeli „zdjęcie” ma niedoskonałości i wydaje się podejrzanie gładkie, to kiedy w grę wchodzą emocję i szybki przekaz, weryfikacja obrazów może stać się jeszcze trudniejsza. Tym bardziej jeżeli komuś zależy na wprowadzeniu innych w błąd. Zastanówmy się: co byłoby, gdyby ktoś wygenerował piękną, ale całkowicie zmyśloną dzielnicę Mariupola, by sugerować, że Rosja wcale nie zniszczyła miasta? Bardziej skrajnych przykładów zastosowań generatorów podawać nie będziemy.

Deepfake – czy fałszywki nadal są nieudolne? Jak bardzo?

Im lepsze stają się narzędzia AI, tym mniej skuteczni w ich rozpoznawaniu stają się ludzie. W połowie kwietnia media obiegła informacja, że obraz wygenerowany przez Borisa Eldagssena przy użyciu AI wygrał konkurs fotograficzny Sony World Photography Award. Z kolei pod koniec kwietnia 2023 roku plebiscyt na „Osobowość roku 2022” wygrała Agata Bąk – fikcyjna osoba stworzona przez Martynę Regent, aktywistkę stowarzyszenia Miasto Wspólne.

W obu przypadkach autorzy ujawnili prowokację i nie przyjęli nagrody (1, 2). Niemniej jednak na tych przykładach widać, że można wygenerować tak autentyczny obraz, że nie da się go rozpoznać gołym okiem bez wiedzy na temat jego pochodzenia. 

Jeszcze na początku 2023 roku narzędzia AI do generowania grafik uchodziły za nieudolne w przypadku takich szczegółów, jak realistyczne spojrzenie, zęby, uszy czy dłonie: ogólnie ludzkie twarze i inne cechy anatomiczne nie były doskonałe. Jak  to wygląda obecnie? W poszukiwaniu odpowiedzi na to pytanie użyliśmy generatora Midjourney, który obecnie uchodzi za jedno z najlepszych narzędzi do tworzenia fotorealistycznych obrazów.

W poprzednim tekście z tej serii pisaliśmy, że Midjourney jest generatorem grafik, wspieranym przez algorytmy sztucznej inteligencji. To właśnie ten program odpowiada za stworzenie fałszywych fotografii z wydarzeń, które nie miały miejsca – Donalda Trumpa podczas zatrzymania policji, papieża Franciszka w stylowej kurtce czy Juliana Assange’a (założyciela WikiLeaks) w więzieniu

Rozwój tego narzędzia jest błyskawiczny. Jego pierwsza wersja (V1) ujrzała światło dzienne w lutym 2022 roku. Osiem miesięcy później, w listopadzie, oprogramowanie zostało zaktualizowane do wersji czwartej (V4). Ostatni model, wersja 5.1 (V5.1), został udostępniony 4 maja 2023 roku.

Jak dzisiaj sztuczna inteligencja radzi sobie z dłońmi, zębami czy uszami? Efekty w Midjourney

Już po kilku próbach w Midjourney naszym oczom ukazały się już całkiem dobrze wyglądające i poprawne anatomicznie części ciała: dłonie, zęby i uszy. To duży krok naprzód w porównaniu do możliwości takich narzędzi sprzed kilku miesięcy. Dłonie mają prawidłową liczbę palców, szczęka liczy sobie 28 zębów, a małżowina uszna jest poprawnie odwzorowana. 

Zestawienie dłoni, uszu i zębów wygenerowanych w Midjourney.

Zestawienie dłoni, uszu i zębów wygenerowanych w Midjourney

Nie każdy obraz będzie doskonały. Ale jeśli ktoś zechce wprowadzić innych w błąd i zamaskuje pewne niedociągnięcia? Wtedy najpewniej otrzyma obraz, którego większość ludzi nie rozpozna. Jednak nie jesteśmy całkiem bezbronni: choć Midjourney radzi sobie z generowaniem poszczególnych cech anatomicznych, to nieco trudniej mu idzie, gdy postaci jest więcej.

Kolejka ludzi na wolnym powietrzu na ulicy w zimę – wygenerowane przez Midjourney.

Obraz wygenerowany w Midjourney

Powyższe zdjęcie wykonane przez Marco w Kijowie, przy jednym z obleganych sklepów spożywczych, nie pokazuje dokładnie żadnej twarzy, a podejrzanie wiele osób nosi ze sobą jednakowe parasole. Czyżby taka była moda w Ukrainie? Także i tu przy odpowiednim podejściu można odpowiednio zamaskować tło i inne niedociągnięcia, tak by trudniej było zorientować się co do pochodzenia obrazu.

Obrazy generowane przez AI. Jak dobry w starciu z nimi jest twój wzrok?

W następnym artykule znajdziesz porady na temat samodzielnego weryfikowania obrazów i zdobędziesz podstawową umiejętność odróżniania generowanych grafik od prawdziwych zdjęć. Najpierw jednak zachęcamy Cię do zmierzenia się ze specjalnym zadaniem

ZADANIE: Które z poniższych obrazów (a może wszystkie?) to prawdziwe stockowe fotografie? Które z nich zostały wygenerowane przez sztuczną inteligencję? Chcesz poznać rozwiązanie? Wyślij nam swoją odpowiedź na naszym fanpage’u (Facebook lub Instagram)!

Zadanie związane z weryfikacją prawdziwych obrazów. Do wyboru 9 odpowiedzi, w tym trzy związane z wyspami, trzy związane ze stacją kolejową i trzy z samochodami.

Zestawienie obrazów z Midjourney i stockowych fotografii

Podsumowanie – czy istnieją sposoby, by nie dać się oszukać?

Wydawałoby się, że możemy już tylko bezradnie rozłożyć ręce. Wszystko wskazuje na to, że dzieli nas cienka granica od tworzenia perfekcyjnych obrazów, które jedynie przypominają zdjęcia, a wcale nimi nie są. Czy wobec tego jesteśmy całkowicie bezbronni? Przyszłość zawsze można rysować w czarnych barwach, jednak świat się nie skończy. Jak zawsze ludzkość będzie musiała nauczyć się żyć z nową technologią. Nie tylko żyć, ale nauczyć się… szybko uczyć.

  • Jak weryfikować obrazy generowane przez AI?
  • Czy istnieją narzędzia, które mogą nam w tym pomóc?
  • Jakie jest rozwiązanie naszego zdania z dziewięcioma przykładami?

Trzeci tekst z serii już wkrótce…

Zapraszamy do zapoznania się z pierwszym artykułem pt. „Złowieszczy Obama i stylowy papież – ewolucja deepfake’ów”.

*Jeśli znajdziesz błąd, zaznacz go i wciśnij Ctrl + Enter

Pomóż nam sprawdzać, czy politycy mówią prawdę.

Nie moglibyśmy kontrolować polityków, gdyby nie Twoje wsparcie.

Wpłać

Dowiedz się, jak radzić sobie z dezinformacją w sieci

Poznaj przydatne narzędzia na naszej platformie edukacyjnej

Sprawdź!