Skærmbilleder redder dig ikke fra AI's usynlige fingeraftryk

Part 1 - En guide til maskinernes DNA, og hvorfor de altid ved, hvad de selv har skabt.


Velkommen til fremtiden. I en verden, hvor maskinerne langsomt men sikkert gør vores evner overflødige (hurra for det, ikke?), er det i det mindste rart at kunne kende forskel på et rigtigt menneske og et stykke avanceret kode. 

For nylig faldt jeg over et flot fotografi, og jeg forsøgte at spore fotografen. Sporet var koldt. Ingen resultater overhovedet. TinEYE sagde også at billedet var unikt, selv Google Lens kunne ikke vise noget der lignede den. 
Det viste sig selvfølgelig at være et fuldt ud AI-genereret fantom.

Gemini fortalte at billedet er genereret af kunstig intelligens, af Google LLC.

Men her er det sjove: Selvom jeg prøvede at omgå systemet ved at tage et simpelt skærmbillede af billedet, vidste AI-detektoren stadig, at det var falsk. 

Hvordan? 

For at forstå det, skal vi se på, hvordan vi plejede at gemme data, og hvordan maskinerne gør det nu.


Den Gamle Skole: EXIF-data (Post-it sedlen)
I traditionelt digitalt fotografi gemmes informationer som kameramodel, dato og GPS-lokation i en usynlig tekstfil, der hæfter sig til selve billedfilen. Dette kaldes EXIF-data.

Analogi: Tænk på EXIF-data som en Post-it-seddel klistret bag på et fysisk fotografi. Når du tager et skærmbillede med din telefon, tager du reelt set bare et helt nyt billede af skærmen. Du fanger motivet, men Post-it-sedlen på bagsiden følger ikke med. Filen er helt ny og ren. 

Den Nye Virkelighed: AI'ens Usynlige DNA
De nye AI-billedgeneratorer bruger en teknologi kaldet SynthID. I stedet for at klistre en Post-it-seddel på bagsiden, væver de informationen direkte ind i selve billedets stof.  Og for at være ærlig, lyder metoden som noget direkte ud af en mørk sci-fi-roman – og tro mig, jeg ved et par ting om at skrive om dystre fremtidsudsigter.

I stedet for bare at ændre lidt på farverne på overfladen, oversætter AI'en billedet til et komplekst matematisk kort over frekvenser og bølger. Herefter laver den mikroskopiske, bevidste justeringer i disse dybe matematiske strukturer over hele billedet.

Det Usynlige Gitter
For vores menneskelige, fejlbarlige øjne ser en pixel på skærmen måske bare ud som en glat nuance af blød blå. Vi er fantastiske til at genkende ansigter (selv dem, der ikke findes i virkeligheden), men vi er fuldstændig elendige til at spotte mikroskopiske, matematiske anomalier i farvekoder. AI'en sørger bevidst for, at disse ændringer holdes strengt under den menneskelige perceptuelle tærskel.

Men for en AI-detektor ser billedet helt anderledes ud. Den fjerner simpelthen alt det visuelle indhold – modellens ansigt, baggrunden, lyssætningen – og kigger udelukkende på det underliggende statistiske mønster. Tænk på det som at holde en mistænkelig pengeseddel under et UV-lys. Det, der lige før lignede almindeligt papir, afslører pludselig et lysende, kryptografisk sikkerhedsgitter.

Hvorfor et skærmbillede ikke redder dig
Så hvorfor overlever dette vandmærke et skærmbillede (screenshot)? Fordi dette sikkerhedsgitter er bygget ind i selve farveværdierne i de pixels, du kigger på. Når du tager et skærmbillede, kopierer du bare de alterede pixels. De skjulte bølgemønstre bliver direkte duplikeret over i din nye, "rene" fil.

Så længe skærmbilledet ikke er komprimeret eller sløret til ukendelighed, kan detektoren stadig trække den usynlige signatur ud af støjen. Så næste gang du tror, du kan vaske AI'ens fingeraftryk væk ved bare at trykke på 'Print Screen', så husk: Maskinerne har vævet deres signatur ind i selve virkelighedens – eller i det mindste billedets – stof. Skynet er her ikke helt endnu, men de har i det mindste imponerende godt styr på deres ophavsret.


Part 2 - Eksporteret data fra AI generet billeder

Jeg fik Gemini til at generere et så generisk som muligt billede, af så generisk som muligt politiker, i (igen) en mega generisk studio. 


Billedet ville nok snyde de fleste 60+ årige på Facebook. Så ville jeg prøve at finde ud af, hvordan de forskellige hjemmesider - "AI investigators" ville finde ud af at billedet er "fake".

ChatGPT: Den var ærlig, og fortalte at den kunne ikke finde noget SynthID (da det er kun Googles DeepMind der kan aflæse de forskellige frekvenser i SynthID), og der var hellere ikke noget C2PA da det er mere billedets metadata, som bliver "embedded" i selve billedet - men ChatGPT kom med en fuld analyse af billedet og kunne så fortælle, i store træk, at billedet var alt for perfekt i selve opsætningen, men havde en del unaturlige detaljer, som gjorde billedet nem at spotte som AI-genereret.

Google DeepMind: Ville ikke fortælle detaljerne omkring selve SynthID embedding, og navigerede tilbage til Gemini, som fortalle at billedet indenholder SynthID, men den ville ikke vise eller fortælle hvad den præcis "så" på billedet. Den ville hellere ikke generere et billede over hvordan de forskellige pixels er, og hvor på billedet de er - sikkert en forretnings-hemmelighed. 

Dette indlæg er skrevet med en sund portion skepsis over for vores nye digitale overherrer.

Kommentarer