Riktigt så enkelt är det inte.
När man sparar en bild som jpeg så delas bilden upp i block om 8x8 pixlar som sedan trycks igenom en matematisk funktion som kallas DCT (diskret cosinus-transform). Den försöker matcha färgförändringar i blocket med en gradient som beskrivs av en sinusvåg. När den har hittat en bra matchning så sparas frekvens, amplitud och fas och sedan subtraheras gradienten från originalet och sedan börjar man om och försöker hitta en ny sinusvåg som matchar det som finns kvar. Proceduren upprepas tills det mönster som beskrivs av sinusvågorna överenstämmer med XX procent med originalet, där XX är det valda kvalitetsvärdet.
Men eftersom det i praktiken ofta är omöjligt att beskriva alla mönster till 100% noggrannhet med sinusvågor så har de flesta DCT:er ett tak där den ger upp när den märker att varje ny iteration gör för liten skillnad. Så i praktiken betyder 100% egentligen "99% i bästa fall, men mindre om det blir för jobbigt".
Jag skrev en DCT som ett delmoment i examensarbete våren 2000. Den avkodade DV (Sonys digitala videoformat) som fungerar lite annorlunda. Den har inget kvalitetsvärde utan varje frame (bildruta) har en fast storlek. När datablocket är fullt avbryter man DCT:n och går vidare till nästa bildruta oavsett vilken kvalitet man lyckades komma upp i.