Annons

AI för att generera exv. ITPC-keywords?

Produkter
(logga in för att koppla)
Nää, där kommer detta inte att stanna och det vet jag att även ni vet. Vi som var med på åtti- och nittiotalen då statens uppgift bl.a. såg som självklar när det gällde att försvara folks integritet har fått se de ambitionerna successivt malas ned av sociala media. Staten kunde nämligen inte göra något som helst när folk själva upphävde sin personliga integritet på Facebook och på den vägen är det och detta har blivit mycket värre än vi någonsin ens kunde mardrömma om redan.

Vill man ha hjälp att identifiera någon så är nog det inget större problem eller hur? Det är bara att to hjälp av instagrams sociogrambaserade relationer så vet man vilka kompisar folk har också. Det som fortfarande varit fult i Europa har ju varit om en stat börjat kartlägga folk aktivt men det har alltså gott väldigt bra om folk själva gjort det på sociala medier

Så idag är manegen redan krattad och man har självklart börjar i Afrika, där kunskapsnivån är lägst och motståndet minst. Jag ser en nära framtid där det kommer vara vardagsmat med tjänster på nätet som man kan slänga vilka personbilder som helst på. I Afrika har Huawei hålit på ett bra tag nu med att sälja in sitt koncept Safe Cities baserat på kinesernas teknik som de utvecklat för att ha råkoll på sin egen befolkning.

Huawei’s Surveillance Technology Program “Safe Cities” Now Active in 12 African Countries – The China-Global South Project (chinaglobalsouth.com)

Det kommer nog inte ta särskilt lång tid innan det finns världsomspännande tjänster som kommer erbjuda denna typ av tjänster precis som det finns de som erbjuder data för reverse lookup av geodata utifrån koordinater.

---> Se gärna denna 3D-presentation av det imponerande kongresscentret som byggts av Kina för African Unity i Addis Ababa Etiopien

De smarta och långsiktigt navigerande kineserna har ju byggt det nya kongresscentret för African Unity som ersatte den gamla Africa Hall som byggdes på 60-talet under Haile Selassie i Addis Abeba och det är större än t.o.m. FN-området i New York. De bygger dammar och sportarenor, vägar och hamnar och inte minst så bygger Huawei deras telesystem nu över hela Afrika. Varje år samlas ledarna för Afrikas stater i det nya kongresscentret och kommunicerar med varann via det Huawei-när kineserna byggt åt dem. Låter det bra?

Afrikanerna är totalfintade av ett Kina som fortfarande ses som obefläckat som imperialistsstat och som rider på en våg av cred de skickligt byggt upp sedan de byggde TanZam-järnvägen mellan Tanzania och Zambia.

Varför ska vi tro att inte alla dessa persondata kommer krängas en dag på precis samma sätt som den data Facebook säljer till företag idag.

Rent tekniskt så ser jag ingen större skillnad mellan att man idag kan skicka en bild på Chat GPT och att man i en nära framtid kommer kunna skicka personporträtt på en identifieringstjänst och de kommer säkert byggas in i framtida kameror och bildredigerare också.

Men nu argumenterar du ju mot dig själv. Om jag förstår dig rätt så kommer vi kunna identifiera alla personer i världen med t.ex lightroom, men inte de tre personerna du har fotat i Afrika. Och inte heller kommer det gå att identifiera glasmosaiken du har fotat. Men alla människor kommer kännas igen?

Jag har också svårt att förstå vad skillnaden är om du eller datorn har skapat nyckelorden. Det är ju ingen ny teknik heller. Du är med på att det är två system som kan fungera parallellt? Du behöver inte kleta ner din metadata.
Det går ju alltid att hitta undantag, men om man nu diskuterar generellt om bildsortering så är det väl alldeles solklart att automatik är det mest praktiska.
(Förutom för glasmosaik och de tre personerna i dina foton)
 
Jag tror ni dessutom är helt ute om ni skulle tro att jag är någon motståndare till AI generellt, men jag vet bara genom mitt eget både professionella yrkesliv med DAM-teknik och mitt eget arkivbyggande att autogenererade keywords från exv. telefonbilder inte är särskilt bra utom i ett enda avseende och det kan vara att de går snabbt att få på plats. Problemet är bara att det i andra änden kan kosta ganska stora insatser för att rensa ut en massa AI-hallusinationer i andra änden.

Rätt använt älskar jag AI i bl.a. min kameras AF, Photolabs Deep Prime för brusreducering och Capture Ones nya fantastiska AI-styrda maskningsfunktioner som jag tycker redan är förbluffande bra. Att maska bordet på bilden skulle vara rätt ineffektivt, oprecist och jag skulle faktikst inte riktigt veta var jag skulle börja med de verktyg som finns i nuvarnade DXO Photolab som med dagens mått mätt är väldigt daterade.

Visa bilaga 173329

Men med Capture One och build 16.3.5 så väljer man AI-select och ritar en kvadrat runt bordet. Då markeras tyvärr även allt på bordet. Inget problem- Med AI-Erase så klickar man bara en gång på varje glas, ett par ggr på flaskan och drar en linje för att markera alla grupper av utspridda kort på bortdet - Klart. Så med väldigt liten insats har man idag en väldigt stor frihet att ta sig an snart sagt vad som helt och med en effektivitet som är vida bättre än allt jag sett i någon av mina konverterare tidigare.

Efter det tycker jag det blivit mycket kortare mellan mina tankar på vad jag vill göra med en bild och det färdiga resultatet. Några sådana effekter har jag svårt att se att jag skulle kunna vare sig med ansiktsigenkänning eller AI-genererade keywords i ett system där man försöker upprätthålla dataintegritet kring en Controlled Vocabulary. Det passar inte alls mig men om andra blir glada åt det så har jag inget emot det. Folk får göra precis vad de vill med sina metadata - det angår inte mig överhuvudtaget bara jag slipper höra här om deras brustna förväntningar :cool:

En sista grej. Eftersom ansiktsigenkänning bevisligen fungerar extremt bra, tycker du att det verkar bättre att tagga t.ex. 30000 bilder med personnamn själv än att låta automatik sköta det?
Samma gäller alltså objekt, scenarion m.m
 
Jag försökte leta efter lite info på nätet utan att lyckas, men visst borde det gå att använda BLIP till att skapa metadata? Eller snarare, det går ju redan nu bra att låta BLIP göra jobbet, men resultatet hamnar i en txt-fil bredvid bilden, medan man helst vill ha resultatet sparat som ITPC i filen?
 
Bara för att testa installerade jag immich och körde in lite bilder. Det fungerar faktiskt förvånandsvärt bra. Där analyserar ett AI bilderna och märker upp dom.

Efteråt har jag en karta som visar var jag tagit mina bilder (som har GPS-Info) och den plockar ut ansikten och efteråt kan jag klicka på ett ansikte och få fram alla bilder som den personen finns med i.

Jag kan sedan även skriva "car" (det fungerar bäst på engelska) och få fram alla bilder med bilar. Eller "bird" och få alla bilder med fåglar. Etc. Bilderna jag laddade upp hade inga ITPC-taggar så det har den helt och hållet tagit fram genom att AI-analysera bilderna.

Jag laddade upp 2923 bilder, det tog 10 Minuter för min dator (Intel i9 12th gen) att analysera det hela. Sedan installerade jag det hela på min server och gjorde om det hela. Min server har en äldre processor (Intel i7 6th gen) och där tog det 1 timme. En kompis gjorde det samma på den senaste MacBook Pron, där tog det 25 min för samma mängd bilder.

Men även 1 timme är rätt ok för att få ca 3000 bilder uppmärkta på det viset.
 
Jag tänkte nyss när jag tittade på den tråden att det var nog precis vad som hade hänt. :)
 
Blev ett bra sätt att testa programmet. Har bara lagt in mina mobilbilder än så länge och 5 RAW-filer för att testa. Har för lite plats på min Server som kör immich för att tjoffa in alla mina RAW-bilder.

Immich är i grund och botten ett backup-program för mobilbilder som någon senare började lägga till AI-funktionier i. Varje gång jag kommer hem så laddar min telefon automatiskt in alla nya bilder till Immich via deras app. Om man släpper ut immich på nätet kan appen göra det hela tiden.

Men man kan också ladda upp valfria bilder som man har på sin dator.
 
ANNONS
Spara upp till 12000 kr på Nikon-prylar