Annons

Hur fungerar autofokus?

Produkter
(logga in för att koppla)
Kort svar: Den fokuserar och letar efter den punkt där det är mest kontrast.

Det mer tekniska överlåter jag till nån annan ;)
 
Orky skrev:
Kort svar: Den fokuserar och letar efter den punkt där det är mest kontrast.
Det är väl bara på kompaktdigitalare autofokusen jobbar utifrån att maximera entropin?

Analoga AF och systemkameror kör väl med någon typ av fasdetektering (fråga mig inte hur det funkar)?

Rätta mig om jag har fel.

/Richard som fokuserar manuelt
 
Pupillen skrev:
Det är väl skärpan den letar efter, så du menar nog minimera ;-)
Nej det tror jag inte.

En jämn nivå (totalt utsuddat) get låg entropi (informationslöshet) medan skarpa (egentligen slumpmässiga) variationer ger hög entropi (informationsrikt).
 
Menar du att skarpa informationsrika bilder är mer kaotiska (d v s har högre entropi) än suddiga informationsfattiga bilder. Det skulle ju i så fall innebära att en suddig bild skulle bli skarpare om vi lämnade den åt sitt öde och lät den åldras ifred i väntan på den oundvikliga entropidöden :)
 
Entropimaximerande autofokuskriterier baserar sig på antagandet om en slumpmässig bild där varje bildpunkt bara korrelerar svagt (eller inte alls) till övriga och därmed innehåller bilden mycket information. När bilden då suddas ut, eller faltas med en oskärpecirkel (något förenklat, men en hygglig approximation om motivet är vinkelrät optiska axeln och paralellt sensorplanet), introduceras en korrelation bildpunkterna emellan med en korellationsradie motsvarande storleken på oskärpecirkeln. Bilden blir således informationsfattigare och mindre slumpmässig eftersom om du känner en bildpunkts värde så kan du med större sannolikhet prediktera de närliggande pixlarnas intensitet.

Sedan i praktiken är det ju bara en realisation av den stockastiska bilden man har tillgång till så det blir naturligtvis numeriska väntevärdes approximationer man jobbar med istället för sanna väntevärden.

Det där med entropi från ett termodynamiskt perspektiv har jag inte någon koll på, men jag trodde värmedöden var en myt. Jag har bara kommit i kontakt med entropi ur ett informationsteoretiskt perspektiv.
 
Galaxens President skrev:
Entropimaximerande autofokuskriterier baserar sig på antagandet om en slumpmässig bild där varje bildpunkt bara korrelerar svagt (eller inte alls) till övriga och därmed innehåller bilden mycket information. När bilden då suddas ut, eller faltas med en oskärpecirkel (något förenklat, men en hygglig approximation om motivet är vinkelrät optiska axeln och paralellt sensorplanet), introduceras en korrelation bildpunkterna emellan med en korellationsradie motsvarande storleken på oskärpecirkeln. Bilden blir således informationsfattigare och mindre slumpmässig eftersom om du känner en bildpunkts värde så kan du med större sannolikhet prediktera de närliggande pixlarnas intensitet.

Sedan i praktiken är det ju bara en realisation av den stockastiska bilden man har tillgång till så det blir naturligtvis numeriska väntevärdes approximationer man jobbar med istället för sanna väntevärden.

Det där med entropi från ett termodynamiskt perspektiv har jag inte någon koll på, men jag trodde värmedöden var en myt. Jag har bara kommit i kontakt med entropi ur ett informationsteoretiskt perspektiv.

Själv så tycker jag att Richards inlägg ovan ger hela svaret, glasklart! ;-)
 
Va sjutton, Elohim pluggar ju teknisk fysik så han är nog med på tugget ;-).

Orky skrev i princip samma sak fast enklare.

Ville bara argumentera för att det är maximera entropin man vill göra, som svar på Pupillens inlägg.

Det där med autofokus via fas-detektering får någon gärna förklara för mig. Jag antar att det inte har med någon fas från ljusets vågnatur att göra (ljuset som når AF sensorn är ju inte speciellt smalbandigt), utan fas i detta sammanhanget är väl antagligen något slarvigt uttryck för bildförskjutning liknande den man får i en mattskiva med snittbild eller microprismor. Förklara för mig!
 
Richard: Det informationsteoretiska språkbruket är en gigantisk ”kulturchock” för mig. Det känns därför väldigt avigt när du kallar avsaknad av slump (d v s låg entropi) för ”suddigt och informationslöst” eftersom fotografisk skärpa ju är just frånvaron av slump, och sedan närvaron av slump (d v s hög entropi) för ”skarpt och informationsrikt” när ju slumpmässiga variationer gör den färdiga bilden mer otydlig.

Fotografisk skärpa innebär för mig att bilden har hög grad av ordning, d v s det är väldigt osannolikt att den uppstår av en ren slump. Om nu entropin ökar så blir informationen mer kaotisk, d v s bilden blir suddigare. Nåväl, oavsett språkbruk så antar jag att vi kan enas om att om automatfokuseringen gör sitt jobb, hur den nu än utför det, och vi får ett skarpt fotografi som slutresultat så har detta lägre entropi än om det blivit oskarpt.
 
Att en detaljrik bild har större entropi än en suddig dito kan lätt ses på att en jpeg som är suddig kan komprimeras mycket mer än en bild med skarpa detaljer och hög entropi.

Kaos är alltså svårare att beskriva (kan inte komprimeras lika lätt) än stora homogena ytor (som oskarpa bilder består av).


Fasdetektering består mycket riktigt av att bilden splittas upp i två delar som får gå varsin omväg för att sedan stråla samman igen. Om bildhalvorna överlappar varandra ligger fokusplanet för nära kameran och om bildhalvorna är en bit ifrån varandra så ligger fokusplanet för långt bort. AF sensorn kan då veta dels hur långt (avståndet mellan halvorna) objektivet skall flyttas dels åt vilket håll (överlapp eller separation).
 
Pupillen skrev:
...Nåväl, oavsett språkbruk så antar jag att vi kan enas om att om automatfokuseringen gör sitt jobb, hur den nu än utför det, och vi får ett skarpt fotografi som slutresultat så har detta lägre entropi än om det blivit oskarpt.
Nej, högre entropi, enligt min mening. Jag tror förbistringen kommer av att vi modellerar bilden olika. Jag skall försöka göra min ståndpunkt mer lättförståelig.

Visst, när bilden väl finns där när fotografen valt ett motiv och på ett systematiskt sätt ställt in kameran med t.ex. god skärpa är bilden fri från slump, men det är inte slump i meningen att kameran eller fotografen gör inställningar slumpmässigt (vilket med största sannolikhet skulle leda till en oskarp bild) som vi baserar vår model att bygga en autofokusalgoritm på.

Kameran vet inget om hur bilden ser ut och bör därför inte ha några förutfattade meningar om den, dvs givet en bildpunkts värde så kan nästa bildpunkts värde vara vilket som helst, helt slumpmässigt (ur kamerans synvinkel) alltså. Är bilden däremot oskarp och givet en bildpunkts värde så är sannolikheten stor att angränsande bildpunkters värde ligger inom ett mindre interval nära den givna bildpunktens värde, dvs de angrändande bildpunkternas värde har mindre spridning eller slumpvariation. En bild med få detaljer och lågt brus har alltså också låg entropi och därav ger inte en dålig skärpa en stor förändring i kriteriefunktionen man försöker opimera (maximera entropin), dvs en felaktig skärpa straffas inte så hårt. Därför blir det också svårt att ställa skärpan på detaljlösa bilddelar.

(Skulle vi sedan helt fritt maximera entopin så skulle vi bara få en bild med myrornas krig men vi låser oss till att bara objektivets läge i förhållande till filmplanet och med bara den frihetsgraden så blir bilden som ger den maximala entropin den skarpa bilden)

Som sagt vi är överens i hur kontrastoptimerande AF fungerar och kivas bara över hur vi använder ordet entropi och slump/oordning i sammanhanget.
 
Pupillen skrev:
Richard: Det informationsteoretiska språkbruket är en gigantisk ”kulturchock” för mig. Det känns därför väldigt avigt när du kallar avsaknad av slump (d v s låg entropi) för ”suddigt och informationslöst” eftersom fotografisk skärpa ju är just frånvaron av slump, och sedan närvaron av slump (d v s hög entropi) för ”skarpt och informationsrikt” när ju slumpmässiga variationer gör den färdiga bilden mer otydlig.

Fotografisk skärpa innebär för mig att bilden har hög grad av ordning, d v s det är väldigt osannolikt att den uppstår av en ren slump. Om nu entropin ökar så blir informationen mer kaotisk, d v s bilden blir suddigare. Nåväl, oavsett språkbruk så antar jag att vi kan enas om att om automatfokuseringen gör sitt jobb, hur den nu än utför det, och vi får ett skarpt fotografi som slutresultat så har detta lägre entropi än om det blivit oskarpt.

Högre entropi innebär givetvis mer slumpmässiga variationer oavsett språkbruk. Det som avses är att en bild med mycket detaljer (skarp) är mer slumpmässigt i det avseendet att varje pixel har mindre att säga om sin närliggande omgivning. En oskarp bild består ju av punkter som har "förstorats" och därför beskriver varje pixel sin omgivning bättre och är därmed mindre slumpmässigt ordnad.

En bild med maximal entropi består ju av endast massa slumpmässiga punkter. Varje sån punkt skulle man kunna säga vara skarp. Varje pixel är då skild från sin granne. Om du gör den bilden så oskarp som du kan så kommer hela bilden bara bestå av en enda färg (medelvärdet). Då beskriver en pixel hela ytan och slumpmässigheten är minimal, således är entropin i en oskarp bild minimal, v.s.v. :)

Hoppas mitt svammel gick att förstå...

Edit: givetvis hann nån före :) så går det när man måste jobba mitt i inlägget..
 
qvirre skrev:

...Fasdetektering består mycket riktigt av att bilden splittas upp i två delar som får gå varsin omväg för att sedan stråla samman igen. Om bildhalvorna överlappar varandra ligger fokusplanet för nära kameran och om bildhalvorna är en bit ifrån varandra så ligger fokusplanet för långt bort. AF sensorn kan då veta dels hur långt (avståndet mellan halvorna) objektivet skall flyttas dels åt vilket håll (överlapp eller separation).

Det skulle vara intressant att se en skiss över strålgången hur överlappet/avståndet mellan bildhalvorna uppstår vid objekt utanför det plan i motivet som är i focus (kanske kan grunna lite mer själv på detta, men har någon en sjyst länk som illustrerar detta så tackar jag inte nej).

Det skulle ocksp vara intressant hur ett AF system detekterar och estimerar överlappet/avståndet mellan bildhalvorna. För max-entropi-fokusering finns det ju enkla uttryck för att beräkna numerisk entropi i en (2D-)signal och sedan röra linspaketet i possitiv differensriktning, vilket borde bli långsammare än att skatta nödvändig fokusering utifrån snittbildsöverlapp/-avstånd.
 
Hmm, här kommer en riktigt OT-kommentar.
Det var länge sedan jag läste termodynamik och statistisk termodynamik och jag har (efter ytterligare en lång utbildning och några år i arbetslivet) glömt det mesta.
Inom termodynamiken är ju entropin en kvantitativ storhet med en specifik innebörd, medan jag aldrig har sett begreppet användas som något annat än en kvalitativ storhet inom informationeteknologin. Jag har inte heller hittat någon riktigt bra anledning för informationsteknologin att använda just begreppet "entropi" när det verkar som "slumpmässighet" skulle duga lika bra. Detta leder mig till 3 frågor:
1. Används begreppet "entropi" som något annat än en synonym till "slumpmässighet" inom informationteknologin? (Om bara använder det som sysnonym till slumpmässighet, varför använder man det då?)
2. Använder man begreppet kvantitativt inom informationsteknologin?
 
epep skrev:
Detta leder mig till 3 frågor:
1. Används begreppet "entropi" som något annat än en synonym till "slumpmässighet" inom informationteknologin? (Om bara använder det som sysnonym till slumpmässighet, varför använder man det då?)
2. Använder man begreppet kvantitativt inom informationsteknologin?

Detta leder mig till 1 fråga, var är fråga 3? :-D

/Daniel

(ja jag är jättetrött)
 
epep skrev:
Detta leder mig till 3 frågor:
1. Används begreppet "entropi" som något annat än en synonym till "slumpmässighet" inom informationteknologin? (Om bara använder det som sysnonym till slumpmässighet, varför använder man det då?)
2. Använder man begreppet kvantitativt inom informationsteknologin?

1.
Nej slumpmässighet är inte alltid en bra översättning av entropi. Slumpmässighet är något som får en att tänka på något okontrollerbart medan i sammanhanget så är entropi mer ett sätt att se på något som är okänt genom att modellera det okända som något stochastiskt (slumpmässigt). Skilnaden på något som är deterministiskt men okänt och något som är stochastiskt kan te sig väldigt filosofisk men rent matematiskt så har det ibland skilda implikationer och resultat.
Observerar du tillexempel output till ett linjärt system
y(t)=Ax(t)+e(t) under en tidsperiod t=1,...,N
och utifrån uppmätta data y(t) skatta konstanten A och e(t) är vitt brus. Om du då modellerar x(t) som en deterministisk men okänd signal eller om du modellerar x(t) som en stochastisk signal så får man olika maximum-likelihood skattningar av A (enkelt beskrivet, det mest troliga värdet på A) där den ena skattningen är bättre i medeltal.

2.
Visst används entropi som ett kvanitativt mått (och kanske framför allt som ett teoretiskt verktyg). Det definierades av Shannon (informationsteorins pappa) baserat på sannolikheter som ett mått på information i en signal (se t.ex. http://en.wikipedia.org/wiki/Information_theory) . I praktiken vet man dock sällan dessa sannolikheter men man kan skatta dem utifrån data och få ett kvanitativt mått. Även i autofokusalgoritm som baserar sig på entropimaximering så evaluerar man ju entropin (eller storheter proportionerliga mot den) för att jämföra kostfunktionensvärde om man nått optimum eller inte, således änvänder man ju entropin kvantitativt.
 
Galaxens President skrev:
Som sagt vi är överens i hur kontrastoptimerande AF fungerar och kivas bara över hur vi använder ordet entropi och slump/oordning i sammanhanget.
Ja, funktionen är vi helt överens om, och jag kan inte tänka mig annat än att vi bara misstolkar varandra vad gäller entropin i det färdiga fotot. Troligen p g a skillnader mellan informationsteoretiskt och termodynamiskt synsätt.

Jag resonerar på det här sätter utifrån simplaste termodynamik: När vi fokuserar på t ex en avlägsen stjärna så koncentrerar vi ljusenergin på ett litet begränsat område, i vilket entropin då lokalt sjunker. Resten av bilden är svart så där kan vi inte gärna dumpa den entropi vi sugit upp (och skapat) utan vi får som vanligt sprida ut avfallet i omgivningen. Ju skarpare objektiv vi använder desto mer koncentreras energin och desto lägre blir entropin.

Vad fasskillnadsdetekteringsautofokuseringsenheten anbelangar har jag alltid, utan närmare eftertanke, trott att den bara gör samma sak som vi gör när vi fokuserar med hjälp av en snittbild. Man lär sig ju snabbt åt vilket håll man ska vrida utifrån hur de övre och undre bilderna är sidoförskjutna och sedan ställer man in på bästa möjliga samstämmighet i ”snittet”. Enda skillnaden är att om det t ex finns flera trädgrenar på olika avstånd så vet vi ju själva vilken vi vill prioritera och struntar helt i de andra, kameran vet däremot inte detta utan använder en enkel algoritm för att beräkna ett genomsnitt.
 
ANNONS
Upp till 6000:- Cashback på Sony-prylar