Image and Video Compression

Kursutvärdering 97/98

Bosse Lincoln

Till kursens hemsida

Kursansvarig:

Prof. Bernt Girod, gästprofessor 97-98, från Erlangen, Tyskland. Om kursen därför inte kommer ges i fortsättningen vet jag inte.

Kurslitteratur:

Utdelade föreläsningsanteckningar.

Kursinnehåll:

Principles of source coding for the efficient storage and transmission of still and moving images. Subband coding and transform coding. Discrete cosine transform. Predictive coding. Limits of human visual perception. Interframe coding. Motion-compensation and motion estimation. Emphasis on rate distortion analysis and optimization of image and video coding schemes. Standards: JPEG, MPEG-1, MPEG-2, MPEG-4, H.261, H.263.

Förkunskaper:

Fouriertransformer, signalteori, gärna lite kunskap om huffmankoding etc, men inget krav. Matlab används en massa i kursen, men det lär man sig snart om man inte är van.

Föreläsningar:

Vi var 93 studenter i klassen varav ungefär 15-20 kom på föreläsningarna. Övriga tittade på dem på TV. Föreläsningarna kändes långsamma, men vi hann konstigt nog ändå med ganska mycket. Girod gick nästan aldrig in på matematiken bakom de ekvationer han presenterade, något som jag tyckte var lite synd. Föreläsningsanteckningarna är å andra sidan guld värda som uppslagsverk för praktiska implementationer, då de innehåller state-of-the-art om detta är enkelt nog att beskriva..

Övrig undervisning:

TA:arna hade office hours då och då, vilka ibland var överfulla när det var något fel i uppgifterna. Mycket tid lades av projekt-TA:n för att diskutera projekt med studenter.

Inlämningsuppgifter:

3 st homeworks som tog c:a 6-20 timmar styck. Vissa, som hade mer problem med Matlab, lade larvigt mycket tid på dem. De var dock mycket lärorika och roliga. Rättningen var av typen: "Om det finns något uppenbart numeriskt fel så dra av 5%, annars full poäng - jag orkar ju inte läsa koden". Alla homeworksen gick ut på att komprimera bilder i MatLab, med till en början triviala metoder, för att sedan gå över till mer användbara såsom DCT-koefficient-kvantisering.

Midterm:

Nej.

Projekt:

Ett 40-timmarsprojekt i slutet på kursen, i grupper om 2-3 personer. Jag jobbade med en amerikan på ett projekt om uppsnabbning av blockmatchningen i H.263-moden Long Term Memory Prediction. Tyvärr fick vi inte all info från TA:n förrän två veckor innan deadline, så det blev lite stressigt.

Final:

Trivial final där vi fick ut H.263-standarddokumentet, och där vi sedan skulle leta reda på och tolka diverse information. Vi hade en vecka på oss, och det tog c:a 2 timmar att göra.

Övrigt:

Mycket trevlig och lärorik kurs -- roligaste jag läste under hösten. Sista veckan hade vi två föredrag från representanter från företag som sysslar med H.263 för videotelefoner resp. MPEG för TV-stationer. Det var kul att se vilka artifakter man kunde få ur profesionella system när man gjorde "rätt".