Wizja komputerowa przyczynia się do postępu w automatyzacji przemysłu, eksploracji kosmosu i rozwoju opieki zdrowotnej. Tymczasem wiele problemów nadal jest trudnych do zautomatyzowania. Zaszumione i rzadkie dane stanowią wyzwanie dla sztucznych sieci neuronowych, których zadaniem jest znajdywanie wiarygodnych i użytecznych sygnałów w danych na dużą skalę. Nasze laboratorium bada formalizmy uczenia sieci wielozadaniowości, samonadzoru i słabego nadzoru w celu poprawy autonomii maszyn i interfejsów człowiek-komputer w rzeczywistych warunkach.
Badamy wpływ estymacji ruchu i realizowania równoległych zadań wizyjnych na skuteczność algorytmów przetwarzania wideo. Opracowujemy autorskie architektury neuronowe, które równolegle realizują wiele zadań wizyjnych, takich jak usuwanie szumów, usuwanie rozmycia, stabilizacja i segmentacja wideo.
Nasze badania są mocno zakorzenione w aplikacjach. Opracowujemy systemy jedno- i wielokamerowe, które wykorzystują pasywne i aktywne widzenie, a także dodatkowe modalności. W szczególności jesteśmy zainteresowani umożliwieniem mikrokamerom, które pogarszają jakość wideo i obrazu, widzenia jak zwykłe kamery. Badamy również współpracę wielu kamer w celu uzyskania stabilnej wizji w systemach robotyki.