DSpace

Digital.CSIC > Ciencia y Tecnologías Físicas > Centro de Física Miguel A. Catalán - Instituto de Óptica (CFMAC-IO) > (CFMAC-IO) Tesis >

Share

EndNote

Open Access item New contributions in overcomplete image representations inspired from the functional architecture of the visal cortex

Other Titles:Nuevas contribuciones en representaciones sobrecompletas de imágenes inspiradas por la arquitectura funcional de la corteza visual primaria
Authors:Fischer, Sylvain
Advisor:Cristóbal Pérez, Gabriel
Santos y Lléo, Andrés
Keywords:Overcomplete representations, Image processing
Issue Date:16-Mar-2007
Abstract:[ES] La presente tesis doctoral tiene como objetivo indagar en algunos paralelismos entre la arquitectura funcional de las áreas visuales primarias y el tratamiento de imágenes. Un primer objetivo consiste en mejorar los modelos existentes de visión biológica basándose en la teoría de la información. Un segundo es el desarrollo de nuevos algoritmos de tratamiento de imágenes inspirados de la visión natural. Los datos disponibles sobre el sistema visual abarcan estudios fisiológicos y psicofísicos, psicología Gestalt y estadísticas de las imágenes naturales. La tesis se centra principalmente en las representaciones sobrecompletas (i.e. representaciones que incrementan la dimensionalidad de los datos) por las siguientes razones. Primero porque permiten sobrepasar importantes desventajas de las transformaciones ortogonales; segundo porque los modelos de visión biológica necesitan a menudo ser sobrecompletos y tercero porque construir representaciones sobrecompletas eficientes involucra problemas matemáticos relevantes y novedosos, en particular el problema de las aproximaciones dispersas. La tesis propone primero una transformación en ondículas log-Gabor auto-inversible inspirada del campo receptivo y la organización en multiresolución de las células simples del cortex visual primario (V1). Esta transformación ofrece resultados prometedores para la eliminación del ruido. En segundo lugar, las interacciones observadas entre las células de V1 que consisten en la inhibición lateral y en la facilitación entre células alineadas se han mostrado eficientes para extraer los bordes de las imágenes naturales. En tercer lugar, la redundancia introducida por la transformación sobrecompleta se reduce gracias a un algoritmo dedicado de aproximación dispersa el cual construye una representación dispersa de las imágenes sobre la base de sus bordes. Para una decorrelación adicional y para conseguir más altas tasas de compresión, los bordes alineados a lo largo de contornos continuos están codificado de manera predictiva por cadenas de coeficientes, lo que ofrece una representacion eficiente de los contornos. Finalmente se presenta un estudio sobre el cierre de contornos utilizando la metodología de tensor voting. Proponemos el uso de iteraciones y de la información de curvatura para mejorar la robustez y la calidad perceptual de los métodos existentes.
[EN] The present thesis aims at investigating parallelisms between the functional architecture of primary visual areas and image processing methods. A first objective is to refine existing models of biological vision on the base of information theory statements and a second is to develop original solutions for image processing inspired from natural vision. The available data on visual systems contains physiological and psychophysical studies, Gestalt psychology and statistics on natural images The thesis is mostly centered in overcomplete representations (i.e. representations increasing the dimensionality of the data) for multiple reasons. First because they allow to overcome existing drawbacks of critically sampled transforms, second because biological vision models appear overcomplete and third because building efficient overcomplete representations raises challenging and actual mathematical problems, in particular the problem of sparse approximation. The thesis proposes first a self-invertible log-Gabor wavelet transformation inspired from the receptive field and multiresolution arrangement of the simple cells in the primary visual cortex (V1). This transform shows promising abilities for noise elimination. Second, interactions observed between V1 cells consisting in lateral inhibition and in facilitation between aligned cells are shown efficient for extracting edges of natural images. As a third point, the redundancy introduced by the overcompleteness is reduced by a dedicated sparse approximation algorithm which builds a sparse representation of the images based on their edge content. For an additional decorrelation of the image information and for improving the image compression performances, edges arranged along continuous contours are coded in a predictive manner through chains of coefficients. This offers then an efficient representation of contours. Fourth, a study on contour completion using the tensor voting framework based on Gestalt psychology is presented. There, the use of iterations and of the curvature information allow to improve the robustness and the perceptual quality of the existing method.
[FR] La présente thèse doctorale propose d’étudier en parallèle l’architecture fonctionnelle de aires visuelles primaires et les méthodes de traitement d’image. Un premier objectif consiste a améliorer les modèles de vision biologique sur la base de la théorie de l’information, et un second est le développement de solutions originales inspirées de la vision naturelle pour le traitement des images. Les données disponibles sur le système visuel recouvrent des études physiologiques et psychophysiques, la psychologie Gestalt et les statistiques des images naturelles. La thèse est centrée principalement sur les représentations surcomplètes (c’est-à-dire des représentations qui accroissent la dimensionalité des données) pour de multiples raisons. Premièrement parce que ces représentations permettent de résoudre les difficultés inhérentes aux transformations à échantillonnage critique. Deuxièmement parce que les modèles de vision biologique ont généralement besoin d’être surcomplets et troisièmement parce que construire des représentations surcomplètes efficaces pose des problèmes mathématiques actuels et importants, en particulier le problème de l’approximation parcimonieuse. La thèse propose premièrement une transformation en ondelettes log-Gabor autoinversible inspirée des champs récepteurs et de l’organisation en multirésolution des cellules simples du cortex visuel primaire (V1). Cette transformation possède des capacités prometteuses pour l’élimination du bruit. La deuxième partie de la thèse consiste à modéliser les non-linéaritées et les interactions entre les cellules de V1, en particulier les inhibitions latérales et les facilitations entre les cellules alignées. Cette modélisation se révèle efficace pour l’extraction des bords des images naturelles. Troisièmement, la redondance introduite par la transformation surcomplète est réduite grâce a un algorithme dédié qui construit une approximation parcimonieuse des images sur la base de leur contenu en bords. Pour un réduction additionnelle de la redondance et pour améliorer les performances de compression d’image, les bords organisés en contours continus sont codés de manière prédictible par des chaînes de coefficients. Cette codification offre ainsi un représentation efficace des contours. En quatrième point nous présentons une étude sur la fermeture des contours utilisant la méthodologie de vote par tenseurs elle-même basée sur la psychologie Gestalt. Nous proposons l’implémentation itérative et l’usage de l’information de courbature pour améliorer la robustesse et la qualité perceptuelle.
Description:Tesis doctoral de la Escuela Técnica Superior de Ingenieros de Telecomunicación de la Universidad Politécnica de Madrid (ETSIT-UPM) y del Instituto de Óptica "Daza de Valdés" del Consejo Superior de Investigaciones Científicas (IO-CSIC).-- 161 págs.
URI:http://hdl.handle.net/10261/7666
Appears in Collections:(CFMAC-IO) Tesis

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.