Règles de calcul pour une recomposition d’images par apprentissage
No Thumbnail Available
Date
2011
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Abstract
Les images panoramiques permettent notamment d'élargir le champ de vision restreint des systèmes de captures
d'images. L'obtention d'images panoramiques peut se résumer en deux groupes : les systèmes omnidirectionnels, qui
capturent directement une image panoramique, et les systèmes par mosaïque. Ce dernier cas consiste à déformer et
aligner les images d'une série, obtenues par exemple avec une caméra en rotation autour de son axe optique.
Lorsque celle-ci n'est pas connue, il faut retrouver la transformation géométrique qui relie les coordonnées de deux
images consécutives afin de pouvoir les aligner. L’objet d’étude de ce présent travail est la reconstruction d'une
mosaïque d’images, problème important du domaine de la vision par ordinateur.
Ici, Le champ expérimental concerne la recomposition d’images panoramiques pour des stations de ski. Les
algorithmes de recomposition connus de la littérature fonctionnent très bien dans les conditions météorologiques
idéales. Cependant, les outils basés sur ces algorithmes posent de réels problèmes pour une recomposition sans
défauts dans ce contexte d’utilisation. En effet, une mauvaise météo est source de défauts de recomposition .On
peut aussi évoquer le défaut connu sous le nom fantôme (ghost) causé par effets de mouvements des skieurs.
La résolution de ce problème peut être vue à travers une méthode qui sera ambitieuse et qui donne résultats
acceptables à certain degré.
Nous proposons une solution de recalage où on utilise une première méthode éparse pour s’approcher de la solution
puis une méthode dense pour affiner le résultat.
Dans un premier temps, l’utilisation d’un détecteur de points d’intérêts permet d’extraire d’une image les
coordonnées de points caractéristiques Le détecteur présenté ici est une version améliorée du détecteur de coins de
Harris, le détecteur de Harris-Laplace, qui est robuste aux rotations, aux variations de luminosité et aux
changements d’échelle.
Dans un deuxième temps, les points ainsi localisés sont décrits à l’aide de descripteurs de vecteurs de
caractéristiques qui permettent ensuite d’appareiller les points d’intérêts de plusieurs prises de vue distinctes d’une
même scène. Toutefois, cette correspondance n'est possible que lorsque le centre optique des deux images est
confondu. C'est-à-dire que lors de la prise de vue des deux images la caméra (ou l'appareil photo) n'a subit que des
rotations mais pas de translation. Pour rendre cela possible, il est nécessaire que les descripteurs vérifient un certain
nombre d’hypothèses alors on a choisit SIFT comme le descripteur de caractéristiques le plus connu grâce de sa
stabilité et sa précision hautement performant aux autres descripteurs. Après la mise en correspondance des
vecteurs de caractéristique. Nous obtenons la matrice de transformation en utilisant RANSAC "RANdom
SAmple Consensus". Il s'agit d'une méthode itérative pour estimer les paramètres d'un modèle mathématique à
partir d'un ensemble de données observées, la transformation entre les deux images est une homographie 2D qui ce
calcul à partir d'une matrice 3x3 avec 8 coefficients indépendants que vous pouvez estimer à partir d'au moins 4
points en correspondances (et en coordonnée homogène). Depuis la matrice de transformation est connu, les deux
images peuvent être simplement alignées ensemble. . L'image construite a un évident artefact. Le plus observer
directement est la différence d'intensité. Le gain de compensation est une voie fondamentale à éliminer différence
d'intensité.