Structural Similarity

Structural SIMilarity ou SSIM est une mesure de similarité entre deux images numériques.

Description

Elle a été développée pour mesurer la qualité visuelle d'une image compressée, par rapport à l'image originale. L'idée de SSIM est de mesurer la similarité de structure entre les deux images, plutôt qu'une différence pixel à pixel comme le fait par exemple le PSNR. L'hypothèse sous-jacente est que l'œil humain est plus sensible aux changements dans la structure de l'image.

La métrique SSIM est calculée sur plusieurs fenêtres d'une image. La mesure entre deux fenêtres et de taille NxN est :

avec

  • la moyenne de  ;
  • la moyenne de  ;
  • la variance de  ;
  • la variance de  ;
  • la covariance de et  ;
  • , et trois variables destinées à stabiliser la division quand le dénominateur est très faible ;
  • la dynamique des valeurs des pixels, soit 255 pour des images codées sur 8 bits ;
  • = 0,01 et = 0,03 par défaut.

Pour l'évaluation de qualité d'une image, la formule précédente est appliquée sur la luminance uniquement. Typiquement, les grandeurs sont calculées sur des fenêtres de taille 8x8. La fenêtre courante peut se déplacer pixel par pixel sur l'ensemble de l’image. Cependant, les auteurs proposent de ne considérer qu'un sous-ensemble de ces fenêtres, par exemple en réduisant leur nombre d’un facteur deux dans les deux dimensions. Ceci permet de diminuer la complexité du calcul.

Structural dissimilarity (DSSIM) est une métrique dérivée de SSIM, elle est donnée par la formule suivante :

Discussions sur les performances

Des articles de recherche comme "A comprehensive assessment of the structural similarity index" par Richard Dosselmann et Xue Dong Yang montrent que SSIM est en réalité peu précis (beaucoup moins précis qu'annoncé) et que SSIM fournit des notes qui ne sont pas plus corrélées avec le jugement humain que l'erreur quadratique moyenne.

De plus, bien que SSIM prétende reproduire la perception visuelle humaine, sa formule montre qu'elle ne contient aucune modélisation élaborée du système visuel humain (SVH) et SSIM se base même sur des calculs non-perceptuels. Par exemple, le système visuel humain ne calcule pas de produit entre les valeurs moyennes des deux images.

Enfin, SSIM est conçu comme une mesure de qualité d'images fixes. SSIM ne contient aucun paramètre lié aux aspects temporels de la perception visuelle humaine et du jugement humain. Pourtant, certains[Qui ?] utilisent SSIM pour mesurer la qualité de vidéos.

Notes et références

    Voir aussi

    Sources

    • (en) Z. Wang, A. C. Bovik, H. R. Sheikh and E. P. Simoncelli, "Image quality assessment: From error visibility to structural similarity," IEEE Transactions on Image Processing, vol. 13, no. 4, pp. 600-612, .
    • (en) Loza et al., "Structural Similarity-Based Object Tracking in Video Sequences", Proceedings of the 9th International Conference on Information Fusion.
    • (en) Richard Dosselmann and Xue Dong Yang "A comprehensive assessment of the structural similarity index", https://link.springer.com/article/10.1007%2Fs11760-009-0144-1#page-1, DOI 10.1007/s11760-009-0144-1

    Article connexe

    Liens externes

    • Portail de l’imagerie numérique
    Cet article est issu de Wikipedia. Le texte est sous licence Creative Commons - Attribution - Partage dans les Mêmes. Des conditions supplémentaires peuvent s'appliquer aux fichiers multimédias.