Prédiction de gènes

En bio-informatique, la prédiction de gènes consiste à identifier les zones de l'ADN qui correspondent à des gènes (le reste étant non codant).

Deux approches

Prédiction par similitude

Les méthodes par similitudes, aussi appelées méthodes par homologie ou méthodes extrinsèques, consistent à utiliser des informations extérieures au génome pour trouver les gènes. Plus précisément, ces méthodes consistent à comparer la séquence étudiée avec des séquences connues, rassemblées dans les bases de données. Par exemple les séquences associées à des marqueurs de séquence exprimée ou des ARN messagers sont utilisées[1].

Comme les séquences peuvent être proches mais rarement égales, on utilise en plus des algorithmes d’alignement de séquences, comme l'algorithme de Smith-Waterman ou l'heuristique BLAST[1].

Prédiction Ab Initio

Les prédictions Ab Initio, aussi appelées De Novo ou intrinsèques, sont des méthodes qui ne travaillent que sur la séquence elle-même. De façon générale il y a deux propriétés qui permettent de trouver un gène :

  • les signaux, qui sont des séquences particulières caractéristiques des gènes, par exemple les promoteurs et les codon-stop[2];
  • L'analyse de la composition statistique des séquences. La pression de sélection qui s'exerce sur les génomes induit la présence de biais de composition qui sont différents suivant la nature des séquences : exons, introns, régions intergéniques, hétérochromatine... On peut utiliser ces biais a posteriori pour prédire à quelle classe de séquence appartient une région donnée du génome. Ces analyses reposent sur la modélisation des séquences avec des modèles de Markov cachés et la recherche est basée sur l'algorithme de Viterbi.

Notes et références

  1. Catherine Mathé, Marie-France Sagot, Thomas Schiex et Pierre Rouzé, « Current methods of gene prediction, their strengths and weaknesses », Nucleic Acids Research, vol. 30, no 19, , p. 4103-4117 (lire en ligne)
  2. Hélène Touzet, « Présentation : Prédiction de gènes », sur Laboratoire d'informatique fondamentale de Lille

Liens externes

  • Portail de la biologie cellulaire et moléculaire
  • Portail de l'informatique théorique
Cet article est issu de Wikipedia. Le texte est sous licence Creative Commons - Attribution - Partage dans les Mêmes. Des conditions supplémentaires peuvent s'appliquer aux fichiers multimédias.