3. Prédiction des gènes
Descriptif
Au sommaire de cette troisième partie :
3.1. Tous les gènes se terminent sur un codon stop
3.2. Un algorithme simple de prédiction de gènes
3.3. À la recherche des codons start et stop
3.4. Prédiction de tous les gènes d'une séquence
3.5. Comment améliorer la qualité des prédictions ?
3.6. L'algorithme de Boyer-Moore
3.7. Index et arbre des suffixes
3.8. Des méthodes probabilistes à la rescousse
3.9. Comment évaluer la qualité de prédiction des méthodes ?
3.10. La prédiction de gènes dans les génomes eucaryotes
Vidéos
3.1. Tous les gènes se terminent sur un codon stop
Une fois la séquence d'un génome complet obtenue, débute la phase d'annotation. L'annotation elle-même consiste tout d'abord à rechercher la localisation, c'est-à-dire la position des gènes sur cette
3.2. Un algorithme simple de prédiction de gènes
Sur la base des principes énoncés précédemment, nous allons écrire un premier algorithme de prédiction de gènes sur un texte génomique procaryote. Je rappelle ces principes. L'idée est la suivante :
3.3. À la recherche des codons start et stop
Nous avons écrit la structure, l'ossature d'un algorithme de prédiction de gènes dans un génome bactérien, en utilisant les principes que nous avions énoncés précédemment. Cet algorithme est incomplet
3.4. Prédiction de tous les gènes d’une séquence
En combinant de façon adéquate la recherche des triplés Stop et Start sur un brin d'ADN, nous avons obtenu un algorithme qui prédit les gènes sur ce brin, mais également sur une phase. C'est-à-dire en
3.5. Comment améliorer la qualité des prédictions ?
Il faut toujours le répéter et le souligner, les algorithmes qui déterminent des gènes déterminent des gènes candidats. Ce sont des prédictions de gènes. Donc la question est de savoir s'il est
3.6. L’algorithme de Boyer-Moore
Vous avez compris que la recherche de motifs, c'est-à-dire de sous-chaînes de caractères dans une chaîne plus importante, était un composant important de beaucoup d'algorithmes de bio-informatique.
3.7. Index et arbre des suffixes
Il y a donc deux approches pour améliorer la performance des algorithmes de recherche d'un motif dans une chaîne de caractères. La première approche consiste à pré-traiter le motif. On a vu un exemple
3.8. Des méthodes probabilistes à la rescousse
Nous avons vu comment la qualité des prédictions de gènes dans un génome bactérien, pouvait être améliorée à travers la recherche d'occurrences de motifs particuliers liés au site de fixation du
3.9. Comment évaluer la qualité de prédiction des méthodes ?
Nous avons vu qu'il était possible, ou du moins nous le pensions, améliorer la qualité de prédiction des gènes sur un génome bactérien en introduisant des démarches supplémentaires, de recherches de
3.10. La prédiction de gènes dans les génomes eucaryotes
Si nous disposons actuellement de prédicteurs de gènes dans les génomes procaryotes de très bonne efficacité, avec des prédictions relativement fiables, c'est en fait loin d'être le cas sur les
Intervenants et intervenantes
Ingénieur. Auteur d'une thèse de docteur-ingénieur en sciences appliquées (Grenoble INPG, 1976). - HDR. Directeur de thèse à Grenoble INPG (1990-1994-) et à l'université de Grenoble 1. Directeur de recherche au centre Inria Grenoble – Rhône-Alpes (2002, 2015)
Ingénieur de recherche chez Inria. Exepert du langage de programmation Python (2015)