Canal-U

Mon compte

Résultats de recherche

Nombre de programmes trouvés : 267
Label UNT Vidéocours

le (5m44s)

3.6. L’algorithme de Boyer-Moore

Vous avez compris que la recherche de motifs, c'est-à-dire de sous-chaînes de caractères dans une chaîne plus importante, était un composant important de beaucoup d'algorithmes de bio-informatique. Les algorithmiciens ont toujours cette obsession de l'efficacité de leurs algorithmes. Pourquoi ? Parce qu'on travaille sur des textes qui sont assez longs, on en a vu des ordres de grandeur, et moins, on aura à faire de comparaison, plus rapide sera l'exécution de nos algorithmes. Donc, travailler sur l'efficacité des algorithmes de recherche de motifs est largement justifié. Regardons en effet, quelle est l'efficacité de l'algorithme qu'on appelle naïf ? Naïf au sens ...
Voir la vidéo
Label UNT Vidéocours

le (5m47s)

2.10. Comment trouver les gènes ?

L'obtention de la séquence complète d'un génome d'un organisme vivant est certes un beau résultat, mais c'est en fait le début d'une longue phase d'interprétation, d'annotations et de comparaisons. Par annotations, on entend quoi? On entend d'abord la prédiction des positions des gènes, où sont situés les gènes, où le gène commence-t-il, où se termine-t-il ? Une fois qu'on connaît cette position de début et de fin dans un gène bactérien, on est capable de prédire par traduction la protéine. De là, l'étape supplémentaire serait de dire quelle est la ou quelles sont les fonctions de la protéine codée par ...
Voir la vidéo
Label UNT Vidéocours

le (4m45s)

3.5. Comment améliorer la qualité des prédictions ?

Il faut toujours le répéter et le souligner, les algorithmes qui déterminent des gènes déterminent des gènes candidats. Ce sont des prédictions de gènes. Donc la question est de savoir s'il est éventuellement possible d'améliorer nos algorithmes de façon à améliorer la qualité de nos prédictions. Nous allons voir qu'il y a en restant dans la même logique de notre algorithme précédent, effectivement la possibilité d'améliorer la qualité, la prédiction de régions codantes sur un brin d'ADN. Pour ce faire, il nous faut introduire une notion de biologie moléculaire importante qui est le ribosome. De quoi s'agit-il ? Vous avez ici ...
Voir la vidéo
Label UNT Vidéocours

le (5m41s)

3.4. Prédiction de tous les gènes d’une séquence

En combinant de façon adéquate la recherche des triplés Stop et Start sur un brin d'ADN, nous avons obtenu un algorithme qui prédit les gènes sur ce brin, mais également sur une phase. C'est-à-dire en groupant les lettres en triplés d'une certaine manière. Nous avons vu qu'il existait 3 phases sur une séquence donnée. Nous allons donc dans un premier temps, avant de voir comment nous pouvons prédire tous les gènes d'un génome, modifier légèrement notre algorithme en le paramétrant au lieu de commencer systématiquement à la première position de la séquence nous commencerons sur la position iPhase et iPhase ...
Voir la vidéo
Label UNT Vidéocours

le (4m2s)

3.3. À la recherche des codons start et stop

Nous avons écrit la structure, l'ossature d'un algorithme de prédiction de gènes dans un génome bactérien, en utilisant les principes que nous avions énoncés précédemment. Cet algorithme est incomplet puisque pour l'instant, nous avons repoussé l'écriture des 2 fonctions nécessaires à la recherche des occurrences des triplets Stop et Start. C'est donc ce que nous allons faire maintenant. Comment faire pour rechercher l'occurrence d'un triplet ? En fait l'algorithme est très simple, très naïf, il consiste à comparer chaque lettre du triplet à chaque lettre de la séquence, et faire progresser, si aucune correspondance n'est trouvée, faire correspondre le motif ...
Voir la vidéo
Label UNT Vidéocours

le (4m21s)

3.2. Un algorithme simple de prédiction de gènes

Sur la base des principes énoncés précédemment, nous allons écrire un premier algorithme de prédiction de gènes sur un texte génomique procaryote. Je rappelle ces principes. L'idée est la suivante : de rechercher des triplets STOP consécutifs dans la même phase, consécutifs de telle façon qu'effectivement il n'y ait pas un stop qui vienne se mettre au milieu et qui casserait, en quelque sorte, la région codante qui doit être traduite dans son intégralité. Donc, recherche de deux triplets STOP consécutifs, suffisamment éloignés l'un de l'autre pour qu'il y ait de la place pour coder une protéine fonctionnelle. Ensuite, on recherche le ...
Voir la vidéo
Label UNT Vidéocours

le (4m2s)

3.9. Comment évaluer la qualité de prédiction des méthodes ?

Nous avons vu qu'il était possible, ou du moins nous le pensions, améliorer la qualité de prédiction des gènes sur un génome bactérien en introduisant des démarches supplémentaires, de recherches de sites de RBS par exemple, ou d'avoir recours à des approches probabilistes du type chaînes de Markov. A un moment donné, il faut se poser la question de savoir si, véritablement, ces algorithmes progressent, autrement dit, comment peut-on évaluer la qualité de prédiction d'un algorithme. Eh bien, une approche possible, c'est d'appliquer un prédicteur sur un génome bien connu, c'est-à-dire qui a été annoté et dont les annotations, les prédictions ...
Voir la vidéo
Label UNT Vidéocours

le (6m21s)

3.10. La prédiction de gènes dans les génomes eucaryotes

Si nous disposons actuellement de prédicteurs de gènes dans les génomes procaryotes de très bonne efficacité, avec des prédictions relativement fiables, c'est en fait loin d'être le cas sur les génomes eucaryotes. Pour quelles raisons ? La première raison, c'est qu'il existe dans les génomes eucaryotes de très longues régions intergéniques. Les régions intergéniques, ce sont des régions qui se situent entre 2 gènes. Dans un gène bactérien, si vous posez le doigt métaphoriquement parlant évidemment, sur un passage du génome, il y a une forte probabilité que vous soyez dans une région codante. Si vous faites la même chose ...
Voir la vidéo
Label UNT Vidéocours

le (4m32s)

4.1. Comment prédire les fonctions des gènes/protéines ?

Après avoir regardé dans les yeux, les semaines précédentes, l'ADN, vu comment cet ADN par séquençage produisait des textes, des séquences génomiques, étudié la relation entre gènes et protéines, gènes portant l'information qui est utilisée par la cellule pour produire une ou plusieurs protéines, et s'étant intéressés à la prédiction de gènes, c'est-à-dire à la prédiction de la localisation des gènes sur les séquences d'ADN. La question suivante à aborder est : comment prédire la fonction de ces gènes et de ces protéines ? Quels rôles dans la cellule jouent les protéines codées par les gènes ? En pratique, il ...
Voir la vidéo
Label UNT Vidéocours

le (4m31s)

4.5. Un alignement de séquences vu comme un chemin dans une grille

Pour comparer deux séquences entre elles, il faut donc les aligner. Aligner ces deux séquences suppose faire des hypothèses d'insertion, délétion, aux bons endroits. Ça signifie, d'un point de vue séquence de caractères, insérer des caractères "blank", le tiret, aux endroits appropriés. Approprié dans quel sens ? Au sens que la distance entre les deux séquences soit minimale. On appliquera le même processus pour toute perte de séquence, et systématiquement, on retiendra comme étant la mesure de similarité, la distance minimale entre cette paire de séquences. Comment déterminer ces endroits d'insertion, de délétion, comment émettre ces hypothèses d'insertion, délétion et ...
Voir la vidéo

 
FMSH
 
Facebook Twitter
Mon Compte