Canal-U

Mon compte

Résultats de recherche

Nombre de programmes trouvés : 1766
Label UNT Vidéocours

le (4m31s)

4.5. Un alignement de séquences vu comme un chemin dans une grille

Pour comparer deux séquences entre elles, il faut donc les aligner. Aligner ces deux séquences suppose faire des hypothèses d'insertion, délétion, aux bons endroits. Ça signifie, d'un point de vue séquence de caractères, insérer des caractères "blank", le tiret, aux endroits appropriés. Approprié dans quel sens ? Au sens que la distance entre les deux séquences soit minimale. On appliquera le même processus pour toute perte de séquence, et systématiquement, on retiendra comme étant la mesure de similarité, la distance minimale entre cette paire de séquences. Comment déterminer ces endroits d'insertion, de délétion, comment émettre ces hypothèses d'insertion, délétion et ...
Voir la vidéo
Label UNT Vidéocours

le (4m53s)

4.9. Éviter la récursivité : une version itérative

La fonction récursive que nous avons obtenue est d'un code assez compact et plutôt élégant, mais effectivement peu efficace. Pourquoi ? Rappelons son fonctionnement. Cette fonction est d'abord appelée pour calculer le coût de ce nœud-là. Nécessitant le coût optimal de ce nœud, celui-ci et celui-là, elle est ré appliquée, elle se ré appelle sur ces 3 nœuds-là. Si on prend l'appel de la fonction sur ce nœud-là, elle va se ré appeler de nouveau pour calculer le coût de ce nœud, de celui-ci et de celui-là. Conséquence : vous voyez que ce nœud-là a déjà été calculé 2 fois ...
Voir la vidéo
Label UNT Vidéocours

le (4m3s)

5.3. Remplir un tableau de distances

Pour tenter de construire l'arbre phylogénétique d'un ensemble d'espèces, nous allons utiliser les données et génotypique ou des données génotypiques disponibles sur ces espèces. Plus clairement, nous allons utiliser des séquences d'un gène homologue de ces espèces. La première étape va consister à calculer une matrice ou tableau de ces distances. Matrice au tableau? Un point de vocabulaire qui mérite que l'on s'arrête quelques secondes pour l'expliciter. La notion de matrice, c'est une notion mathématique. La matrice est un objet mathématique ayant certaines propriétés; propriétés que l'on étudie et travaille dans le domaine de l'algèbre linéaire. La notion de tableaux ...
Voir la vidéo
Label UNT Vidéocours

le (7m16s)

5.7. Les applications en microbiologie

Une très grande diversité, on l'a vu, d'algorithmes en bio-informatique, motivé par la résolution de problèmes différents. Ces algorithmes, ces recherches en bio-informatique, s'appuient sur des domaines des mathématiques et de l'informatique. De très nombreux domaines sont ainsi impliqués. Je n'en fait pas ici la liste exhaustive mais je vais citer, bien entendu, l'algorithmique en tant que tel sur les chaînes de caractères, nous l'avons vu, mais également sur les arbres, nous l'avons vu, sur les arbres phylogénétiques. Également sur les réseaux, ces réseaux de gènes ou réseaux métaboliques. Probabilité statistique. Nous avons nommé les chaînes de Markov, les modèles ...
Voir la vidéo
Label UNT Vidéocours

le (3m44s)

4.2. Évolution et similarité de séquences

Avant de chercher à quantifier ce qu'est la similarité de séquence, on peut se poser la question même de savoir pourquoi des séquences de génome sont similaires entre organismes. La réponse tient dans la théorie de l'évolution que l'on doit à Charles Darwin. Que dit Charles Darwin et que disent les biologistes évolutionnistes actuellement ? Ils disent que les espèces évoluent. Une espèce, par spéciation, donne naissance à 2 autres espèces qui évoluent et ainsi de suite. D'où cet arbre du vivant qu'esquissait déjà Darwin, grand penseur, dans ses carnets. En pratique, que cela signifie-t-il ? On peut figurer l'arbre ...
Voir la vidéo
Label UNT Vidéocours

le (3m30s)

4.6. Si un chemin est optimal, tous ses chemins partiels sont optimaux

Nous cherchons à concevoir un algorithme capable de déterminer l'alignement optimal de 2 séquences. Et nous avons vu que ça revient à chercher un algorithme qui recherche un chemin optimal dans une grille. Chemin optimal, c'est-à-dire de coût de score minimal. Pour bâtir cet algorithme, nous allons nous appuyer sur une propriété de ce chemin optimal qui est la suivante : si un chemin de longueur l est optimal, alors le chemin de longueur l-1 l'est aussi. Comment prouver cette propriété ? Très simplement en fait par l'absurde. C'est-à-dire qu'on va faire l'hypothèse contraire. C'est-à-dire que si le chemin de ...
Voir la vidéo
Label UNT Vidéocours

le (7m8s)

4.10. Cet algorithme est-il efficace ?

La version itérative de notre algorithme d'alignement optimal de séquences est indéniablement beaucoup plus efficace que sa version récursive, puisque nous avons vu qu'il permettait d'éviter que le coût d'un même nœud soit réévalué plusieurs fois.Mais qu'en est-il véritablement de l'efficacité de cet algorithme ? Eh bien encore une fois, pour mesurer les performances en temps d'un algorithme, les informaticiens ne font pas de chronométrage, ils calculent le nombre d'opérations qui doivent être effectuées pour que l'algorithme aboutisse à son résultat. Ici dans le cadre de cet algorithme de Needleman et Wunsch qu'ils ont proposé en 1970, on voit vite ...
Voir la vidéo
Label UNT Vidéocours

le (5m16s)

5.4. L’algorithme UPGMA

L'algorithme, que nous allons étudier pour la reconstruction d'arbres phylogénétiques à partir des distances, s'appelle UPGMA. Un nom plutôt compliqué pour une méthode qui est plutôt simple. Et même, on le verra trop simple. UPGMA signifie Unweighted Pair Group Method with Arithmetic Mean. Nous allons voir au fur et à mesure, la signification dans l'exécution de l'algorithme de chacun de ces termes. Le point de départ de cet algorithme est donc un tableau de distances, tel que nous avons pu le remplir dans la session précédente. Voilà l'exemple que nous allons traiter. C'est un exemple simple. Nous avons sept espèces ...
Voir la vidéo
Label UNT Vidéocours

le (3m2s)

4.3. Quantifier la similarité de deux séquences

Le principe est donc de rechercher, dans les bases de données, des séquences similaires à celles que nous sommes en train d'étudier. Nous faisons aussi l'hypothèse que plus les séquences sont similaires, meilleure est la pertinence de l'information attachée à la séquence retrouvée dans la base de données. Nous allons donc chercher un moyen de quantifier le niveau de similarité entre 2 séquences. Le premier moyen très simple, c'est d'utiliser la distance dite de Hamming. De quoi s'agit-il ? Très simple, en effet. Prenez ces 2 séquences ici. Vous pouvez très rapidement à l'oeil voir qu'elles diffèrent par 2 substitutions, ...
Voir la vidéo
Label UNT Vidéocours

le (4m40s)

4.7. Coûts et alignement

Nous avons vu l'ébauche de notre algorithme d'alignement optimal en considérant la possibilité de calculer le coût optimal, ou score optimal, de ce dernier noeud. Et nous avons vu que le coût de ce dernier noeud, si les coûts de ces trois noeuds-là étaient connus comme étant optimaux, eh bien le coût optimal de ce noeud était la plus petite de ces trois valeurs-là. C'est-à-dire la plus petite des 3 valeurs des chemins de longueur 1, ou celui-ci, ou celui-là, ou celui-là. Il nous faut maintenant regarder d'un peu plus près ce que sont ces coûts qui figurent sur le ...
Voir la vidéo

 
FMSH
 
Facebook Twitter Google+
Mon Compte