Canal-U

Mon compte

Résultats de recherche

Nombre de programmes trouvés : 600
Label UNT Vidéocours

le (4m47s)

3.8. Des méthodes probabilistes à la rescousse

Nous avons vu comment la qualité des prédictions de gènes dans un génome bactérien, pouvait être améliorée à travers la recherche d'occurrences de motifs particuliers liés au site de fixation du ribosome, le fameux site RBS.Il n'en reste pas moins que ces prédictions de gènes, basée uniquement sur la recherche de motifs, sont insuffisantes pour produire des prédictions de qualité satisfaisante. Les bio informaticiens complètent donc cette approche-là par des approches probabilistes qui permettent de tester le caractère codant, ou non codant, de la région prédite. Voyons de plus près comment ces méthodes fonctionnent.Pour ce faire je vais prendre un ...
Voir la vidéo
Label UNT Vidéocours

le (5m47s)

2.10. Comment trouver les gènes ?

L'obtention de la séquence complète d'un génome d'un organisme vivant est certes un beau résultat, mais c'est en fait le début d'une longue phase d'interprétation, d'annotations et de comparaisons. Par annotations, on entend quoi? On entend d'abord la prédiction des positions des gènes, où sont situés les gènes, où le gène commence-t-il, où se termine-t-il ? Une fois qu'on connaît cette position de début et de fin dans un gène bactérien, on est capable de prédire par traduction la protéine. De là, l'étape supplémentaire serait de dire quelle est la ou quelles sont les fonctions de la protéine codée par ...
Voir la vidéo
Label UNT Vidéocours

le (6m21s)

3.10. La prédiction de gènes dans les génomes eucaryotes

Si nous disposons actuellement de prédicteurs de gènes dans les génomes procaryotes de très bonne efficacité, avec des prédictions relativement fiables, c'est en fait loin d'être le cas sur les génomes eucaryotes. Pour quelles raisons ? La première raison, c'est qu'il existe dans les génomes eucaryotes de très longues régions intergéniques. Les régions intergéniques, ce sont des régions qui se situent entre 2 gènes. Dans un gène bactérien, si vous posez le doigt métaphoriquement parlant évidemment, sur un passage du génome, il y a une forte probabilité que vous soyez dans une région codante. Si vous faites la même chose ...
Voir la vidéo
Label UNT Vidéocours

le (4m31s)

4.5. Un alignement de séquences vu comme un chemin dans une grille

Pour comparer deux séquences entre elles, il faut donc les aligner. Aligner ces deux séquences suppose faire des hypothèses d'insertion, délétion, aux bons endroits. Ça signifie, d'un point de vue séquence de caractères, insérer des caractères "blank", le tiret, aux endroits appropriés. Approprié dans quel sens ? Au sens que la distance entre les deux séquences soit minimale. On appliquera le même processus pour toute perte de séquence, et systématiquement, on retiendra comme étant la mesure de similarité, la distance minimale entre cette paire de séquences. Comment déterminer ces endroits d'insertion, de délétion, comment émettre ces hypothèses d'insertion, délétion et ...
Voir la vidéo
Label UNT Vidéocours

le (4m3s)

5.3. Remplir un tableau de distances

Pour tenter de construire l'arbre phylogénétique d'un ensemble d'espèces, nous allons utiliser les données et génotypique ou des données génotypiques disponibles sur ces espèces. Plus clairement, nous allons utiliser des séquences d'un gène homologue de ces espèces. La première étape va consister à calculer une matrice ou tableau de ces distances. Matrice au tableau? Un point de vocabulaire qui mérite que l'on s'arrête quelques secondes pour l'expliciter. La notion de matrice, c'est une notion mathématique. La matrice est un objet mathématique ayant certaines propriétés; propriétés que l'on étudie et travaille dans le domaine de l'algèbre linéaire. La notion de tableaux ...
Voir la vidéo
Label UNT Vidéocours

le (3m44s)

4.2. Évolution et similarité de séquences

Avant de chercher à quantifier ce qu'est la similarité de séquence, on peut se poser la question même de savoir pourquoi des séquences de génome sont similaires entre organismes. La réponse tient dans la théorie de l'évolution que l'on doit à Charles Darwin. Que dit Charles Darwin et que disent les biologistes évolutionnistes actuellement ? Ils disent que les espèces évoluent. Une espèce, par spéciation, donne naissance à 2 autres espèces qui évoluent et ainsi de suite. D'où cet arbre du vivant qu'esquissait déjà Darwin, grand penseur, dans ses carnets. En pratique, que cela signifie-t-il ? On peut figurer l'arbre ...
Voir la vidéo
Label UNT Vidéocours

le (3m2s)

4.3. Quantifier la similarité de deux séquences

Le principe est donc de rechercher, dans les bases de données, des séquences similaires à celles que nous sommes en train d'étudier. Nous faisons aussi l'hypothèse que plus les séquences sont similaires, meilleure est la pertinence de l'information attachée à la séquence retrouvée dans la base de données. Nous allons donc chercher un moyen de quantifier le niveau de similarité entre 2 séquences. Le premier moyen très simple, c'est d'utiliser la distance dite de Hamming. De quoi s'agit-il ? Très simple, en effet. Prenez ces 2 séquences ici. Vous pouvez très rapidement à l'oeil voir qu'elles diffèrent par 2 substitutions, ...
Voir la vidéo
Label UNT Vidéocours

le (5m53s)

5.5. Quand les différences sont trompeuses

Il y a plusieurs raisons pour lesquelles la méthode UPGMA, que nous venons de voir, se révèle simpliste. L'une des raisons par exemple, c'est pourquoi quand on recalcule les distances, quand on a groupé deux espèces et construit un nouveau noeud, pourquoi recalcule-t-on les distances sur la base d'une moyenne ? Difficile à justifier d'un point de vue biologique, mais la méthode est simple. Mais peut-être que la critique la plus forte provient du fait que nous nous appuyons sur des distances qui sont calculées sur les séquences, et nous allons voir que ce calcul-là tend à sous-estimer le nombre ...
Voir la vidéo
Label UNT Vidéocours

le (4m10s)

4.4. L’alignement de séquences devient un problème d’optimisation

La distance de Hamming nous donne une première possibilité de mesurer la similarité entre 2 séquences. Mais elle ne reflète pas suffisamment la réalité biologique. Qu'est-ce que j'entends par là ? On a parlé de mutations et nous avons vu qu'il y avait 3 types de mutation : les substitutions et les insertions délétions. Insertion dans une séquence, délétion dans l'autre et vice versa. Il faut tenir compte de cette catégorie de mutation, c'est pourquoi il nous faut changer notre manière effectivement d'évaluer la différence et à l'inverse la similarité entre 2 séquences. Prenons cet exemple de 2 séquences ici ...
Voir la vidéo
Label UNT Vidéocours

le (3m12s)

5.2. L’arbre, objet abstrait

Vous l'aurez compris un arbre phylogénétique est un arbre abstrait qui n'a qu'un lointain rapport métaphorique avec un véritable arbre. L'arbre des bio-informaticiens et des informaticiens se dessinent du reste dans l'autre sens. C'est-à-dire que si on retrouve bien effectivement des branches qui connectent des noeuds, on a un noeud qui est la racine et qui est situé tout en haut et on situe en bas généralement par convention, les feuilles qu'on appelle également noeuds terminaux. Pour décrire un arbre, on peut utiliser une expression parenthésée, dont la logique s'impose assez rapidement. Voilà ici l'expression parenthésée correspondant à cette structure ...
Voir la vidéo

 
FMSH
 
Facebook Twitter
Mon Compte