Canal-U

Mon compte

Résultats de recherche

Nombre de programmes trouvés : 16083
Label UNT Vidéocours

le (6m46s)

2.1. La séquence est-elle un bon modèle de l’ADN ?

L'ADN porte l'information génétique, plus précisément l'ADN porte les gènes, c'est-à-dire les régions de cette molécule qui portent l'information utilisée par la cellule pour synthétiser les protéines. Durant cette partie, nous allons nous intéresser plus particulièrement aux gènes et aux protéines et aux liens entre gènes et protéines, ce qu'on appelle la traduction. Mais dans un premier temps, je vous propose de revenir sur la question de la représentation de la molécule d'ADN par une simple chaîne de caractères. Parce que on l'a vu, l'ADN est d'abord un objet biologique chimique. C'est une longue molécule appelée souvent macro molécule, elle ...
Voir la vidéo
Label UNT Vidéocours

le (6m12s)

2.6. Algorithmes + structures de données = programmes

En écrivant le code de la fonction, qui recherche un triplet dans le tableau qui implémente le code génétique, nous avons terminé et obtenu un algorithme de traduction d'une séquence d'ADN, voire d'ARN, en protéines. Arrêtons-nous quelques instants pour évaluer la qualité de cet algorithme, et en particulier ses performances. Cet algorithme termine-t-il ? Oui. Est-il pertinent ? Oui, dans le sens qu'il effectue effectivement ce qu'on attend de lui, à savoir prendre une séquence dans un alphabet de 4 lettres, grouper chacune de ces lettres 3 par 3, rechercher pour chaque triplet dans le code génétique, plus exactement dans le ...
Voir la vidéo
Label UNT Vidéocours

le (4m8s)

2.9. Le séquençage de génomes complets

Les progrès dans les technologies de séquençage ont permis d'aborder le séquençage complet de génome. Là encore, les progrès ont été spectaculaires. Prenons l'exemple du projet de séquençage de la bactérie Bacillus subtilis. A l'époque, ce projet s'est étalé de 1989 à 1998. Il a impliqué 35 laboratoires et un financement européen d'importance. Aujourd'hui, séquencer ce même génome coûterait quelques centaines d'euros et se ferait probablement en moins d'une journée. Autre exemple spectaculaire et qui a été largement médiatisé, le séquençage du premier génome humain. De 1990 à 2003, il a coûté 2,7 milliards de dollars de l'époque, des dollars de ...
Voir la vidéo
Label UNT Vidéocours

le (7m53s)

2.3. Le code génétique

Gènes et protéines, mais qu'est-ce qu'une protéine ? Une protéine, c'est également une molécule qui est constituée d'une succession de ce que l'on appelle les acides aminés. C'est donc une chaîne d'acides aminés qui sont des motifs chimiques élémentaires. Il existe 20 acides aminés distincts. Chacun de ces acides aminés peut être désigné soit par son nom complet, soit par un nom à 3 lettres, soit par un nom simple à une seule lettre. Conséquence : une protéine peut, au niveau le plus primaire, être modélisée elle aussi par une chaîne de caractères. Mais cette chaîne de caractères est écrite ...
Voir la vidéo
Label UNT Vidéocours

le (6m59s)

2.4. Un algorithme de traduction

Une protéine, en tant que succession d'acides aminés, peut-être vue comme le résultat d'un processus de traduction d'une chaîne de caractères écrite dans un alphabet de 4 lettres en une autre chaîne de caractères écrite en un l'alphabet de 20 lettres. La correspondance entre ces 2 chaînes, la table qui permet de passer de l'une à l'autre, est le code génétique. Code génétique qu'on retrouve quasi identique chez tous les organismes vivants. Donc, si maintenant on regarde à nouveau ce processus de transcription et traduction au niveau vraiment de la chaîne de caractères en détails, que voit-on ? Voilà un gène. ...
Voir la vidéo
Label UNT Vidéocours

le (5m6s)

2.5. Implémenter le code génétique

Nous avons écrit le corps de l'algorithme de traduction, et nous avons fractionné la complexité d'écriture de cet algorithme en faisant appel à une fonction qui recherche dans le tableau, qui représente le code génétique, un triplet donné et renvoie l'acide aminé. Nous avons donc obtenu cette première version de l'algorithme et qui, encore une fois, est une version très partielle puisque il nous faut maintenant écrire cette fonction de recherche dans le tableau qui représente le code génétique. Regardons à nouveau ce tableau. Ici, il est écrit sous la forme d'un tableau ici à 2 colonnes et 64 lignes. ...
Voir la vidéo
Label UNT Vidéocours

le (4m28s)

2.7. Les compromis de la conception d’algorithmes

La mise en oeuvre d'une structure de données appropriée permet, nous l'avons vu, d'améliorer les performances d'algorithmes. Nous en avons vu l'exemple sur la recherche d'un triplet dans un tableau de code génétique, quand nous avons ajouté ces tables d'index, nous avons vu que nous avons diminué de façon tout à fait significative, le nombre de comparaisons à effectuer. Je vous propose maintenant une autre approche où les index ne sont pas sous forme de table mais sont calculés. Il faut que vous vous souveniez de la manière dont le tableau est organisé. D'abord tous les triplets qui commencent par ...
Voir la vidéo
Label UNT Vidéocours

le (6m51s)

2.8. Les technologies de séquençage de l’ADN

Nous parlons beaucoup dans ce cours de séquences génomiques ou séquences d'ADN, que nous voyons pour des raisons algorithmiques sous forme de chaînes de caractères. Comment ces séquences, ces chaînes de caractères, sont-elles obtenues ? D'une manière très imagée, il s'agit de lire la succession des nucléotides le long d'un brin d'ADN. Je dis imagé parce que cette lecture n'est pas une opération extrêmement simple. Le résultat de cette opération, qu'on appelle séquençage, c'est le texte dans cet alphabet de 4 lettres. Les appareils qui servent à mener cette opération de séquençage sont appelés séquenceurs. Les technologies de séquençage peuvent ...
Voir la vidéo
Label UNT Vidéocours

le (4m47s)

3.1. Tous les gènes se terminent sur un codon stop

Une fois la séquence d'un génome complet obtenue, débute la phase d'annotation. L'annotation elle-même consiste tout d'abord à rechercher la localisation, c'est-à-dire la position des gènes sur cette séquence. Cette semaine, nous allons nous intéresser à la prédiction des gènes, nous allons étudier un algorithme de prédiction de gènes sur des séquences génomiques procaryotes, nous allons essayer d'améliorer la qualité de ces prédictions en ayant recours à des additifs à notre algorithme, recherches de certains motifs supplémentaires, éventuellement recours à des techniques probabilistes. Nous allons chercher à voir comment on peut comparer la qualité des prédictions de différentes méthodes, et ...
Voir la vidéo
Label UNT Vidéocours

le (5m50s)

3.7. Index et arbre des suffixes

Il y a donc deux approches pour améliorer la performance des algorithmes de recherche d'un motif dans une chaîne de caractères. La première approche consiste à pré-traiter le motif. On a vu un exemple de cette approche avec l'algorithme de Boyer-Moore. La deuxième approche consiste à pré-traiter le texte dans lequel nous recherchons les motifs. Et nous allons voir deux exemples de mise en oeuvre de cette approche. La première consiste à construire un index de mots de longueur fixe. De quoi s'agit-il ? Considérons cette chaîne de caractères, relativement courte ici, de longueur 14. Nous allons construire un index de tous les ...
Voir la vidéo

 
FMSH
 
Facebook Twitter Google+
Mon Compte