Canal-U

Mon compte

Résultats de recherche

Nombre de programmes trouvés : 307
Label UNT Vidéocours

le (7m40s)

5.5. Differences are not always what they look like

The algorithm we have presented works on an array of distance between sequences. These distances are evaluated on the basis of differences between the sequences. The problem is that behind the differences we observed on the set of sequences, there may beother mutations which cannot be observed and we should modify the distances. We will have a look at some simple cases of these observed differences which may correspond to hidden differences and then we will see how the evaluation, computationof the number of differences may be affected. The simple case is this one, aunique substitution between, in the sequence One we have a Cand it turns out that in ...
Voir la vidéo
Label UNT Vidéocours

le (4m46s)

5.2. The tree, an abstract object

When we speak of trees, of species,of phylogenetic trees, of course, it's a metaphoric view of a real tree. Our trees are abstract objects. Here is a tree and the different components of this tree. Here is what we call an edge or a branch. We have nodes, a particular nodeis the root and other nodes are the leaves here terminal nodesand we see that when we draw a tree as an abstract object, we put the root upside and the leaves downside so it's the reverse of a classical natural tree. We need an expression to describe a tree and we will use this kind of expression, how ...
Voir la vidéo
Label UNT Vidéocours

le (4m50s)

5.3. Building an array of distances

So using the sequences of homologous gene between several species, our aim is to reconstruct phylogenetic tree of the corresponding species. For this, we have to comparesequences and compute distances between these sequences and we have seen last week how we were able to measure the similarity between sequences and we can use this similarity as a measureof distance between sequences. So we will compare pairs of sequences, measure the similarity and store the value of distance, of similarity into what we could call a matrix or an array. Before going further, let's makemore explicit the use of these two terms, they are not equivalentbut some people mix them. The ...
Voir la vidéo
Label UNT Vidéocours

le (5m0s)

5.4. The UPGMA algorithm

We know how to fill an array with the values of the distances between sequences, pairs of sequences which are available in the file. This array of distances will be the input of our algorithm for reconstructing phylogenetic trees. The name of this algorithm israther complicated but the method itself is rather simple,too simple indeed. We will see that. The name standsfor Unweighted Pair Group Method with Arithmetic Mean, wewill understand these terms along the presentationof the algorithm. The algorithm starts withan array of distances. Let's take this very simpleexample, it implies seven species and here we have the values of thedistances between these different sequences associated with a species. As you ...
Voir la vidéo
Label UNT Vidéocours

le (7m26s)

5.7. The application domains in microbiology

Bioinformatics relies on many domains of mathematics and computer science. Of course, algorithms themselves on character strings are important in bioinformatics, we have seen them. Algorithms and trees, for example,for reconstructing phylogenetic trees, algorithms on networks toreconstruct gene interaction networks, metabolic networks and maybe to simulate the dynamics of the time. We have seen also the implicationof probability and statistics. The implication of optimizationmethods, for example, for the computation of the optimalalignment of a pair of sequences. Constraint satisfaction is used forpredicting molecule structure. Automata and formal grammarswhich are some exotic parts of computer science are also usefulin bioinformatics, the same for signal processing. And soother domains may be listed here. We also ...
Voir la vidéo
Label UNT Vidéocours

le (6m46s)

2.1. La séquence est-elle un bon modèle de l’ADN ?

L'ADN porte l'information génétique, plus précisément l'ADN porte les gènes, c'est-à-dire les régions de cette molécule qui portent l'information utilisée par la cellule pour synthétiser les protéines. Durant cette partie, nous allons nous intéresser plus particulièrement aux gènes et aux protéines et aux liens entre gènes et protéines, ce qu'on appelle la traduction. Mais dans un premier temps, je vous propose de revenir sur la question de la représentation de la molécule d'ADN par une simple chaîne de caractères. Parce que on l'a vu, l'ADN est d'abord un objet biologique chimique. C'est une longue molécule appelée souvent macro molécule, elle ...
Voir la vidéo
Label UNT Vidéocours

le (6m12s)

2.6. Algorithmes + structures de données = programmes

En écrivant le code de la fonction, qui recherche un triplet dans le tableau qui implémente le code génétique, nous avons terminé et obtenu un algorithme de traduction d'une séquence d'ADN, voire d'ARN, en protéines. Arrêtons-nous quelques instants pour évaluer la qualité de cet algorithme, et en particulier ses performances. Cet algorithme termine-t-il ? Oui. Est-il pertinent ? Oui, dans le sens qu'il effectue effectivement ce qu'on attend de lui, à savoir prendre une séquence dans un alphabet de 4 lettres, grouper chacune de ces lettres 3 par 3, rechercher pour chaque triplet dans le code génétique, plus exactement dans le ...
Voir la vidéo
Label UNT Vidéocours

le (7m53s)

2.3. Le code génétique

Gènes et protéines, mais qu'est-ce qu'une protéine ? Une protéine, c'est également une molécule qui est constituée d'une succession de ce que l'on appelle les acides aminés. C'est donc une chaîne d'acides aminés qui sont des motifs chimiques élémentaires. Il existe 20 acides aminés distincts. Chacun de ces acides aminés peut être désigné soit par son nom complet, soit par un nom à 3 lettres, soit par un nom simple à une seule lettre. Conséquence : une protéine peut, au niveau le plus primaire, être modélisée elle aussi par une chaîne de caractères. Mais cette chaîne de caractères est écrite ...
Voir la vidéo
Label UNT Vidéocours

le (6m59s)

2.4. Un algorithme de traduction

Une protéine, en tant que succession d'acides aminés, peut-être vue comme le résultat d'un processus de traduction d'une chaîne de caractères écrite dans un alphabet de 4 lettres en une autre chaîne de caractères écrite en un l'alphabet de 20 lettres. La correspondance entre ces 2 chaînes, la table qui permet de passer de l'une à l'autre, est le code génétique. Code génétique qu'on retrouve quasi identique chez tous les organismes vivants. Donc, si maintenant on regarde à nouveau ce processus de transcription et traduction au niveau vraiment de la chaîne de caractères en détails, que voit-on ? Voilà un gène. ...
Voir la vidéo
Label UNT Vidéocours

le (5m6s)

2.5. Implémenter le code génétique

Nous avons écrit le corps de l'algorithme de traduction, et nous avons fractionné la complexité d'écriture de cet algorithme en faisant appel à une fonction qui recherche dans le tableau, qui représente le code génétique, un triplet donné et renvoie l'acide aminé. Nous avons donc obtenu cette première version de l'algorithme et qui, encore une fois, est une version très partielle puisque il nous faut maintenant écrire cette fonction de recherche dans le tableau qui représente le code génétique. Regardons à nouveau ce tableau. Ici, il est écrit sous la forme d'un tableau ici à 2 colonnes et 64 lignes. ...
Voir la vidéo

 
FMSH
 
Facebook Twitter
Mon Compte