Canal-U

Mon compte

Résultats de recherche

Nombre de programmes trouvés : 307
Label UNT Vidéocours

le (5m50s)

3.7. Index et arbre des suffixes

Il y a donc deux approches pour améliorer la performance des algorithmes de recherche d'un motif dans une chaîne de caractères. La première approche consiste à pré-traiter le motif. On a vu un exemple de cette approche avec l'algorithme de Boyer-Moore. La deuxième approche consiste à pré-traiter le texte dans lequel nous recherchons les motifs. Et nous allons voir deux exemples de mise en oeuvre de cette approche. La première consiste à construire un index de mots de longueur fixe. De quoi s'agit-il ? Considérons cette chaîne de caractères, relativement courte ici, de longueur 14. Nous allons construire un index de tous les ...
Voir la vidéo
Label UNT Vidéocours

le (5m51s)

2.5. Implementing the genetic code

Remember we were designing our translation algorithm and since we are a bit lazy, we decided to make the hypothesis that there was the adequate function forimplementing the genetic code. It's now time to see this lookupfunction but just before that come back on this condition herewhich is a bit more complex than the first attempt in writing the algorithm. Here you see the keyword OR, itmeans that this condition is true if this one is true or thisone is true or this one is true. Why do we need this morecomplex condition? Imagine our sequence and there washere the last triplet we translated. Now we increase our index ...
Voir la vidéo
Label UNT Vidéocours

le (5m53s)

5.5. Quand les différences sont trompeuses

Il y a plusieurs raisons pour lesquelles la méthode UPGMA, que nous venons de voir, se révèle simpliste. L'une des raisons par exemple, c'est pourquoi quand on recalcule les distances, quand on a groupé deux espèces et construit un nouveau noeud, pourquoi recalcule-t-on les distances sur la base d'une moyenne ? Difficile à justifier d'un point de vue biologique, mais la méthode est simple. Mais peut-être que la critique la plus forte provient du fait que nous nous appuyons sur des distances qui sont calculées sur les séquences, et nous allons voir que ce calcul-là tend à sous-estimer le nombre ...
Voir la vidéo
Label UNT Vidéocours

le (5m54s)

2.3. The genetic code

Genes code for proteins. What is the correspondence betweenthe genes, DNA sequences, and the structure of proteins? The correspondence isthe genetic code. Proteins have indeedsequences of amino acids. There are 20 amino acidsin the living world. They can be named by a single letter,3 letters or their full name. It means that a protein can berepresented by a sequence of letters in a 20 letter alphabet. Let's come back again on thiscorrespondence between gene and protein. Genes are regions of DNA. These regions are first transcribedinto RNA and then RNA into proteins. And proteins’ sequences of aminoacids fold into 3D structures. Like here, some helixes. Translation is the process whichgoes from RNA to ...
Voir la vidéo
Label UNT Vidéocours

le (5m58s)

1.3. L’ADN code l’information génétique

L'ADN, cette longue molécule, porte l'information génétique. Autrement dit, l'information qui est nécessaire à la cellule pour fonctionner et se reproduire. Regardons de plus près cette information génétique. Nous avons vu comment en lisant la séquence de nucléotides le long d'un brin de l'ADN, on pouvait obtenir en fait un texte écrit dans un alphabet de 4 lettres : A, C, G, T. L'opération physico-chimique qui permet de lire la molécule d'ADN s'appelle le séquençage. Cette opération est assez compliquée, nous y reviendrons dans une session ultérieure...
Voir la vidéo
Label UNT Vidéocours

le (5m59s)

3.6. Boyer-Moore algorithm

We have seen how we can make gene predictions more reliable through searching for all the patterns,all the occurrences of patterns. We have seen, for example, howif we locate the RBS, Ribosome Binding Site, upstream gene we can make the prediction of the coding sequence more reliable. So it is clear that pattern searching isa central topic in sequence analysis. So let's have a look at searching algorithms for strings or patterns and their performance. First,what we call the naive algorithm. What does it mean? The naive algorithm consists in comparing every letter of the pattern toevery letter of the text, so if N is the length of the ...
Voir la vidéo
Label UNT Vidéocours

le (6m7s)

1.7. DNA walk

We will now design a more graphical algorithm which is called "the DNA walk". We shall see what does it mean "DNA walk". Walk on to DNA. Something like that, yes. But first, just have a look again at the typical, also quite short sequence of DNA, a long text offour letters: A, C, G, T, T and so on. When the first sequence of DNA were obtained, the idea of using computers very quickly emerged but people didn't know exactly what to do with this sequence of characters. Again, there is a meaning behind the sequence because it is genetic information. It means it is the information ...
Voir la vidéo
Label UNT Vidéocours

le (6m10s)

2.4. A translation algorithm

We have seen that the genetic codeis a correspondence between the DNA or RNA sequences and aminoacid sequences that is proteins. Our aim here is to design atranslation algorithm, we make thehypothesis that the genetic codehas been implemented as an array as presented in the lastslide of the previous session. We have seen transcriptions and translationsfrom DNA to RNA and proteins. An important thing to notice hereis that most of the time computer scientists and bioinformaticiansjust forget about RNA. When they speak about translating,they say translating from DNA to proteins directly becausethe differences between the DNA and RNA is only T and U sowhat they do is this ...
Voir la vidéo
Label UNT Vidéocours

le (6m10s)

3.8. Probabilistic methods

Up to now, to predict our gene,we only rely on the process of searching certain strings or patterns. In order to further improve our gene predictor, the idea is to use, to rely onprobabilistic methods. What does it mean? I will firsttake an example, which is not related to genomic but I think it'sgood to understand the idea. Imagine you have a very long text which is known to be written in some human understandable language but you don't know which one but you know that some passages of this text only are written in a human understandable language,maybe English, maybe French and so on, whatever. You don't know. How ...
Voir la vidéo

 
FMSH
 
Facebook Twitter
Mon Compte