Canal-U

Mon compte

Résultats de recherche

Nombre de programmes trouvés : 267
Label UNT Vidéocours

le (4m45s)

3.5. Comment améliorer la qualité des prédictions ?

Il faut toujours le répéter et le souligner, les algorithmes qui déterminent des gènes déterminent des gènes candidats. Ce sont des prédictions de gènes. Donc la question est de savoir s'il est éventuellement possible d'améliorer nos algorithmes de façon à améliorer la qualité de nos prédictions. Nous allons voir qu'il y a en restant dans la même logique de notre algorithme précédent, effectivement la possibilité d'améliorer la qualité, la prédiction de régions codantes sur un brin d'ADN. Pour ce faire, il nous faut introduire une notion de biologie moléculaire importante qui est le ribosome. De quoi s'agit-il ? Vous avez ici ...
Voir la vidéo
Label UNT Vidéocours

le (4m46s)

3.3. Searching for start and stop codons

We have written an algorithm for finding genes. But you remember that we arestill to write the two functions for finding the next stop codonand the next start codon. Let's see how we can do that. We are looking for triplets. We use the term triplets as long as wehave no proof that they are codons. You can have triplets outside genes. Within genes, they are called codons. In general, we arelooking for triplets. If you have a sequence like thisone and you are looking for occurrences of this triplet, whatyou have to do is: position your triplet at the beginning of the sequence. Compare the first letter. If it is not ...
Voir la vidéo
Label UNT Vidéocours

le (4m46s)

3.5. Making the predictions more reliable

We have got a bacterial gene predictor but the way this predictor works is rather crude and if we want to have more reliable results, we have to inject into this algorithmmore biological knowledge. We will use a notion of RBS, RBS stands for Ribosome Binding Sites. What is it? OK. Let's have a look atthe cell machinery or part of it here. You certainly see here that wedeal with a eukaryotes cell. Why? It's because you have anucleus and you remember that the difference between prokaryoticcell and eukaryotic cell lies n the existence of a nucleus. Within the nucleus you have the DNA. The DNA is transcribed into ...
Voir la vidéo
Label UNT Vidéocours

le (4m46s)

5.2. The tree, an abstract object

When we speak of trees, of species,of phylogenetic trees, of course, it's a metaphoric view of a real tree. Our trees are abstract objects. Here is a tree and the different components of this tree. Here is what we call an edge or a branch. We have nodes, a particular nodeis the root and other nodes are the leaves here terminal nodesand we see that when we draw a tree as an abstract object, we put the root upside and the leaves downside so it's the reverse of a classical natural tree. We need an expression to describe a tree and we will use this kind of expression, how ...
Voir la vidéo
Label UNT Vidéocours

le (4m47s)

3.1. Tous les gènes se terminent sur un codon stop

Une fois la séquence d'un génome complet obtenue, débute la phase d'annotation. L'annotation elle-même consiste tout d'abord à rechercher la localisation, c'est-à-dire la position des gènes sur cette séquence. Cette semaine, nous allons nous intéresser à la prédiction des gènes, nous allons étudier un algorithme de prédiction de gènes sur des séquences génomiques procaryotes, nous allons essayer d'améliorer la qualité de ces prédictions en ayant recours à des additifs à notre algorithme, recherches de certains motifs supplémentaires, éventuellement recours à des techniques probabilistes. Nous allons chercher à voir comment on peut comparer la qualité des prédictions de différentes méthodes, et ...
Voir la vidéo
Label UNT Vidéocours

le (4m47s)

3.8. Des méthodes probabilistes à la rescousse

Nous avons vu comment la qualité des prédictions de gènes dans un génome bactérien, pouvait être améliorée à travers la recherche d'occurrences de motifs particuliers liés au site de fixation du ribosome, le fameux site RBS.Il n'en reste pas moins que ces prédictions de gènes, basée uniquement sur la recherche de motifs, sont insuffisantes pour produire des prédictions de qualité satisfaisante. Les bio informaticiens complètent donc cette approche-là par des approches probabilistes qui permettent de tester le caractère codant, ou non codant, de la région prédite. Voyons de plus près comment ces méthodes fonctionnent.Pour ce faire je vais prendre un ...
Voir la vidéo
Label UNT Vidéocours

le (4m50s)

5.3. Building an array of distances

So using the sequences of homologous gene between several species, our aim is to reconstruct phylogenetic tree of the corresponding species. For this, we have to comparesequences and compute distances between these sequences and we have seen last week how we were able to measure the similarity between sequences and we can use this similarity as a measureof distance between sequences. So we will compare pairs of sequences, measure the similarity and store the value of distance, of similarity into what we could call a matrix or an array. Before going further, let's makemore explicit the use of these two terms, they are not equivalentbut some people mix them. The ...
Voir la vidéo
Label UNT Vidéocours

le (4m53s)

1.2. At the heart of the cell: the DNA macromolecule

During the last session, we saw how at the heart of the cell there's DNA in the nucleus, sometimes of cells, or directly in the cytoplasm of the bacteria. The DNA is what we call a macromolecule, that is a very long molecule. It's Avery, in 1944, who discovered that the DNA was the support of genetic information. But the scientists who are most well-known for DNA are Francis Crick and James Watson who discovered together, with Maurice Wilkins and Rosalind Franklin, in 1953, the structure of DNA, the famous double helix, the two strands. Here are Crick and Watson explaining on a very crude wire model far away ...
Voir la vidéo
Label UNT Vidéocours

le (4m53s)

4.9. Éviter la récursivité : une version itérative

La fonction récursive que nous avons obtenue est d'un code assez compact et plutôt élégant, mais effectivement peu efficace. Pourquoi ? Rappelons son fonctionnement. Cette fonction est d'abord appelée pour calculer le coût de ce nœud-là. Nécessitant le coût optimal de ce nœud, celui-ci et celui-là, elle est ré appliquée, elle se ré appelle sur ces 3 nœuds-là. Si on prend l'appel de la fonction sur ce nœud-là, elle va se ré appeler de nouveau pour calculer le coût de ce nœud, de celui-ci et de celui-là. Conséquence : vous voyez que ce nœud-là a déjà été calculé 2 fois ...
Voir la vidéo
Label UNT Vidéocours

le (4m54s)

1.5. Compter les nucléotides

Notre premier algorithme vise assez simplement à compter les nucléotides d'une séquence génomique, autrement dit à compter les lettres dans une chaîne de caractères. En entrée, cette chaîne de caractères, encore une fois écrite dans cet alphabet de 4 lettres, et dont la fin est marquée par un caractère particulier qu'il s'agira de reconnaître. La description d'un algorithme débute par la déclaration de ce qu'on appelle des variables. Ici nous l'avons vu, nous avons plusieurs variables : le nombre de A, le nombre de C, le nombre de G et de T qu'il faudra calculer, le nombre total de lettres ...
Voir la vidéo

 
FMSH
 
Facebook Twitter
Mon Compte