Canal-U

Mon compte

Résultats de recherche

Nombre de programmes trouvés : 267
Label UNT Vidéocours

le (3m44s)

4.2. Évolution et similarité de séquences

Avant de chercher à quantifier ce qu'est la similarité de séquence, on peut se poser la question même de savoir pourquoi des séquences de génome sont similaires entre organismes. La réponse tient dans la théorie de l'évolution que l'on doit à Charles Darwin. Que dit Charles Darwin et que disent les biologistes évolutionnistes actuellement ? Ils disent que les espèces évoluent. Une espèce, par spéciation, donne naissance à 2 autres espèces qui évoluent et ainsi de suite. D'où cet arbre du vivant qu'esquissait déjà Darwin, grand penseur, dans ses carnets. En pratique, que cela signifie-t-il ? On peut figurer l'arbre ...
Voir la vidéo
Label UNT Vidéocours

le (3m51s)

4.5. A sequence alignment as a path

Comparing two sequences and thenmeasuring their similarities is an optimization problem. Why? Because we have seen thatwe have to take into account substitution and deletion. During the alignment, the comparison of the two sequences, we haveto insert blank characters at a certain position in order tohave an optimal score that is we want the sequence to be themore similar as possible. So the problem is to find whereto locate the blank character. There are many solutions and wewant to find the best one, it is an optimization problem. How do we deal with thisoptimization problem? We will consider an alignmentbetween two sequences as a path in that kind of grid. Here ...
Voir la vidéo
Label UNT Vidéocours

le (3m57s)

1.4. Qu’est-ce qu’un algorithme ?

Les génomes peuvent donc être vus comme une longue suite de lettres écrites dans l'alphabet : A, C, G et T. Comment interpréter ces textes ? Ça va être le sujet de la bio-informatique à l'aide d'algorithmes appropriés. Qu'entend-on par algorithme ? Un algorithme peut être vu comme une suite d'opérations à exécuter pour résoudre un problème ou, plus généralement, une classe de problèmes. Notre premier algorithme ici, va avoir comme objectif de compter les nucléotides d'une séquence génomique, autrement dit de compter les lettres composant une chaîne de caractères associée à une séquence génomique. Souvent, on utilise la métaphore ...
Voir la vidéo
Label UNT Vidéocours

le (4m0s)

4.3. Measuring sequence similarity

So we understand why gene orprotein sequences may be similar. It's because they evolve togetherwith the species and they evolve in time, there aremodifications in the sequence and that the sequence may still besimilar, similar enough again to retrieve information on onesequence to transfer it to another sequence of interest. So thequestion now is how can we measure this similarity between twosequences for the moment. The first approach to similarityis a very simple one is to apply a distance which is calledhere the Editing System or the Hamming Distance.The idea is very basic. You would take two sequences likethese two sequences here and you look at the differences and youcount ...
Voir la vidéo
Label UNT Vidéocours

le (4m2s)

3.3. À la recherche des codons start et stop

Nous avons écrit la structure, l'ossature d'un algorithme de prédiction de gènes dans un génome bactérien, en utilisant les principes que nous avions énoncés précédemment. Cet algorithme est incomplet puisque pour l'instant, nous avons repoussé l'écriture des 2 fonctions nécessaires à la recherche des occurrences des triplets Stop et Start. C'est donc ce que nous allons faire maintenant. Comment faire pour rechercher l'occurrence d'un triplet ? En fait l'algorithme est très simple, très naïf, il consiste à comparer chaque lettre du triplet à chaque lettre de la séquence, et faire progresser, si aucune correspondance n'est trouvée, faire correspondre le motif ...
Voir la vidéo
Label UNT Vidéocours

le (4m2s)

3.9. Comment évaluer la qualité de prédiction des méthodes ?

Nous avons vu qu'il était possible, ou du moins nous le pensions, améliorer la qualité de prédiction des gènes sur un génome bactérien en introduisant des démarches supplémentaires, de recherches de sites de RBS par exemple, ou d'avoir recours à des approches probabilistes du type chaînes de Markov. A un moment donné, il faut se poser la question de savoir si, véritablement, ces algorithmes progressent, autrement dit, comment peut-on évaluer la qualité de prédiction d'un algorithme. Eh bien, une approche possible, c'est d'appliquer un prédicteur sur un génome bien connu, c'est-à-dire qui a été annoté et dont les annotations, les prédictions ...
Voir la vidéo
Label UNT Vidéocours

le (4m3s)

5.3. Remplir un tableau de distances

Pour tenter de construire l'arbre phylogénétique d'un ensemble d'espèces, nous allons utiliser les données et génotypique ou des données génotypiques disponibles sur ces espèces. Plus clairement, nous allons utiliser des séquences d'un gène homologue de ces espèces. La première étape va consister à calculer une matrice ou tableau de ces distances. Matrice au tableau? Un point de vocabulaire qui mérite que l'on s'arrête quelques secondes pour l'expliciter. La notion de matrice, c'est une notion mathématique. La matrice est un objet mathématique ayant certaines propriétés; propriétés que l'on étudie et travaille dans le domaine de l'algèbre linéaire. La notion de tableaux ...
Voir la vidéo
Label UNT Vidéocours

le (4m8s)

2.9. Le séquençage de génomes complets

Les progrès dans les technologies de séquençage ont permis d'aborder le séquençage complet de génome. Là encore, les progrès ont été spectaculaires. Prenons l'exemple du projet de séquençage de la bactérie Bacillus subtilis. A l'époque, ce projet s'est étalé de 1989 à 1998. Il a impliqué 35 laboratoires et un financement européen d'importance. Aujourd'hui, séquencer ce même génome coûterait quelques centaines d'euros et se ferait probablement en moins d'une journée. Autre exemple spectaculaire et qui a été largement médiatisé, le séquençage du premier génome humain. De 1990 à 2003, il a coûté 2,7 milliards de dollars de l'époque, des dollars de ...
Voir la vidéo
Label UNT Vidéocours

le (4m10s)

4.4. L’alignement de séquences devient un problème d’optimisation

La distance de Hamming nous donne une première possibilité de mesurer la similarité entre 2 séquences. Mais elle ne reflète pas suffisamment la réalité biologique. Qu'est-ce que j'entends par là ? On a parlé de mutations et nous avons vu qu'il y avait 3 types de mutation : les substitutions et les insertions délétions. Insertion dans une séquence, délétion dans l'autre et vice versa. Il faut tenir compte de cette catégorie de mutation, c'est pourquoi il nous faut changer notre manière effectivement d'évaluer la différence et à l'inverse la similarité entre 2 séquences. Prenons cet exemple de 2 séquences ici ...
Voir la vidéo
Label UNT Vidéocours

le (4m12s)

4.6. A path is optimal if all its sub-paths are optimal

A sequence alignment between two sequences is a path in a grid. So that, an optimal sequence alignmentis an optimal path in the same grid. We'll see now that a property of this optimal path provides us with scanned lines for designing an optimization algorithm. The property is the following. A path which is optimal is made up of optimal sub-paths. To prove that, we can start byproving that if a path of length L is optimal then the path of length L minus one is also optimal. This can be proved quiteeasily ad arburdum. That is, you take the hypothesis that the path of length L is optimal ...
Voir la vidéo

 
FMSH
 
Facebook Twitter
Mon Compte