Vidéo pédagogique

Notice

Sous-titrage

Sous-titre

Langue :

Français

Crédits

François Rechenmann (Intervention), Thierry Parmentelat (Intervention)

Conditions d'utilisation

Ces ressources de cours sont, sauf mention contraire, diffusées sous Licence Creative Commons. L’utilisateur doit mentionner le nom de l’auteur, il peut exploiter l’œuvre sauf dans un contexte commercial et il ne peut apporter de modifications à l’œuvre originale.

DOI : 10.60527/4re0-mz82

Citer cette ressource :

François Rechenmann, Thierry Parmentelat. Inria. (2015, 1 juin). 4.4. L’alignement de séquences devient un problème d’optimisation , in 4. Comparaison de séquences. [Vidéo]. Canal-U. https://doi.org/10.60527/4re0-mz82. (Consultée le 10 janvier 2026)

4.4. L’alignement de séquences devient un problème d’optimisation

Réalisation : 1 juin 2015 - Mise en ligne : 4 octobre 2016

document 1 document 2 document 3
niveau 1 niveau 2 niveau 3

Descriptif

La distance de Hamming nous donne une première possibilité de mesurer la similarité entre 2 séquences. Mais elle ne reflète pas suffisamment la réalité biologique. Qu'est-ce que j'entends par là ? On a parlé de mutations et nous avons vu qu'il y avait 3 types de mutation : les substitutions et les insertions délétions. Insertion dans une séquence, délétion dans l'autre et vice versa.
Il faut tenir compte de cette catégorie de mutation, c'est pourquoi il nous faut changer notre manière effectivement d'évaluer la différence et à l'inverse la similarité entre 2 séquences.

Prenons cet exemple de 2 séquences ici d'ADN. Si nous comptons les différences, nous en trouvons 10. Maintenant, on peut faire des hypothèses qui font que le nombre de différences va se retrouver considérablement réduit. On va faire l'hypothèse ici que ce G qui est là, dans cette deuxième séquence, résulte d'une insertion entre le T et le A qui est ici, insertion que je vais noter par ce caractère qu'on appelle caractère "blank", un tiret...

Intervention / Responsable scientifique

Rechenmann

François

Ingénieur. Auteur d'une thèse de docteur-ingénieur en sciences appliquées (Grenoble INPG, 1976). - HDR. Directeur de thèse à Grenoble INPG (1990-1994-) et à l'université de Grenoble 1. Directeur de recherche au centre Inria Grenoble – Rhône-Alpes (2002, 2015)

Parmentelat

Thierry

Ingénieur de recherche chez Inria. Exepert du langage de programmation Python (2015)

Thème

Disciplines :

Documentation

Liens

Support de présentation au format PDF

Dans la même collection

Vidéo pédagogique

00:04:39

Favoris
4.7. Coûts et alignement

Rechenmann

François

Parmentelat

Thierry

Nous avons vu l'ébauche de notre algorithme d'alignement optimal en considérant la possibilité de calculer le coût optimal, ou score optimal, de ce dernier noeud. Et nous avons vu que le coût de ce
Génomique
Algorithmes
Bioinformatique
Biologie application informatique
Biologie cellulaire et moléculaire
04.10.2016
document 1 document 2 document 3
niveau 1 niveau 2 niveau 3
Vidéo pédagogique

00:04:31

Favoris
4.1. Comment prédire les fonctions des gènes/protéines ?

Rechenmann

François

Parmentelat

Thierry

Après avoir regardé dans les yeux, les semaines précédentes, l'ADN, vu comment cet ADN par séquençage produisait des textes, des séquences génomiques, étudié la relation entre gènes et protéines,
Génomique
Algorithmes
Bioinformatique
Biologie application informatique
Biologie cellulaire et moléculaire
04.10.2016
document 1 document 2 document 3
niveau 1 niveau 2 niveau 3
Vidéo pédagogique

00:07:07

Favoris
4.10. Cet algorithme est-il efficace ?

Rechenmann

François

Parmentelat

Thierry

La version itérative de notre algorithme d'alignement optimal de séquences est indéniablement beaucoup plus efficace que sa version récursive, puisque nous avons vu qu'il permettait d'éviter que le
Génomique
Algorithmes
Bioinformatique
Biologie application informatique
Biologie cellulaire et moléculaire
04.10.2016
document 1 document 2 document 3
niveau 1 niveau 2 niveau 3
Vidéo pédagogique

00:04:30

Favoris
4.5. Un alignement de séquences vu comme un chemin dans une grille

Rechenmann

François

Parmentelat

Thierry

Pour comparer deux séquences entre elles, il faut donc les aligner. Aligner ces deux séquences suppose faire des hypothèses d'insertion, délétion, aux bons endroits. Ça signifie, d'un point de vue
Génomique
Algorithmes
Bioinformatique
Biologie application informatique
Biologie cellulaire et moléculaire
04.10.2016
document 1 document 2 document 3
niveau 1 niveau 2 niveau 3
Vidéo pédagogique

00:06:17

Favoris
4.8. Un algorithme récursif

Rechenmann

François

Parmentelat

Thierry

Nous avons désormais en main tous les éléments pour écrire notre algorithme de détermination d'un alignement optimal, ici d'un chemin optimal. Avec les notations que nous avons introduites, je vous
Génomique
Algorithmes
Bioinformatique
Biologie application informatique
Biologie cellulaire et moléculaire
04.10.2016
document 1 document 2 document 3
niveau 1 niveau 2 niveau 3
Vidéo pédagogique

00:03:43

Favoris
4.2. Évolution et similarité de séquences

Rechenmann

François

Parmentelat

Thierry

Avant de chercher à quantifier ce qu'est la similarité de séquence, on peut se poser la question même de savoir pourquoi des séquences de génome sont similaires entre organismes. La réponse tient dans
Génomique
Algorithmes
Bioinformatique
Biologie application informatique
Biologie cellulaire et moléculaire
04.10.2016
document 1 document 2 document 3
niveau 1 niveau 2 niveau 3
Vidéo pédagogique

00:03:29

Favoris
4.6. Si un chemin est optimal, tous ses chemins partiels sont optimaux

Rechenmann

François

Parmentelat

Thierry

Nous cherchons à concevoir un algorithme capable de déterminer l'alignement optimal de 2 séquences. Et nous avons vu que ça revient à chercher un algorithme qui recherche un chemin optimal dans une
Génomique
Algorithmes
Bioinformatique
Biologie application informatique
Biologie cellulaire et moléculaire
04.10.2016
document 1 document 2 document 3
niveau 1 niveau 2 niveau 3
Vidéo pédagogique

00:04:52

Favoris
4.9. Éviter la récursivité : une version itérative

Rechenmann

François

Parmentelat

Thierry

La fonction récursive que nous avons obtenue est d'un code assez compact et plutôt élégant, mais effectivement peu efficace. Pourquoi ? Rappelons son fonctionnement. Cette fonction est d'abord appelée
Génomique
Algorithmes
Bioinformatique
Biologie application informatique
Biologie cellulaire et moléculaire
04.10.2016
document 1 document 2 document 3
niveau 1 niveau 2 niveau 3
Vidéo pédagogique

00:03:01

Favoris
4.3. Quantifier la similarité de deux séquences

Rechenmann

François

Parmentelat

Thierry

Le principe est donc de rechercher, dans les bases de données, des séquences similaires à celles que nous sommes en train d'étudier. Nous faisons aussi l'hypothèse que plus les séquences sont
Génomique
Algorithmes
Bioinformatique
Biologie application informatique
Biologie cellulaire et moléculaire
04.10.2016
document 1 document 2 document 3
niveau 1 niveau 2 niveau 3

Voir tout

Avec les mêmes intervenants et intervenantes

Vidéo pédagogique

00:05:48

Favoris
1.4. What is an algorithm?

Rechenmann

François

We have seen that a genomic textcan be indeed a very long sequence of characters. And to interpret this sequence of characters, we will need to use computers. Using computers means writing program.
Biologie application informatique
DNA
Genome
Algorithm
Cell
09.05.2017
document 1 document 2 document 3
niveau 1 niveau 2 niveau 3
Vidéo pédagogique

00:04:58

Favoris
2.2. Genes: from Mendel to molecular biology

Rechenmann

François

The notion of gene emerged withthe works of Gregor Mendel. Mendel studied the inheritance on some traits like the shape of pea plant seeds,through generations. He stated the famous laws of inheritance
Biologie application informatique
DNA
Genome
Algorithm
Cell
09.05.2017
document 1 document 2 document 3
niveau 1 niveau 2 niveau 3
Vidéo pédagogique

00:05:37

Favoris
2.10. How to find genes?

Rechenmann

François

Getting the sequence of the genome is only the beginning, as I explained, once you have the sequence what you want to do is to locate the gene, to predict the function of the gene and maybe study the
Biologie application informatique
DNA
Genome
Algorithm
Cell
09.05.2017
document 1 document 2 document 3
niveau 1 niveau 2 niveau 3
Vidéo pédagogique

00:06:09

Favoris
3.8. Probabilistic methods

Rechenmann

François

Up to now, to predict our gene,we only rely on the process of searching certain strings or patterns. In order to further improve our gene predictor, the idea is to use, to rely onprobabilistic methods
Biologie application informatique
DNA
Genome
Algorithm
Cell
09.05.2017
document 1 document 2 document 3
niveau 1 niveau 2 niveau 3
Vidéo pédagogique

00:03:59

Favoris
4.3. Measuring sequence similarity

Rechenmann

François

So we understand why gene orprotein sequences may be similar. It's because they evolve togetherwith the species and they evolve in time, there aremodifications in the sequence and that the sequence
Biologie application informatique
DNA
Genome
Algorithm
Cell
09.05.2017
document 1 document 2 document 3
niveau 1 niveau 2 niveau 3
Vidéo pédagogique

00:04:49

Favoris
5.3. Building an array of distances

Rechenmann

François

So using the sequences of homologous gene between several species, our aim is to reconstruct phylogenetic tree of the corresponding species. For this, we have to comparesequences and compute distances
Biologie application informatique
DNA
Genome
Algorithm
Cell
09.05.2017
document 1 document 2 document 3
niveau 1 niveau 2 niveau 3
Vidéo pédagogique

00:06:06

Favoris
1.7. DNA walk

Rechenmann

François

We will now design a more graphical algorithm which is called "the DNA walk". We shall see what does it mean "DNA walk". Walk on to DNA. Something like that, yes. But first, just have a look again at
Biologie application informatique
DNA
Genome
Algorithm
Cell
09.05.2017
document 1 document 2 document 3
niveau 1 niveau 2 niveau 3
Vidéo pédagogique

00:05:47

Favoris
2.6. Algorithms + data structures = programs

Rechenmann

François

By writing the Lookup GeneticCode Function, we completed our translation algorithm. So we may ask the question about the algorithm, does it terminate? Andthe answer is yes, obviously. Is it pertinent,
Biologie application informatique
DNA
Genome
Algorithm
Cell
09.05.2017
document 1 document 2 document 3
niveau 1 niveau 2 niveau 3
Vidéo pédagogique

00:04:45

Favoris
3.3. Searching for start and stop codons

Rechenmann

François

We have written an algorithm for finding genes. But you remember that we arestill to write the two functions for finding the next stop codonand the next start codon. Let's see how we can do that. We
Biologie application informatique
DNA
Genome
Algorithm
Cell
09.05.2017
document 1 document 2 document 3
niveau 1 niveau 2 niveau 3
Vidéo pédagogique

00:04:54

Favoris
4.1. How to predict gene/protein functions?

Rechenmann

François

Last week we have seen that annotating a genome means first locating the genes on the DNA sequences that is the genes, the region coding for proteins. But this is indeed the first step,the next very
Biologie application informatique
DNA
Genome
Algorithm
Cell
09.05.2017
document 1 document 2 document 3
niveau 1 niveau 2 niveau 3
Vidéo pédagogique

00:09:26

Favoris
4.10. How efficient is this algorithm?

Rechenmann

François

We have seen the principle of an iterative algorithm in two paths for aligning and comparing two sequences of characters, here DNA sequences. And we understoodwhy the iterative version is much more
Biologie application informatique
DNA
Genome
Algorithm
Cell
09.05.2017
document 1 document 2 document 3
niveau 1 niveau 2 niveau 3
Vidéo pédagogique

00:07:25

Favoris
5.7. The application domains in microbiology

Rechenmann

François

Bioinformatics relies on many domains of mathematics and computer science. Of course, algorithms themselves on character strings are important in bioinformatics, we have seen them. Algorithms and
Biologie application informatique
DNA
Genome
Algorithm
Cell
09.05.2017
document 1 document 2 document 3
niveau 1 niveau 2 niveau 3