Vidéo pédagogique

Notice

Sous-titrage

Sous-titre

Langue :

Français

Crédits

François Rechenmann (Intervention), Thierry Parmentelat (Intervention)

Conditions d'utilisation

Ces ressources de cours sont, sauf mention contraire, diffusées sous Licence Creative Commons. L’utilisateur doit mentionner le nom de l’auteur, il peut exploiter l’œuvre sauf dans un contexte commercial et il ne peut apporter de modifications à l’œuvre originale.

DOI : 10.60527/fq81-dz61

Citer cette ressource :

François Rechenmann, Thierry Parmentelat. Inria. (2015, 1 juin). 4.7. Coûts et alignement , in 4. Comparaison de séquences. [Vidéo]. Canal-U. https://doi.org/10.60527/fq81-dz61. (Consultée le 7 janvier 2026)

4.7. Coûts et alignement

Réalisation : 1 juin 2015 - Mise en ligne : 4 octobre 2016

document 1 document 2 document 3
niveau 1 niveau 2 niveau 3

Descriptif

Nous avons vu l'ébauche de notre algorithme d'alignement optimal en considérant la possibilité de calculer le coût optimal, ou score optimal, de ce dernier noeud. Et nous avons vu que le coût de ce dernier noeud, si les coûts de ces trois noeuds-là étaient connus comme étant optimaux, eh bien le coût optimal de ce noeud était la plus petite de ces trois valeurs-là. C'est-à-dire la plus petite des 3 valeurs des chemins de longueur 1, ou celui-ci, ou celui-là, ou celui-là. Il nous faut maintenant regarder d'un peu plus près ce que sont ces coûts qui figurent sur le dessin, les coûts d'insertion Bêta, et les coûts de substitution Alpha de N,M.
Pourquoi Alpha de N,M ? Eh bien parce que, Alpha de N,M, c'est le coût de substitution de la lettre qui est là par celle-ci. De la première séquence par la lettre de la deuxième séquence, à cette position-là de l'alignement.
Ce coût Alpha de N,M, c'est en fait un élément d'une matrice qui donne les coûts de substitution d'une base par une autre, dans le cas de l'ADN, ou d'un acide aminé par un autre, dans le cas d'alignement de séquences protéiques...

Intervention / Responsable scientifique

Rechenmann

François

Ingénieur. Auteur d'une thèse de docteur-ingénieur en sciences appliquées (Grenoble INPG, 1976). - HDR. Directeur de thèse à Grenoble INPG (1990-1994-) et à l'université de Grenoble 1. Directeur de recherche au centre Inria Grenoble – Rhône-Alpes (2002, 2015)

Parmentelat

Thierry

Ingénieur de recherche chez Inria. Exepert du langage de programmation Python (2015)

Thème

Disciplines :

Documentation

Liens

Support de présentation au format PDF

Dans la même collection

Vidéo pédagogique

00:03:29

Favoris
4.6. Si un chemin est optimal, tous ses chemins partiels sont optimaux

Rechenmann

François

Parmentelat

Thierry

Nous cherchons à concevoir un algorithme capable de déterminer l'alignement optimal de 2 séquences. Et nous avons vu que ça revient à chercher un algorithme qui recherche un chemin optimal dans une
Génomique
Algorithmes
Bioinformatique
Biologie application informatique
Biologie cellulaire et moléculaire
04.10.2016
document 1 document 2 document 3
niveau 1 niveau 2 niveau 3
Vidéo pédagogique

00:04:31

Favoris
4.1. Comment prédire les fonctions des gènes/protéines ?

Rechenmann

François

Parmentelat

Thierry

Après avoir regardé dans les yeux, les semaines précédentes, l'ADN, vu comment cet ADN par séquençage produisait des textes, des séquences génomiques, étudié la relation entre gènes et protéines,
Génomique
Algorithmes
Bioinformatique
Biologie application informatique
Biologie cellulaire et moléculaire
04.10.2016
document 1 document 2 document 3
niveau 1 niveau 2 niveau 3
Vidéo pédagogique

00:07:07

Favoris
4.10. Cet algorithme est-il efficace ?

Rechenmann

François

Parmentelat

Thierry

La version itérative de notre algorithme d'alignement optimal de séquences est indéniablement beaucoup plus efficace que sa version récursive, puisque nous avons vu qu'il permettait d'éviter que le
Génomique
Algorithmes
Bioinformatique
Biologie application informatique
Biologie cellulaire et moléculaire
04.10.2016
document 1 document 2 document 3
niveau 1 niveau 2 niveau 3
Vidéo pédagogique

00:04:09

Favoris
4.4. L’alignement de séquences devient un problème d’optimisation

Rechenmann

François

Parmentelat

Thierry

La distance de Hamming nous donne une première possibilité de mesurer la similarité entre 2 séquences. Mais elle ne reflète pas suffisamment la réalité biologique. Qu'est-ce que j'entends par là ? On
Génomique
Algorithmes
Bioinformatique
Biologie application informatique
Biologie cellulaire et moléculaire
04.10.2016
document 1 document 2 document 3
niveau 1 niveau 2 niveau 3
Vidéo pédagogique

00:06:17

Favoris
4.8. Un algorithme récursif

Rechenmann

François

Parmentelat

Thierry

Nous avons désormais en main tous les éléments pour écrire notre algorithme de détermination d'un alignement optimal, ici d'un chemin optimal. Avec les notations que nous avons introduites, je vous
Génomique
Algorithmes
Bioinformatique
Biologie application informatique
Biologie cellulaire et moléculaire
04.10.2016
document 1 document 2 document 3
niveau 1 niveau 2 niveau 3
Vidéo pédagogique

00:03:43

Favoris
4.2. Évolution et similarité de séquences

Rechenmann

François

Parmentelat

Thierry

Avant de chercher à quantifier ce qu'est la similarité de séquence, on peut se poser la question même de savoir pourquoi des séquences de génome sont similaires entre organismes. La réponse tient dans
Génomique
Algorithmes
Bioinformatique
Biologie application informatique
Biologie cellulaire et moléculaire
04.10.2016
document 1 document 2 document 3
niveau 1 niveau 2 niveau 3
Vidéo pédagogique

00:04:30

Favoris
4.5. Un alignement de séquences vu comme un chemin dans une grille

Rechenmann

François

Parmentelat

Thierry

Pour comparer deux séquences entre elles, il faut donc les aligner. Aligner ces deux séquences suppose faire des hypothèses d'insertion, délétion, aux bons endroits. Ça signifie, d'un point de vue
Génomique
Algorithmes
Bioinformatique
Biologie application informatique
Biologie cellulaire et moléculaire
04.10.2016
document 1 document 2 document 3
niveau 1 niveau 2 niveau 3
Vidéo pédagogique

00:04:52

Favoris
4.9. Éviter la récursivité : une version itérative

Rechenmann

François

Parmentelat

Thierry

La fonction récursive que nous avons obtenue est d'un code assez compact et plutôt élégant, mais effectivement peu efficace. Pourquoi ? Rappelons son fonctionnement. Cette fonction est d'abord appelée
Génomique
Algorithmes
Bioinformatique
Biologie application informatique
Biologie cellulaire et moléculaire
04.10.2016
document 1 document 2 document 3
niveau 1 niveau 2 niveau 3
Vidéo pédagogique

00:03:01

Favoris
4.3. Quantifier la similarité de deux séquences

Rechenmann

François

Parmentelat

Thierry

Le principe est donc de rechercher, dans les bases de données, des séquences similaires à celles que nous sommes en train d'étudier. Nous faisons aussi l'hypothèse que plus les séquences sont
Génomique
Algorithmes
Bioinformatique
Biologie application informatique
Biologie cellulaire et moléculaire
04.10.2016
document 1 document 2 document 3
niveau 1 niveau 2 niveau 3

Voir tout

Avec les mêmes intervenants et intervenantes

Vidéo pédagogique

00:04:52

Favoris
1.2. At the heart of the cell: the DNA macromolecule

Rechenmann

François

During the last session, we saw how at the heart of the cell there's DNA in the nucleus, sometimes of cells, or directly in the cytoplasm of the bacteria. The DNA is what we call a macromolecule, that
Biologie application informatique
DNA
Genome
Algorithm
Cell
09.05.2017
document 1 document 2 document 3
niveau 1 niveau 2 niveau 3
Vidéo pédagogique

00:07:29

Favoris
1.10. Overlapping sliding window

Rechenmann

François

We have made some drawings along a genomic sequence. And we have seen that although the algorithm is quite simple, even if some points of the algorithmare bit trickier than the others, we were able to
Biologie application informatique
DNA
Genome
Algorithm
Cell
09.05.2017
document 1 document 2 document 3
niveau 1 niveau 2 niveau 3
Vidéo pédagogique

00:05:53

Favoris
2.3. The genetic code

Rechenmann

François

Genes code for proteins. What is the correspondence betweenthe genes, DNA sequences, and the structure of proteins? The correspondence isthe genetic code. Proteins have indeedsequences of amino acids.
Biologie application informatique
DNA
Genome
Algorithm
Cell
09.05.2017
document 1 document 2 document 3
niveau 1 niveau 2 niveau 3
Vidéo pédagogique

00:05:58

Favoris
3.6. Boyer-Moore algorithm

Rechenmann

François

We have seen how we can make gene predictions more reliable through searching for all the patterns,all the occurrences of patterns. We have seen, for example, howif we locate the RBS, Ribosome
Biologie application informatique
DNA
Genome
Algorithm
Cell
09.05.2017
document 1 document 2 document 3
niveau 1 niveau 2 niveau 3
Vidéo pédagogique

00:03:50

Favoris
4.5. A sequence alignment as a path

Rechenmann

François

Comparing two sequences and thenmeasuring their similarities is an optimization problem. Why? Because we have seen thatwe have to take into account substitution and deletion. During the alignment, the
Biologie application informatique
DNA
Genome
Algorithm
Cell
09.05.2017
document 1 document 2 document 3
niveau 1 niveau 2 niveau 3
Vidéo pédagogique

00:07:39

Favoris
5.5. Differences are not always what they look like

Rechenmann

François

The algorithm we have presented works on an array of distance between sequences. These distances are evaluated on the basis of differences between the sequences. The problem is that behind the
Biologie application informatique
DNA
Genome
Algorithm
Cell
09.05.2017
document 1 document 2 document 3
niveau 1 niveau 2 niveau 3
Vidéo pédagogique

00:05:10

Favoris
1.5. Counting nucleotides

Rechenmann

François

In this session, don't panic. We will design our first algorithm. This algorithm is forcounting nucleotides. The idea here is that as an input,you have a sequence of nucleotides, of bases, of letters,
Biologie application informatique
DNA
Genome
Algorithm
Cell
09.05.2017
document 1 document 2 document 3
niveau 1 niveau 2 niveau 3
Vidéo pédagogique

00:06:09

Favoris
2.4. A translation algorithm

Rechenmann

François

We have seen that the genetic codeis a correspondence between the DNA or RNA sequences and aminoacid sequences that is proteins. Our aim here is to design atranslation algorithm, we make the
Biologie application informatique
DNA
Genome
Algorithm
Cell
09.05.2017
document 1 document 2 document 3
niveau 1 niveau 2 niveau 3
Vidéo pédagogique

00:05:41

Favoris
3.1. All genes end on a stop codon

Rechenmann

François

Last week we studied genes and proteins and so how genes, portions of DNA, are translated into proteins. We also saw the very fast evolutionof the sequencing technology which allows for producing
Biologie application informatique
DNA
Genome
Algorithm
Cell
09.05.2017
document 1 document 2 document 3
niveau 1 niveau 2 niveau 3
Vidéo pédagogique

00:05:35

Favoris
3.9. Benchmarking the prediction methods

Rechenmann

François

It is necessary to underline that gene predictors produce predictions. Predictions mean that you have no guarantees that the coding sequences, the coding regions,the genes you get when applying your
Biologie application informatique
DNA
Genome
Algorithm
Cell
09.05.2017
document 1 document 2 document 3
niveau 1 niveau 2 niveau 3
Vidéo pédagogique

00:04:29

Favoris
4.2. Why gene/protein sequences may be similar?

Rechenmann

François

Before measuring the similaritybetween the sequences, it's interesting to answer the question: why gene or protein sequences may be similar? It is indeed veryinteresting because the answer is related
Biologie application informatique
DNA
Genome
Algorithm
Cell
09.05.2017
document 1 document 2 document 3
niveau 1 niveau 2 niveau 3
Vidéo pédagogique

00:04:59

Favoris
5.4. The UPGMA algorithm

Rechenmann

François

We know how to fill an array with the values of the distances between sequences, pairs of sequences which are available in the file. This array of distances will be the input of our algorithm for
Biologie application informatique
DNA
Genome
Algorithm
Cell
09.05.2017
document 1 document 2 document 3
niveau 1 niveau 2 niveau 3