Vidéo pédagogique

Notice

Sous-titrage

Sous-titre

Langue :

Français

Crédits

François Rechenmann (Intervention), Thierry Parmentelat (Intervention)

Conditions d'utilisation

Ces ressources de cours sont, sauf mention contraire, diffusées sous Licence Creative Commons. L’utilisateur doit mentionner le nom de l’auteur, il peut exploiter l’œuvre sauf dans un contexte commercial et il ne peut apporter de modifications à l’œuvre originale.

DOI : 10.60527/343j-ew33

Citer cette ressource :

François Rechenmann, Thierry Parmentelat. Inria. (2015, 1 juin). 5.4. L’algorithme UPGMA , in 5. Arbres phylogénétiques. [Vidéo]. Canal-U. https://doi.org/10.60527/343j-ew33. (Consultée le 19 mai 2025)

5.4. L’algorithme UPGMA

Réalisation : 1 juin 2015 - Mise en ligne : 4 octobre 2016

document 1 document 2 document 3
niveau 1 niveau 2 niveau 3

Descriptif

L'algorithme, que nous allons étudier pour la reconstruction d'arbres phylogénétiques à partir des distances, s'appelle UPGMA. Un nom plutôt compliqué pour une méthode qui est plutôt simple. Et même, on le verra trop simple. UPGMA signifie Unweighted Pair Group Method with Arithmetic Mean. Nous allons voir au fur et à mesure, la signification dans l'exécution de l'algorithme de chacun de ces termes. Le point de départ de cet algorithme est donc un tableau de distances, tel que nous avons pu le remplir dans la session précédente. Voilà l'exemple que nous allons traiter. C'est un exemple simple. Nous avons sept espèces différentes et nous avons calculé les distances entre ces espèces à travers le calcul des distances, entre les séquences d'un gène homologue de ces espèces, à toutes ces espèces. Vous vous souvenez que le tableau que nous avons calculé était d'une part symétrique et que d'autre part, les valeurs sur la diagonale étaient sans surprise égales à 0. Ici nous avons choisi de ne conserver et de n'afficher que les valeurs significatives. Donc inutile de montrer les valeurs qui sont les symétriques des autres. Et inutile d'afficher les 0 sur les diagonales. Ce qui explique que notre tableau apparaît incomplet d'une certaine manière. La première étape de l'algorithme consiste à rechercher parmi toutes ces valeurs de distance dans le tableau la plus petite. Ici, c'est 2 et c'est la distance qui sépare l'espèce F de l'espèce C. Raccourci de langage, la distance qui sépare les séquences associées aux espèces F et C. C'est la distance la plus faible. Elle nous pousse donc à grouper ces 2 espèces dans un même sous-graphe en créant un noeud ancêtre ici. Ces 2 espèces sont proches, sont similaires parce qu'elles possèdent un ancêtre commun récent...

ERRATUM

Sur la slide 3 l’orateur parle de 7 espèces différentes, en fait il y en a 6.

Intervention

Rechenmann

François

Ingénieur. Auteur d'une thèse de docteur-ingénieur en sciences appliquées (Grenoble INPG, 1976). - HDR. Directeur de thèse à Grenoble INPG (1990-1994-) et à l'université de Grenoble 1. Directeur de recherche au centre Inria Grenoble – Rhône-Alpes (2002, 2015)

Parmentelat

Thierry

Ingénieur de recherche chez Inria. Exepert du langage de programmation Python (2015)

Thème

Disciplines :

Documentation

Liens

Support de présentation au format PDF

Dans la même collection

Vidéo pédagogique

00:07:15

Favoris
5.7. Les applications en microbiologie

Rechenmann

François

Parmentelat

Thierry

Une très grande diversité, on l'a vu, d'algorithmes en bio-informatique, motivé par la résolution de problèmes différents. Ces algorithmes, ces recherches en bio-informatique, s'appuient sur des
Génomique
Algorithmes
Bioinformatique
Biologie application informatique
Biologie cellulaire et moléculaire
04.10.2016
document 1 document 2 document 3
niveau 1 niveau 2 niveau 3
Vidéo pédagogique

00:05:03

Favoris
5.1. L’arbre des espèces

Rechenmann

François

Parmentelat

Thierry

Dans cette cinquième et dernière partie de notre cours sur le génome et les algorithmes, qui se veut une introduction à l'analyse informatique de l'information génétique, nous regarderons de plus près
Génomique
Algorithmes
Bioinformatique
Biologie application informatique
Biologie cellulaire et moléculaire
04.10.2016
document 1 document 2 document 3
niveau 1 niveau 2 niveau 3
Vidéo pédagogique

00:05:52

Favoris
5.5. Quand les différences sont trompeuses

Rechenmann

François

Parmentelat

Thierry

Il y a plusieurs raisons pour lesquelles la méthode UPGMA, que nous venons de voir, se révèle simpliste. L'une des raisons par exemple, c'est pourquoi quand on recalcule les distances, quand on a
Génomique
Algorithmes
Bioinformatique
Biologie application informatique
Biologie cellulaire et moléculaire
04.10.2016
document 1 document 2 document 3
niveau 1 niveau 2 niveau 3
Vidéo pédagogique

00:03:11

Favoris
5.2. L’arbre, objet abstrait

Rechenmann

François

Parmentelat

Thierry

Vous l'aurez compris un arbre phylogénétique est un arbre abstrait qui n'a qu'un lointain rapport métaphorique avec un véritable arbre. L'arbre des bio-informaticiens et des informaticiens se
Génomique
Algorithmes
Bioinformatique
Biologie application informatique
Biologie cellulaire et moléculaire
04.10.2016
document 1 document 2 document 3
niveau 1 niveau 2 niveau 3
Vidéo pédagogique

00:07:56

Favoris
5.6. La diversité des algorithmes informatiques

Rechenmann

François

Parmentelat

Thierry

Nous n'avons vu dans ce cours qu'un exemple extrêmement réduit d'algorithme bio informatique. Il existe en effet une très grande diversité de ces algorithmes bio informatiques qui sont motivés par l
Génomique
Algorithmes
Bioinformatique
Biologie application informatique
Biologie cellulaire et moléculaire
04.10.2016
document 1 document 2 document 3
niveau 1 niveau 2 niveau 3
Vidéo pédagogique

00:04:02

Favoris
5.3. Remplir un tableau de distances

Rechenmann

François

Parmentelat

Thierry

Pour tenter de construire l'arbre phylogénétique d'un ensemble d'espèces, nous allons utiliser les données et génotypique ou des données génotypiques disponibles sur ces espèces. Plus clairement, nous
Génomique
Algorithmes
Bioinformatique
Biologie application informatique
Biologie cellulaire et moléculaire
04.10.2016
document 1 document 2 document 3
niveau 1 niveau 2 niveau 3

Voir tout

Avec les mêmes intervenants et intervenantes

Vidéo pédagogique

00:06:24

Favoris
1.8. Compressing the DNA walk

Rechenmann

François

We have written the algorithm for the circle DNA walk. Just a precision here: the kind of drawing we get has nothing to do with the physical drawing of the DNA molecule. It is a symbolic
Biologie application informatique
DNA
Genome
Algorithm
Cell
09.05.2017
document 1 document 2 document 3
niveau 1 niveau 2 niveau 3
Vidéo pédagogique

00:06:57

Favoris
2.7. The algorithm design trade-off

Rechenmann

François

We saw how to increase the efficiencyof our algorithm through the introduction of a data structure. Now let's see if we can do even better. We had a table of index and weexplain how the use of these
Biologie application informatique
DNA
Genome
Algorithm
Cell
09.05.2017
document 1 document 2 document 3
niveau 1 niveau 2 niveau 3
Vidéo pédagogique

00:06:22

Favoris
3.4. Predicting all the genes in a sequence

Rechenmann

François

We have written an algorithm whichis able to locate potential genes on a sequence but only on one phase because we are looking triplets after triplets. Now remember that the genes maybe located on
Biologie application informatique
DNA
Genome
Algorithm
Cell
09.05.2017
document 1 document 2 document 3
niveau 1 niveau 2 niveau 3
Vidéo pédagogique

00:06:38

Favoris
4.7. Alignment costs

Rechenmann

François

We have seen how we can compute the cost of the path ending on the last node of our grid if we know the cost of the sub-path ending on the three adjacent nodes. It is time now to see more deeply why
Biologie application informatique
DNA
Genome
Algorithm
Cell
09.05.2017
document 1 document 2 document 3
niveau 1 niveau 2 niveau 3
Vidéo pédagogique

00:06:58

Favoris
4.9. Recursion can be avoided: an iterative version

Rechenmann

François

We have written a recursive function to compute the optimal path that is an optimal alignment between two sequences. Here all the examples I gave were onDNA sequences, four letter alphabet. OK. The
Biologie application informatique
DNA
Genome
Algorithm
Cell
09.05.2017
document 1 document 2 document 3
niveau 1 niveau 2 niveau 3
Vidéo pédagogique

00:07:21

Favoris
1.3. DNA codes for genetic information

Rechenmann

François

Remember at the heart of any cell,there is this very long molecule which is called a macromolecule for this reason, which is the DNA molecule. Now we will see that DNA molecules support what is called
Biologie application informatique
DNA
Genome
Algorithm
Cell
09.05.2017
document 1 document 2 document 3
niveau 1 niveau 2 niveau 3
Vidéo pédagogique

00:05:41

Favoris
2.1. The sequence as a model of DNA

Rechenmann

François

Welcome back to our course on genomes and algorithms that is a computer analysis ofgenetic information. Last week we introduced the very basic concept in biology that is cell, DNA, genome, genes
Biologie application informatique
DNA
Genome
Algorithm
Cell
09.05.2017
document 1 document 2 document 3
niveau 1 niveau 2 niveau 3
Vidéo pédagogique

00:04:54

Favoris
2.9. Whole genome sequencing

Rechenmann

François

Sequencing is anexponential technology. The progresses in this technologyallow now to a sequence whole genome, complete genome. What does it mean? Well let'stake two examples: some twenty years ago,
Biologie application informatique
DNA
Genome
Algorithm
Cell
09.05.2017
document 1 document 2 document 3
niveau 1 niveau 2 niveau 3
Vidéo pédagogique

00:07:06

Favoris
3.7. Index and suffix trees

Rechenmann

François

We have seen with the Boyer-Moore algorithm how we can increase the efficiency of spin searching through the pre-processing of the pattern to be searched. Now we will see that an alternative way of
Biologie application informatique
DNA
Genome
Algorithm
Cell
09.05.2017
document 1 document 2 document 3
niveau 1 niveau 2 niveau 3
Vidéo pédagogique

00:04:22

Favoris
4.4. Aligning sequences is an optimization problem

Rechenmann

François

We have seen a nice and a quitesimple solution for measuring the similarity between two sequences. It relied on the so-called hammingdistance that is counting the number of differencesbetween two
Biologie application informatique
DNA
Genome
Algorithm
Cell
09.05.2017
document 1 document 2 document 3
niveau 1 niveau 2 niveau 3
Vidéo pédagogique

00:04:45

Favoris
5.2. The tree, an abstract object

Rechenmann

François

When we speak of trees, of species,of phylogenetic trees, of course, it's a metaphoric view of a real tree. Our trees are abstract objects. Here is a tree and the different components of this tree.
Biologie application informatique
DNA
Genome
Algorithm
Cell
09.05.2017
document 1 document 2 document 3
niveau 1 niveau 2 niveau 3
Vidéo pédagogique

00:04:28

Favoris
1.6. GC and AT contents of DNA sequence

Rechenmann

François

We have designed our first algorithmfor counting nucleotides. Remember, what we have writtenin pseudo code is first declaration of variables. We have several integer variables that are variables which
Biologie application informatique
DNA
Genome
Algorithm
Cell
09.05.2017
document 1 document 2 document 3
niveau 1 niveau 2 niveau 3