Vidéo pédagogique
Notice
Sous-titrage
Sous-titre
Langue :
Français
Crédits
François Rechenmann (Intervention), Thierry Parmentelat (Intervention)
Conditions d'utilisation
Ces ressources de cours sont, sauf mention contraire, diffusées sous Licence Creative Commons. L’utilisateur doit mentionner le nom de l’auteur, il peut exploiter l’œuvre sauf dans un contexte commercial et il ne peut apporter de modifications à l’œuvre originale.
DOI : 10.60527/k3k7-0e08
Citer cette ressource :
François Rechenmann, Thierry Parmentelat. Inria. (2015, 1 juin). 4.3. Quantifier la similarité de deux séquences , in 4. Comparaison de séquences. [Vidéo]. Canal-U. https://doi.org/10.60527/k3k7-0e08. (Consultée le 10 septembre 2024)

4.3. Quantifier la similarité de deux séquences

Réalisation : 1 juin 2015 - Mise en ligne : 4 octobre 2016
  • document 1 document 2 document 3
  • niveau 1 niveau 2 niveau 3
Descriptif

Le principe est donc de rechercher, dans les bases de données, des séquences similaires à celles que nous sommes en train d'étudier. Nous faisons aussi l'hypothèse que plus les séquences sont similaires, meilleure est la pertinence de l'information attachée à la séquence retrouvée dans la base de données. Nous allons donc chercher un moyen de quantifier le niveau de similarité entre 2 séquences. Le premier moyen très simple, c'est d'utiliser la distance dite de Hamming. De quoi s'agit-il ? Très simple, en effet. Prenez ces 2 séquences ici. Vous pouvez très rapidement à l'oeil voir qu'elles diffèrent par 2 substitutions, 2 différences, ça va être la distance de Hamming. De même, cette paire ici, 3 substitutions, distance de Hamming, 3. Est-ce une distance véritablement au sens mathématique du terme ? Je vous rappelle les 3 propriétés qu'une distance mathématique doit satisfaire : la distance d'une séquence à elle-même doit être nulle, ce qui est le cas, puisqu'il n'y a pas de différence entre les 2, pas de substitution ni quoi que ce soit, distance 0. La distance entre une séquence et une seconde séquence doit être la même qu'entre la seconde et la première. Bien entendu, le nombre de différences reste le même. Et la 3ème qui est dite l'inégalité qui doit être effectivement vérifiée elle aussi, ce que l'on peut faire assez facilement en prenant quelques exemples. C'est donc bien une distance au sens mathématique...

Intervention

Dans la même collection

Avec les mêmes intervenants et intervenantes

Sur le même thème