Vidéo pédagogique

4.3. Quantifier la similarité de deux séquences

Réalisation : 1 juin 2015 Mise en ligne : 1 juin 2015
  • document 1 document 2 document 3
  • niveau 1 niveau 2 niveau 3
  • audio 1 audio 2 audio 3
Descriptif

Le principe est donc de rechercher, dans les bases de données, des séquences similaires à celles que nous sommes en train d'étudier. Nous faisons aussi l'hypothèse que plus les séquences sont similaires, meilleure est la pertinence de l'information attachée à la séquence retrouvée dans la base de données. Nous allons donc chercher un moyen de quantifier le niveau de similarité entre 2 séquences. Le premier moyen très simple, c'est d'utiliser la distance dite de Hamming. De quoi s'agit-il ? Très simple, en effet. Prenez ces 2 séquences ici. Vous pouvez très rapidement à l'oeil voir qu'elles diffèrent par 2 substitutions, 2 différences, ça va être la distance de Hamming. De même, cette paire ici, 3 substitutions, distance de Hamming, 3. Est-ce une distance véritablement au sens mathématique du terme ? Je vous rappelle les 3 propriétés qu'une distance mathématique doit satisfaire : la distance d'une séquence à elle-même doit être nulle, ce qui est le cas, puisqu'il n'y a pas de différence entre les 2, pas de substitution ni quoi que ce soit, distance 0. La distance entre une séquence et une seconde séquence doit être la même qu'entre la seconde et la première. Bien entendu, le nombre de différences reste le même. Et la 3ème qui est dite l'inégalité qui doit être effectivement vérifiée elle aussi, ce que l'on peut faire assez facilement en prenant quelques exemples. C'est donc bien une distance au sens mathématique...

Intervenants
Thèmes
Notice
Sous-titrage
Sous-titre
Langue :
Français
Conditions d'utilisation
Ces ressources de cours sont, sauf mention contraire, diffusées sous Licence Creative Commons. L’utilisateur doit mentionner le nom de l’auteur, il peut exploiter l’œuvre sauf dans un contexte commercial et il ne peut apporter de modifications à l’œuvre originale.
Citer cette ressource:
Inria. (2015, 1 juin). 4.3. Quantifier la similarité de deux séquences. [Vidéo]. Canal-U. https://www.canal-u.tv/87363. (Consultée le 17 mai 2022)
Contacter
Documentation

Dans la même collection

Avec les mêmes intervenants

Sur le même thème