Bioinformatique : algorithmes et génomes

Description

Dans ce cours, nous verrons comment l’informatique permet d’interpréter le texte des génomes.
Doté d’algorithmes adaptés, mis en œuvre sous forme de programmes
efficaces, l’ordinateur produit des prédictions quant à la localisation
des milliers de gènes d’un organisme vivant et les fonctions que
remplissent les protéines qu’ils codent.

Vous n’êtes pas biologiste ? Ce cours vous apportera les
connaissances nécessaires à la compréhension des entités et phénomènes
biologiques impliqués : cellule, chromosome, ADN, génome, gènes,
transcription, traduction, code génétique, protéines, tous ces termes et
d’autres encore vous seront expliqués dans ce contexte de
l’interprétation des génomes par des moyens informatiques.

Vous n’êtes pas informaticien ? Ce cours se veut
simultanément une introduction à l’algorithmique sur des séquences de
caractères. Recherche de motifs, similarité de séquences, chaînes de
Markov, reconstruction d’arbres phylogénétiques. Les algorithmes de base
impliqués dans ces démarches seront présentés.

Vous n’êtes ni biologiste, ni informaticien ? Ce cours est
une opportunité pour aborder conjointement la génomique et
l’algorithmique, ou si vous préférez, l’algorithmique et la génomique…

Pré-requis 

Une culture scientifique de niveau bac scientifique facilitera la compréhension des notions abordées.

Organisation du cours

Ce cours est organisé en 5 parties. Chaque partie est composée de 10 séquences vidéos d'environ 6 minutes.

Plan du cours :

Partie 1 ADN et séquences génomiquesPartie 2 Gènes et protéinesPartie 3 Prédiction des gènesPartie 4 Comparaison de séquencesPartie 5 Arbres phylogénétiques

Les
différents supports de ce cours sont constitutifs d'un MOOC en 5
semaines hébergé sur la plate-forme France Université Numérique : https://www.fun-mooc.fr/courses/inria/41003S02/session02/about

 

Vidéo pédagogique

5.1. L’arbre des espèces
collection
7 vidéos

5. Arbres phylogénétiques

  • RECHENMANN François
  • PARMENTELAT Thierry
Au sommaire de cette cinquième et dernière partie : 5.1. L'arbre des espèces 5.2. L'arbre, objet abstrait 5.3. Remplir un tableau de distances 5.4. L'algorithme UPGMA 5.5. Quand les différences sont trompeuses 5.6. La diversité des algorithmes informatiques 5.7. Les applications en microbiologie
01.06.2015
  • niveau 1 niveau 2 niveau 3
  • document 1 document 2 document 3
4.1. Comment prédire les fonctions des gènes/protéines ?
collection
10 vidéos

4. Comparaison de séquences

  • RECHENMANN François
  • PARMENTELAT Thierry
Au sommaire de cette quatrième partie :   4.1. Comment prédire les fonctions des gènes/protéines ?   4.2. Évolution et similarité de séquences   4.3. Quantifier la similarité de deux séquences   4.4. L'alignement de séquences devient un problème d'optimisation   4.5. Un alignement de séquences vu comme un chemin dans une grille   4.6. Si un chemin est optimal, tous ses chemins partiels sont optimaux   4.7. Coûts et alignement   4.8. Un algorithme récursif   4.9. Eviter la récursivité : une version itérative   4.10. Cet algorithme est-il efficace ?
01.06.2015
  • niveau 1 niveau 2 niveau 3
  • document 1 document 2 document 3
3.1. Tous les gènes se terminent sur un codon stop
collection
10 vidéos

3. Prédiction des gènes

  • RECHENMANN François
  • PARMENTELAT Thierry
Au sommaire de cette troisième partie : 3.1. Tous les gènes se terminent sur un codon stop 3.2. Un algorithme simple de prédiction de gènes 3.3. À la recherche des codons start et stop 3.4. Prédiction de tous les gènes d'une séquence 3.5. Comment améliorer la qualité des prédictions ? 3.6. L'algorithme de Boyer-Moore 3.7. Index et arbre des suffixes   3.8. Des méthodes probabilistes à la rescousse 3.9. Comment évaluer la qualité de prédiction des méthodes ? 3.10. La prédiction de gènes dans les génomes eucaryotes
01.06.2015
  • niveau 1 niveau 2 niveau 3
  • document 1 document 2 document 3
2.1. La séquence est-elle un bon modèle de l’ADN ?
collection
10 vidéos

2. Gènes et protéines

  • RECHENMANN François
  • PARMENTELAT Thierry
Au sommaire de cette deuxième partie :   2.1. La séquence est-elle un bon modèle de l'ADN ?   2.2. Les gènes, de Mendel à la biologie moléculaire + Python   2.3. Le code génétique   2.4. Un algorithme de traduction   2.5. Implémenter le code génétique   2.6. Algorithmes + structures de données = programmes   2.7. Les compromis de la conception d'algorithmes   2.8. Les technologies de séquençage de l'ADN + Python   2.9. Le séquençage de génomes complets   2.10. Comment trouver les gènes ?
01.06.2015
  • niveau 1 niveau 2 niveau 3
  • document 1 document 2 document 3
1.10. Des fenêtres glissantes et recouvrantes
collection
10 vidéos

1. ADN et séquences génomiques

  • RECHENMANN François
  • PARMENTELAT Thierry
Au sommaire de cette première partie :   1.1. La cellule, atome du vivant   1.2. Au cœur de la cellule, la molécule d'ADN   1.3. L'ADN code l'information génétique   1.4. Qu'est-ce qu'un algorithme ?   1.5. Compter les nucléotides   1.6. Contenu en G-C et A-T des séquences   1.7. Promenade sur l'ADN   1.8. Changer l'échelle du chemin   1.9. Prédire l'origine de réplication ?   1.10. Des fenêtres glissantes et recouvrantes
01.06.2015
  • niveau 1 niveau 2 niveau 3
  • document 1 document 2 document 3