Notice
1.9. Prédire l’origine de réplication
- document 1 document 2 document 3
- niveau 1 niveau 2 niveau 3
Descriptif
Nous avons écrit un algorithme sympathique en ce qu'il dessine un chemin conforme à la succession des lettres d'une séquence génomique. Cet algorithme simple, au-delà du dessin qu'il produit, est-il susceptible de produire des résultats interprétables par un biologiste ? La réponse est oui. Nous allons l'appliquer sur une séquence de bactéries et voir qu'effectivement des dessins produits sont assez surprenants. Mais avant cela, il faut revenir sur le code de notre algorithme. La raison en est la suivante.
Rappelez-vous, nous avons une fenêtre de longueur fixe, longueur L, que l'on fait progresser sur une séquence génomique de longueur connue. Et à chaque fois, pour chaque position de la fenêtre, nous calculons le nombre de A, de C, de G et de T présents dans la fenêtre, nous en déduisons les coordonnées de l'extrémité du segment à tracer, nous traçons le segment et nous faisons avancer la fenêtre de sa propre longueur. Nous arrivons à la fin de la séquence...
ERRATUM
Une correction a été apportée dans l'algorithme présenté dans les slides 2 et 3 (cf. onglet Erratum pour plus de détails).
Intervention / Responsable scientifique
Thème
Documentation
ERRATUM
Une correction a été apportée dans l'algorithme présenté dans les slides 2 et 3 (cf. texte en rouge dans les slides ci-dessous).


Dans la même collection
-
1.4. Qu’est-ce qu’un algorithme ?
RechenmannFrançoisParmentelatThierryLes génomes peuvent donc être vus comme une longue suite de lettres écrites dans l'alphabet : A, C, G et T. Comment interpréter ces textes ? Ça va être le sujet de la bio-informatique à l'aide d
-
1.10. Des fenêtres glissantes et recouvrantes
RechenmannFrançoisParmentelatThierryNotre sympathique algorithme de balade sur l'ADN, a permis de mettre en évidence des biais de composition de séquences, a fait apparaître sur le tracé un point de rebroussement que l'on peut
-
1.1. La cellule, atome du vivant
RechenmannFrançoisParmentelatThierryBienvenue dans cette introduction conjointe aux notions fondamentales de génomique et d'algorithmique, autrement dit, de l'analyse informatique de l'information génétique, ce qu'on peut désigner de
-
1.6. Contenu en G-C et A-T des séquences
RechenmannFrançoisParmentelatThierryLes algorithmes qui travaillent sur les séquences génomiques, sur les textes génomiques, doivent produire des résultats interprétables et utiles aux biologistes. Nous allons voir que même sur l
-
1.3. L’ADN code l’information génétique
RechenmannFrançoisParmentelatThierryL'ADN, cette longue molécule, porte l'information génétique. Autrement dit, l'information qui est nécessaire à la cellule pour fonctionner et se reproduire. Regardons de plus près cette information
-
1.7. Promenade sur l’ADN
RechenmannFrançoisParmentelatThierryQuand les biologistes se sont trouvés confrontés au premier texte génomique, dans la deuxième moitié des années 70, ils ont été quelque peu désemparés. On peut le comprendre. Encore une fois, regardez
-
1.5. Compter les nucléotides
RechenmannFrançoisParmentelatThierryNotre premier algorithme vise assez simplement à compter les nucléotides d'une séquence génomique, autrement dit à compter les lettres dans une chaîne de caractères. En entrée, cette chaîne de
-
1.2. Au cœur de la cellule, la molécule d’ADN
RechenmannFrançoisParmentelatThierryAu cœur de chaque cellule se trouve donc la molécule d'ADN, flottant directement dans le cytoplasme dans le cas des cellules procaryotes, par exemple bactériennes, ou contenue dans le noyau des
-
1.8. Changer l’échelle du chemin
RechenmannFrançoisParmentelatThierryDans la session précédente, je vous ai proposé de m'accompagner dans une balade sur l'ADN. En fait un parcours de la séquence avec un tracé de segments, dont l'orientation dépendait de la lettre
Avec les mêmes intervenants et intervenantes
-
1.2. At the heart of the cell: the DNA macromolecule
RechenmannFrançoisDuring the last session, we saw how at the heart of the cell there's DNA in the nucleus, sometimes of cells, or directly in the cytoplasm of the bacteria. The DNA is what we call a macromolecule, that
-
1.10. Overlapping sliding window
RechenmannFrançoisWe have made some drawings along a genomic sequence. And we have seen that although the algorithm is quite simple, even if some points of the algorithmare bit trickier than the others, we were able to
-
2.3. The genetic code
RechenmannFrançoisGenes code for proteins. What is the correspondence betweenthe genes, DNA sequences, and the structure of proteins? The correspondence isthe genetic code. Proteins have indeedsequences of amino acids.
-
3.6. Boyer-Moore algorithm
RechenmannFrançoisWe have seen how we can make gene predictions more reliable through searching for all the patterns,all the occurrences of patterns. We have seen, for example, howif we locate the RBS, Ribosome
-
4.5. A sequence alignment as a path
RechenmannFrançoisComparing two sequences and thenmeasuring their similarities is an optimization problem. Why? Because we have seen thatwe have to take into account substitution and deletion. During the alignment, the
-
5.5. Differences are not always what they look like
RechenmannFrançoisThe algorithm we have presented works on an array of distance between sequences. These distances are evaluated on the basis of differences between the sequences. The problem is that behind the
-
1.5. Counting nucleotides
RechenmannFrançoisIn this session, don't panic. We will design our first algorithm. This algorithm is forcounting nucleotides. The idea here is that as an input,you have a sequence of nucleotides, of bases, of letters,
-
2.4. A translation algorithm
RechenmannFrançoisWe have seen that the genetic codeis a correspondence between the DNA or RNA sequences and aminoacid sequences that is proteins. Our aim here is to design atranslation algorithm, we make the
-
3.1. All genes end on a stop codon
RechenmannFrançoisLast week we studied genes and proteins and so how genes, portions of DNA, are translated into proteins. We also saw the very fast evolutionof the sequencing technology which allows for producing
-
3.9. Benchmarking the prediction methods
RechenmannFrançoisIt is necessary to underline that gene predictors produce predictions. Predictions mean that you have no guarantees that the coding sequences, the coding regions,the genes you get when applying your
-
4.2. Why gene/protein sequences may be similar?
RechenmannFrançoisBefore measuring the similaritybetween the sequences, it's interesting to answer the question: why gene or protein sequences may be similar? It is indeed veryinteresting because the answer is related
-
5.4. The UPGMA algorithm
RechenmannFrançoisWe know how to fill an array with the values of the distances between sequences, pairs of sequences which are available in the file. This array of distances will be the input of our algorithm for
Sur le même thème
-
Stockage de données numériques sur ADN synthétique : Théorie de l'information
Kas HannaSergeQuelle quantité d'information peut-on stocker et récupérer de manière fiable dans l'ADN ?
-
Stockage de données numériques sur ADN synthétique : Codage Source
AntoniniMarcCodage source pour le stockage de données sur ADN synthétique
-
The tree of life
AbbySophieLes Rencontres Exobiologiques pour Doctorants (RED) sont une école de formation sur les « bases de l'astrobiologie ». L’édition 2025 s’est tenue du 16 au 21 mars au Parc Ornithologique du Teich.
-
Stockage de données numériques sur ADN synthétique : Codage Canal
DuprazElsaTechniques de codage pour le stockage de données sur ADN
-
Stockage de données numériques sur ADN synthétique : Reconstruction des données
LavenierDominiqueTraitement des données après séquençage
-
Machines algorithmiques, mythes et réalités
MazenodVincentVincent Mazenod, informaticien, partage le fruit de ses réflexions sur l'évolution des outils numériques, en lien avec les problématiques de souveraineté, de sécurité et de vie privée...
-
Stockage de données numériques sur ADN synthétique : Production des données: synthèse, séquençage
LavenierDominiqueBarbryPascalDescription des opérations d'écriture et de lecture des molécules d'ADN : synthèse et séquençage.
-
Stockage de données numériques sur ADN synthétique : Introduction au domaine
AntoniniMarcDuprazElsaLavenierDominiquePrésentation globale des différentes étapes du stockage de données sur des molécules d'ADN synthétique
-
Désassemblons le numérique - #Episode11 : Les algorithmes façonnent-ils notre société ?
SchwartzArnaudLima PillaLaércioEstériePierreSalletFrédéricFerbosAudeRoumanosRayyaChraibi KadoudIkramUn an après le tout premier hackathon sur les méthodologies d'enquêtes journalistiques sur les algorithmes, ce nouvel épisode part à la rencontre de différents points de vue sur les algorithmes.
-
Les machines à enseigner. Du livre à l'IA...
BruillardÉricQue peut-on, que doit-on déléguer à des machines ? C'est l'une des questions explorées par Éric Bruillard qui, du livre aux IA génératives, expose l'évolution des machines à enseigner...
-
Désassemblons le numérique - #Episode9 : Bientôt des supercalculateurs dans nos piscines ?
BeaumontOlivierBouzelRémiDes supercalculateurs feraient-ils bientôt leur apparition dans les piscines municipales pour les chauffer ? Réponses d'Olivier Beaumont, responsable de l'équipe-projet Topal, et Rémi Bouzel,
-
Le projet dnarXiv : Stockage de données sur des molécules d'ADN
LavenierDominiqueDuprazElsaLeblancJulienCoatrieuxGouenouDominique Lavenier, Elsa Dupraz, Julien Leblanc et Gouenou Coatrieux nous présentent le projet dnarXiv, un projet porté par le LabEx CominLabs qui explore le stockage de données sur des molécules d






















