Notice
1.5. Compter les nucléotides
- document 1 document 2 document 3
- niveau 1 niveau 2 niveau 3
Descriptif
Notre premier algorithme vise assez simplement à compter les nucléotides d'une séquence génomique, autrement dit à compter les lettres dans une chaîne de caractères. En entrée, cette chaîne de caractères, encore une fois écrite dans cet alphabet de 4 lettres, et dont la fin est marquée par un caractère particulier qu'il s'agira de reconnaître. La description d'un algorithme débute par la déclaration de ce qu'on appelle des variables. Ici nous l'avons vu, nous avons plusieurs variables : le nombre de A, le nombre de C, le nombre de G et de T qu'il faudra calculer, le nombre total de lettres dans la séquence. Et nous aurons besoin d'une variable supplémentaire appelée index qui va nous permettre de progresser dans la séquence.
Cette séquence elle-même est définie, déclarée, comme étant une chaîne de caractères débutant à l'indice 1 et de longueur non précisée, ce qu'indique ici cette notation. On peut voir une séquence de caractères sous la forme d'un tableau uni dimensionnel et chaque cellule du tableau a un indice, un index. Ici, si je réfère à séquences de index alors que index vaut 1, je fais référence au contenu : la lettre T. Si l'index ou l'indice vaut 9 : la lettre est la lettre C...
Intervention
Dans la même collection
-
1.4. Qu’est-ce qu’un algorithme ?
RECHENMANN François
PARMENTELAT Thierry
Les génomes peuvent donc être vus comme une longue suite de lettres écrites dans l'alphabet : A, C, G et T. Comment interpréter ces textes ? Ça va être le sujet de la bio-informatique à l'aide d
-
1.10. Des fenêtres glissantes et recouvrantes
RECHENMANN François
PARMENTELAT Thierry
Notre sympathique algorithme de balade sur l'ADN, a permis de mettre en évidence des biais de composition de séquences, a fait apparaître sur le tracé un point de rebroussement que l'on peut
-
1.1. La cellule, atome du vivant
RECHENMANN François
PARMENTELAT Thierry
Bienvenue dans cette introduction conjointe aux notions fondamentales de génomique et d'algorithmique, autrement dit, de l'analyse informatique de l'information génétique, ce qu'on peut désigner de
-
1.8. Changer l’échelle du chemin
RECHENMANN François
PARMENTELAT Thierry
Dans la session précédente, je vous ai proposé de m'accompagner dans une balade sur l'ADN. En fait un parcours de la séquence avec un tracé de segments, dont l'orientation dépendait de la lettre
-
1.3. L’ADN code l’information génétique
RECHENMANN François
PARMENTELAT Thierry
L'ADN, cette longue molécule, porte l'information génétique. Autrement dit, l'information qui est nécessaire à la cellule pour fonctionner et se reproduire. Regardons de plus près cette information
-
1.9. Prédire l’origine de réplication
RECHENMANN François
PARMENTELAT Thierry
Nous avons écrit un algorithme sympathique en ce qu'il dessine un chemin conforme à la succession des lettres d'une séquence génomique. Cet algorithme simple, au-delà du dessin qu'il produit, est-il
-
1.6. Contenu en G-C et A-T des séquences
RECHENMANN François
PARMENTELAT Thierry
Les algorithmes qui travaillent sur les séquences génomiques, sur les textes génomiques, doivent produire des résultats interprétables et utiles aux biologistes. Nous allons voir que même sur l
-
1.2. Au cœur de la cellule, la molécule d’ADN
RECHENMANN François
PARMENTELAT Thierry
Au cœur de chaque cellule se trouve donc la molécule d'ADN, flottant directement dans le cytoplasme dans le cas des cellules procaryotes, par exemple bactériennes, ou contenue dans le noyau des
-
1.7. Promenade sur l’ADN
RECHENMANN François
PARMENTELAT Thierry
Quand les biologistes se sont trouvés confrontés au premier texte génomique, dans la deuxième moitié des années 70, ils ont été quelque peu désemparés. On peut le comprendre. Encore une fois, regardez
Avec les mêmes intervenants et intervenantes
-
1.2. At the heart of the cell: the DNA macromolecule
RECHENMANN François
During the last session, we saw how at the heart of the cell there's DNA in the nucleus, sometimes of cells, or directly in the cytoplasm of the bacteria. The DNA is what we call a macromolecule, that
-
1.10. Overlapping sliding window
RECHENMANN François
We have made some drawings along a genomic sequence. And we have seen that although the algorithm is quite simple, even if some points of the algorithmare bit trickier than the others, we were able to
-
2.3. The genetic code
RECHENMANN François
Genes code for proteins. What is the correspondence betweenthe genes, DNA sequences, and the structure of proteins? The correspondence isthe genetic code. Proteins have indeedsequences of amino acids.
-
3.6. Boyer-Moore algorithm
RECHENMANN François
We have seen how we can make gene predictions more reliable through searching for all the patterns,all the occurrences of patterns. We have seen, for example, howif we locate the RBS, Ribosome
-
4.5. A sequence alignment as a path
RECHENMANN François
Comparing two sequences and thenmeasuring their similarities is an optimization problem. Why? Because we have seen thatwe have to take into account substitution and deletion. During the alignment, the
-
5.5. Differences are not always what they look like
RECHENMANN François
The algorithm we have presented works on an array of distance between sequences. These distances are evaluated on the basis of differences between the sequences. The problem is that behind the
-
1.5. Counting nucleotides
RECHENMANN François
In this session, don't panic. We will design our first algorithm. This algorithm is forcounting nucleotides. The idea here is that as an input,you have a sequence of nucleotides, of bases, of letters,
-
2.4. A translation algorithm
RECHENMANN François
We have seen that the genetic codeis a correspondence between the DNA or RNA sequences and aminoacid sequences that is proteins. Our aim here is to design atranslation algorithm, we make the
-
3.1. All genes end on a stop codon
RECHENMANN François
Last week we studied genes and proteins and so how genes, portions of DNA, are translated into proteins. We also saw the very fast evolutionof the sequencing technology which allows for producing
-
3.9. Benchmarking the prediction methods
RECHENMANN François
It is necessary to underline that gene predictors produce predictions. Predictions mean that you have no guarantees that the coding sequences, the coding regions,the genes you get when applying your
-
4.2. Why gene/protein sequences may be similar?
RECHENMANN François
Before measuring the similaritybetween the sequences, it's interesting to answer the question: why gene or protein sequences may be similar? It is indeed veryinteresting because the answer is related
-
5.4. The UPGMA algorithm
RECHENMANN François
We know how to fill an array with the values of the distances between sequences, pairs of sequences which are available in the file. This array of distances will be the input of our algorithm for
Sur le même thème
-
The tree of life
ABBY Sophie
Les Rencontres Exobiologiques pour Doctorants (RED) sont une école de formation sur les « bases de l'astrobiologie ». L’édition 2025 s’est tenue du 16 au 21 mars au Parc Ornithologique du Teich.
-
Machines algorithmiques, mythes et réalités
MAZENOD Vincent
Vincent Mazenod, informaticien, partage le fruit de ses réflexions sur l'évolution des outils numériques, en lien avec les problématiques de souveraineté, de sécurité et de vie privée...
-
Désassemblons le numérique - #Episode11 : Les algorithmes façonnent-ils notre société ?
SCHWARTZ Arnaud
LIMA PILLA Laércio
ESTéRIE Pierre
SALLET Frédéric
FERBOS Aude
ROUMANOS Rayya
CHRAIBI KADOUD Ikram
Un an après le tout premier hackathon sur les méthodologies d'enquêtes journalistiques sur les algorithmes, ce nouvel épisode part à la rencontre de différents points de vue sur les algorithmes.
-
Les machines à enseigner. Du livre à l'IA...
BRUILLARD Éric
Que peut-on, que doit-on déléguer à des machines ? C'est l'une des questions explorées par Éric Bruillard qui, du livre aux IA génératives, expose l'évolution des machines à enseigner...
-
Désassemblons le numérique - #Episode9 : Bientôt des supercalculateurs dans nos piscines ?
BEAUMONT Olivier
BOUZEL Rémi
Des supercalculateurs feraient-ils bientôt leur apparition dans les piscines municipales pour les chauffer ? Réponses d'Olivier Beaumont, responsable de l'équipe-projet Topal, et Rémi Bouzel,
-
Le projet dnarXiv : Stockage de données sur des molécules d'ADN
LAVENIER Dominique
DUPRAZ Elsa
LEBLANC Julien
COATRIEUX Gouenou
Dominique Lavenier, Elsa Dupraz, Julien Leblanc et Gouenou Coatrieux nous présentent le projet dnarXiv, un projet porté par le LabEx CominLabs qui explore le stockage de données sur des molécules d
-
Projection methods for community detection in complex networks
LITVAK Nelly
Community detection is one of most prominent tasks in the analysis of complex networks such as social networks, biological networks, and the world wide web. A community is loosely defined as a group
-
Lara Croft. doing fieldwork under surveillance
DALL'AGNOLA Jasmin
Lara Croft. Doing Fieldwork Under Surveillance Intervention de Jasmin Dall'Agnola (The George Washington University), dans le cadre du Colloque coorganisé par Anders Albrechtslund, professeur en
-
Containing predictive tokens in the EU
CZARNOCKI Jan
Containing Predictive Tokens in the EU – Mapping the Laws Against Digital Surveillance, intervention de Jan Czarnocki (KU Leuven), dans le cadre du Colloque coorganisé par Anders Albrechtslund,
-
Ivan Murit - Processus de création d'images
MURIT Ivan
Je vais présenter une manière décalée d'aborder les outils d'impression. Pour cela nous ne partirons pas de l'envie d'imprimer une image préexistante, mais d'avant cela : comment se crée une forme
-
Le Creativ’Lab, au cœur de la robotique et de l’intelligence artificielle (ASR N°18 - LORIA)
HéNAFF Patrick
LEFEBVRE Sylvain
Le LORIA, laboratoire phare de la Grande Région dans le domaine de l’informatique, propose de rendre la recherche plus ouverte, plus collaborative, plus ambitieuse… en un mot, plus créative, à travers
-
Les algorithmes de Parcoursup
MATHIEU Claire
L’objectif de la journée « Algorithmes d’aide à la décision publique » était de sensibiliser le grand public aux rôles des algorithmes d’aide à la décision publique utilisés par exemple pour l