Notice
1.5. Compter les nucléotides
- document 1 document 2 document 3
- niveau 1 niveau 2 niveau 3
Descriptif
Notre premier algorithme vise assez simplement à compter les nucléotides d'une séquence génomique, autrement dit à compter les lettres dans une chaîne de caractères. En entrée, cette chaîne de caractères, encore une fois écrite dans cet alphabet de 4 lettres, et dont la fin est marquée par un caractère particulier qu'il s'agira de reconnaître. La description d'un algorithme débute par la déclaration de ce qu'on appelle des variables. Ici nous l'avons vu, nous avons plusieurs variables : le nombre de A, le nombre de C, le nombre de G et de T qu'il faudra calculer, le nombre total de lettres dans la séquence. Et nous aurons besoin d'une variable supplémentaire appelée index qui va nous permettre de progresser dans la séquence.
Cette séquence elle-même est définie, déclarée, comme étant une chaîne de caractères débutant à l'indice 1 et de longueur non précisée, ce qu'indique ici cette notation. On peut voir une séquence de caractères sous la forme d'un tableau uni dimensionnel et chaque cellule du tableau a un indice, un index. Ici, si je réfère à séquences de index alors que index vaut 1, je fais référence au contenu : la lettre T. Si l'index ou l'indice vaut 9 : la lettre est la lettre C...
Intervention
Dans la même collection
-
1.3. L’ADN code l’information génétique
RechenmannFrançoisParmentelatThierryL'ADN, cette longue molécule, porte l'information génétique. Autrement dit, l'information qui est nécessaire à la cellule pour fonctionner et se reproduire. Regardons de plus près cette information
-
1.9. Prédire l’origine de réplication
RechenmannFrançoisParmentelatThierryNous avons écrit un algorithme sympathique en ce qu'il dessine un chemin conforme à la succession des lettres d'une séquence génomique. Cet algorithme simple, au-delà du dessin qu'il produit, est-il
-
1.6. Contenu en G-C et A-T des séquences
RechenmannFrançoisParmentelatThierryLes algorithmes qui travaillent sur les séquences génomiques, sur les textes génomiques, doivent produire des résultats interprétables et utiles aux biologistes. Nous allons voir que même sur l
-
1.2. Au cœur de la cellule, la molécule d’ADN
RechenmannFrançoisParmentelatThierryAu cœur de chaque cellule se trouve donc la molécule d'ADN, flottant directement dans le cytoplasme dans le cas des cellules procaryotes, par exemple bactériennes, ou contenue dans le noyau des
-
1.7. Promenade sur l’ADN
RechenmannFrançoisParmentelatThierryQuand les biologistes se sont trouvés confrontés au premier texte génomique, dans la deuxième moitié des années 70, ils ont été quelque peu désemparés. On peut le comprendre. Encore une fois, regardez
-
1.4. Qu’est-ce qu’un algorithme ?
RechenmannFrançoisParmentelatThierryLes génomes peuvent donc être vus comme une longue suite de lettres écrites dans l'alphabet : A, C, G et T. Comment interpréter ces textes ? Ça va être le sujet de la bio-informatique à l'aide d
-
1.10. Des fenêtres glissantes et recouvrantes
RechenmannFrançoisParmentelatThierryNotre sympathique algorithme de balade sur l'ADN, a permis de mettre en évidence des biais de composition de séquences, a fait apparaître sur le tracé un point de rebroussement que l'on peut
-
1.1. La cellule, atome du vivant
RechenmannFrançoisParmentelatThierryBienvenue dans cette introduction conjointe aux notions fondamentales de génomique et d'algorithmique, autrement dit, de l'analyse informatique de l'information génétique, ce qu'on peut désigner de
-
1.8. Changer l’échelle du chemin
RechenmannFrançoisParmentelatThierryDans la session précédente, je vous ai proposé de m'accompagner dans une balade sur l'ADN. En fait un parcours de la séquence avec un tracé de segments, dont l'orientation dépendait de la lettre
Avec les mêmes intervenants et intervenantes
-
1.5. Counting nucleotides
RechenmannFrançoisIn this session, don't panic. We will design our first algorithm. This algorithm is forcounting nucleotides. The idea here is that as an input,you have a sequence of nucleotides, of bases, of letters,
-
2.4. A translation algorithm
RechenmannFrançoisWe have seen that the genetic codeis a correspondence between the DNA or RNA sequences and aminoacid sequences that is proteins. Our aim here is to design atranslation algorithm, we make the
-
3.1. All genes end on a stop codon
RechenmannFrançoisLast week we studied genes and proteins and so how genes, portions of DNA, are translated into proteins. We also saw the very fast evolutionof the sequencing technology which allows for producing
-
3.9. Benchmarking the prediction methods
RechenmannFrançoisIt is necessary to underline that gene predictors produce predictions. Predictions mean that you have no guarantees that the coding sequences, the coding regions,the genes you get when applying your
-
4.2. Why gene/protein sequences may be similar?
RechenmannFrançoisBefore measuring the similaritybetween the sequences, it's interesting to answer the question: why gene or protein sequences may be similar? It is indeed veryinteresting because the answer is related
-
5.4. The UPGMA algorithm
RechenmannFrançoisWe know how to fill an array with the values of the distances between sequences, pairs of sequences which are available in the file. This array of distances will be the input of our algorithm for
-
1.8. Compressing the DNA walk
RechenmannFrançoisWe have written the algorithm for the circle DNA walk. Just a precision here: the kind of drawing we get has nothing to do with the physical drawing of the DNA molecule. It is a symbolic
-
2.7. The algorithm design trade-off
RechenmannFrançoisWe saw how to increase the efficiencyof our algorithm through the introduction of a data structure. Now let's see if we can do even better. We had a table of index and weexplain how the use of these
-
3.4. Predicting all the genes in a sequence
RechenmannFrançoisWe have written an algorithm whichis able to locate potential genes on a sequence but only on one phase because we are looking triplets after triplets. Now remember that the genes maybe located on
-
4.7. Alignment costs
RechenmannFrançoisWe have seen how we can compute the cost of the path ending on the last node of our grid if we know the cost of the sub-path ending on the three adjacent nodes. It is time now to see more deeply why
-
4.9. Recursion can be avoided: an iterative version
RechenmannFrançoisWe have written a recursive function to compute the optimal path that is an optimal alignment between two sequences. Here all the examples I gave were onDNA sequences, four letter alphabet. OK. The
-
1.3. DNA codes for genetic information
RechenmannFrançoisRemember at the heart of any cell,there is this very long molecule which is called a macromolecule for this reason, which is the DNA molecule. Now we will see that DNA molecules support what is called
Sur le même thème
-
Désassemblons le numérique - #Episode11 : Les algorithmes façonnent-ils notre société ?
SchwartzArnaudLima PillaLaércioEstériePierreSalletFrédéricFerbosAudeRoumanosRayyaChraibi KadoudIkramUn an après le tout premier hackathon sur les méthodologies d'enquêtes journalistiques sur les algorithmes, ce nouvel épisode part à la rencontre de différents points de vue sur les algorithmes.
-
Les machines à enseigner. Du livre à l'IA...
BruillardÉricQue peut-on, que doit-on déléguer à des machines ? C'est l'une des questions explorées par Éric Bruillard qui, du livre aux IA génératives, expose l'évolution des machines à enseigner...
-
Désassemblons le numérique - #Episode9 : Bientôt des supercalculateurs dans nos piscines ?
BeaumontOlivierBouzelRémiDes supercalculateurs feraient-ils bientôt leur apparition dans les piscines municipales pour les chauffer ? Réponses d'Olivier Beaumont, responsable de l'équipe-projet Topal, et Rémi Bouzel,
-
Le projet dnarXiv : Stockage de données sur des molécules d'ADN
LavenierDominiqueDuprazElsaLeblancJulienCoatrieuxGouenouDominique Lavenier, Elsa Dupraz, Julien Leblanc et Gouenou Coatrieux nous présentent le projet dnarXiv, un projet porté par le LabEx CominLabs qui explore le stockage de données sur des molécules d
-
Projection methods for community detection in complex networks
LitvakNellyCommunity detection is one of most prominent tasks in the analysis of complex networks such as social networks, biological networks, and the world wide web. A community is loosely defined as a group
-
Lara Croft. doing fieldwork under surveillance
Dall'AgnolaJasminLara Croft. Doing Fieldwork Under Surveillance Intervention de Jasmin Dall'Agnola (The George Washington University), dans le cadre du Colloque coorganisé par Anders Albrechtslund, professeur en
-
Containing predictive tokens in the EU
CzarnockiJanContaining Predictive Tokens in the EU – Mapping the Laws Against Digital Surveillance, intervention de Jan Czarnocki (KU Leuven), dans le cadre du Colloque coorganisé par Anders Albrechtslund,
-
Ivan Murit - Processus de création d'images
MuritIvanJe vais présenter une manière décalée d'aborder les outils d'impression. Pour cela nous ne partirons pas de l'envie d'imprimer une image préexistante, mais d'avant cela : comment se crée une forme
-
Le Creativ’Lab, au cœur de la robotique et de l’intelligence artificielle (ASR N°18 - LORIA)
HénaffPatrickLefebvreSylvainLe LORIA, laboratoire phare de la Grande Région dans le domaine de l’informatique, propose de rendre la recherche plus ouverte, plus collaborative, plus ambitieuse… en un mot, plus créative, à travers
-
Les algorithmes de Parcoursup
MathieuClaireL’objectif de la journée « Algorithmes d’aide à la décision publique » était de sensibiliser le grand public aux rôles des algorithmes d’aide à la décision publique utilisés par exemple pour l
-
Algorithmes d'aide à la décision publique / Ouverture
RéveillèreLaurentMaveyraud-TricoireSamuelBlancXavierBertrandYvesMainguenéMarcL’objectif de la journée « Algorithmes d’aide à la décision publique » était de sensibiliser le grand public aux rôles des algorithmes d’aide à la décision publique utilisés par exemple pour l
-
Quelques enjeux autour des algorithmes d'aide à la décision publique
TarissanFabienL’objectif de la journée « Algorithmes d’aide à la décision publique » était de sensibiliser le grand public aux rôles des algorithmes d’aide à la décision publique utilisés par exemple pour l