Notice
2.2. Les gènes, de Mendel à la biologie moléculaire
- document 1 document 2 document 3
- niveau 1 niveau 2 niveau 3
Descriptif
La séquence de caractères est un bon modèle de l'ADN, un des modèles possibles de l'ADN et il est bon parce qu'il est utile. On va voir en particulier que ce modèle simple peut servir de support à de la prédiction de gènes. On va pouvoir grâce à ce modèle-là, avec les algorithmes appropriés, trouver les gènes sur l'ADN. Et donc, surtout, sur la séquence qui représente cet ADN.
Cette notion de gènes, qui s'impose actuellement comme étant la portion de l'ADN qui code pour les protéines, n'a pas toujours été connue en tant que telle. La première fois qu'on a parlé des gènes, c'était en fait lors des travaux du moine Gregor Mendel. Vers les années 1850-60, Gregor Mendel étudie dans son monastère la transmission de caractéristiques de graines de pois de senteur. En particulier, si les graines était lisses et ridées. Ils faisaient des croisements entre les différents plants pour essayer de trouver une règle qui expliquerait comment certains caractères se transmettaient ou pas aux générations suivantes...
Intervention
Thème
Documentation
A noter
A noter...
Si vous avez quelques notions de génétique moléculaire, vous êtes en droit d’être surpris par la manière de présenter la transcription d’une région d’ADN. En effet, dans la vidéo, il est expliqué que la séquence transcrite est obtenue à partir de la séquence d’ADN en remplaçant les occurrences de T par U.
Or, le processus de transcription est quelque peu plus complexe.
Considérons la séquence 5’ ATTCGATCGGGTATTACG 3’ au sein d’un gène et donc susceptible d’être traduite en une chaîne d’acides aminés.
C’est la portion d’ADN portée par le brin complémentaire qui est en fait transcrite. Cette séquence complémentaire est 3’ TAAGCTAGCCCATAATGC 5’.
La transcription se fait en parcourant cette chaîne dans le sens 5’ vers 3’. Elle consiste à développer une chaîne d’ARN complémentaire, en commençant par son extrémité 3’ vers 5’, à travers les règles d’appariement A – T, C – G, G –C et T – U. La séquence d’ARN qui en résulte est donc 5’ AUUCGAUCGGGGUAUUACG 3’ qui est bien celle obtenue par l’algorithme qui remplace directement les occurrences de T par U.
L’algorithme de transcription présenté dans la vidéo est correct, mais il « court-circuite » les étapes des processus biologiques en œuvre au sein de la cellule.
Cet état de fait est fréquent : les algorithmes bioinformatiques visent à être efficaces, par exemple pour prédire les gènes ; ils ne cherchent pas à simuler les processus biologiques en œuvre.
Dans la même collection
-
2.7. Les compromis de la conception d’algorithmes
RECHENMANN François
PARMENTELAT Thierry
La mise en oeuvre d'une structure de données appropriée permet, nous l'avons vu, d'améliorer les performances d'algorithmes. Nous en avons vu l'exemple sur la recherche d'un triplet dans un tableau de
-
2.1. La séquence est-elle un bon modèle de l’ADN ?
RECHENMANN François
PARMENTELAT Thierry
L'ADN porte l'information génétique, plus précisément l'ADN porte les gènes, c'est-à-dire les régions de cette molécule qui portent l'information utilisée par la cellule pour synthétiser les protéines
-
2.10. Comment trouver les gènes ?
RECHENMANN François
PARMENTELAT Thierry
L'obtention de la séquence complète d'un génome d'un organisme vivant est certes un beau résultat, mais c'est en fait le début d'une longue phase d'interprétation, d'annotations et de comparaisons.
-
2.5. Implémenter le code génétique
RECHENMANN François
PARMENTELAT Thierry
Nous avons écrit le corps de l'algorithme de traduction, et nous avons fractionné la complexité d'écriture de cet algorithme en faisant appel à une fonction qui recherche dans le tableau, qui
-
2.8. Les technologies de séquençage de l’ADN
RECHENMANN François
PARMENTELAT Thierry
Nous parlons beaucoup dans ce cours de séquences génomiques ou séquences d'ADN, que nous voyons pour des raisons algorithmiques sous forme de chaînes de caractères. Comment ces séquences, ces chaînes
-
2.3. Le code génétique
RECHENMANN François
PARMENTELAT Thierry
Gènes et protéines, mais qu'est-ce qu'une protéine ? Une protéine, c'est également une molécule qui est constituée d'une succession de ce que l'on appelle les acides aminés. C'est donc une chaîne d
-
2.6. Algorithmes + structures de données = programmes
RECHENMANN François
PARMENTELAT Thierry
En écrivant le code de la fonction, qui recherche un triplet dans le tableau qui implémente le code génétique, nous avons terminé et obtenu un algorithme de traduction d'une séquence d'ADN, voire d
-
2.9. Le séquençage de génomes complets
RECHENMANN François
PARMENTELAT Thierry
Les progrès dans les technologies de séquençage ont permis d'aborder le séquençage complet de génome. Là encore, les progrès ont été spectaculaires. Prenons l'exemple du projet de séquençage de la
-
2.4. Un algorithme de traduction
RECHENMANN François
PARMENTELAT Thierry
Une protéine, en tant que succession d'acides aminés, peut-être vue comme le résultat d'un processus de traduction d'une chaîne de caractères écrite dans un alphabet de 4 lettres en une autre chaîne
Avec les mêmes intervenants et intervenantes
-
1.4. What is an algorithm?
RECHENMANN François
We have seen that a genomic textcan be indeed a very long sequence of characters. And to interpret this sequence of characters, we will need to use computers. Using computers means writing program.
-
2.2. Genes: from Mendel to molecular biology
RECHENMANN François
The notion of gene emerged withthe works of Gregor Mendel. Mendel studied the inheritance on some traits like the shape of pea plant seeds,through generations. He stated the famous laws of inheritance
-
2.10. How to find genes?
RECHENMANN François
Getting the sequence of the genome is only the beginning, as I explained, once you have the sequence what you want to do is to locate the gene, to predict the function of the gene and maybe study the
-
3.8. Probabilistic methods
RECHENMANN François
Up to now, to predict our gene,we only rely on the process of searching certain strings or patterns. In order to further improve our gene predictor, the idea is to use, to rely onprobabilistic methods
-
4.3. Measuring sequence similarity
RECHENMANN François
So we understand why gene orprotein sequences may be similar. It's because they evolve togetherwith the species and they evolve in time, there aremodifications in the sequence and that the sequence
-
5.3. Building an array of distances
RECHENMANN François
So using the sequences of homologous gene between several species, our aim is to reconstruct phylogenetic tree of the corresponding species. For this, we have to comparesequences and compute distances
-
1.7. DNA walk
RECHENMANN François
We will now design a more graphical algorithm which is called "the DNA walk". We shall see what does it mean "DNA walk". Walk on to DNA. Something like that, yes. But first, just have a look again at
-
2.6. Algorithms + data structures = programs
RECHENMANN François
By writing the Lookup GeneticCode Function, we completed our translation algorithm. So we may ask the question about the algorithm, does it terminate? Andthe answer is yes, obviously. Is it pertinent,
-
3.3. Searching for start and stop codons
RECHENMANN François
We have written an algorithm for finding genes. But you remember that we arestill to write the two functions for finding the next stop codonand the next start codon. Let's see how we can do that. We
-
4.1. How to predict gene/protein functions?
RECHENMANN François
Last week we have seen that annotating a genome means first locating the genes on the DNA sequences that is the genes, the region coding for proteins. But this is indeed the first step,the next very
-
4.10. How efficient is this algorithm?
RECHENMANN François
We have seen the principle of an iterative algorithm in two paths for aligning and comparing two sequences of characters, here DNA sequences. And we understoodwhy the iterative version is much more
-
5.7. The application domains in microbiology
RECHENMANN François
Bioinformatics relies on many domains of mathematics and computer science. Of course, algorithms themselves on character strings are important in bioinformatics, we have seen them. Algorithms and
Sur le même thème
-
The tree of life
ABBY Sophie
Les Rencontres Exobiologiques pour Doctorants (RED) sont une école de formation sur les « bases de l'astrobiologie ». L’édition 2025 s’est tenue du 16 au 21 mars au Parc Ornithologique du Teich.
-
Machines algorithmiques, mythes et réalités
MAZENOD Vincent
Vincent Mazenod, informaticien, partage le fruit de ses réflexions sur l'évolution des outils numériques, en lien avec les problématiques de souveraineté, de sécurité et de vie privée...
-
Désassemblons le numérique - #Episode11 : Les algorithmes façonnent-ils notre société ?
SCHWARTZ Arnaud
LIMA PILLA Laércio
ESTéRIE Pierre
SALLET Frédéric
FERBOS Aude
ROUMANOS Rayya
CHRAIBI KADOUD Ikram
Un an après le tout premier hackathon sur les méthodologies d'enquêtes journalistiques sur les algorithmes, ce nouvel épisode part à la rencontre de différents points de vue sur les algorithmes.
-
Les machines à enseigner. Du livre à l'IA...
BRUILLARD Éric
Que peut-on, que doit-on déléguer à des machines ? C'est l'une des questions explorées par Éric Bruillard qui, du livre aux IA génératives, expose l'évolution des machines à enseigner...
-
Désassemblons le numérique - #Episode9 : Bientôt des supercalculateurs dans nos piscines ?
BEAUMONT Olivier
BOUZEL Rémi
Des supercalculateurs feraient-ils bientôt leur apparition dans les piscines municipales pour les chauffer ? Réponses d'Olivier Beaumont, responsable de l'équipe-projet Topal, et Rémi Bouzel,
-
Le projet dnarXiv : Stockage de données sur des molécules d'ADN
LAVENIER Dominique
DUPRAZ Elsa
LEBLANC Julien
COATRIEUX Gouenou
Dominique Lavenier, Elsa Dupraz, Julien Leblanc et Gouenou Coatrieux nous présentent le projet dnarXiv, un projet porté par le LabEx CominLabs qui explore le stockage de données sur des molécules d
-
Projection methods for community detection in complex networks
LITVAK Nelly
Community detection is one of most prominent tasks in the analysis of complex networks such as social networks, biological networks, and the world wide web. A community is loosely defined as a group
-
Lara Croft. doing fieldwork under surveillance
DALL'AGNOLA Jasmin
Lara Croft. Doing Fieldwork Under Surveillance Intervention de Jasmin Dall'Agnola (The George Washington University), dans le cadre du Colloque coorganisé par Anders Albrechtslund, professeur en
-
Containing predictive tokens in the EU
CZARNOCKI Jan
Containing Predictive Tokens in the EU – Mapping the Laws Against Digital Surveillance, intervention de Jan Czarnocki (KU Leuven), dans le cadre du Colloque coorganisé par Anders Albrechtslund,
-
Ivan Murit - Processus de création d'images
MURIT Ivan
Je vais présenter une manière décalée d'aborder les outils d'impression. Pour cela nous ne partirons pas de l'envie d'imprimer une image préexistante, mais d'avant cela : comment se crée une forme
-
Le Creativ’Lab, au cœur de la robotique et de l’intelligence artificielle (ASR N°18 - LORIA)
HéNAFF Patrick
LEFEBVRE Sylvain
Le LORIA, laboratoire phare de la Grande Région dans le domaine de l’informatique, propose de rendre la recherche plus ouverte, plus collaborative, plus ambitieuse… en un mot, plus créative, à travers
-
Les algorithmes de Parcoursup
MATHIEU Claire
L’objectif de la journée « Algorithmes d’aide à la décision publique » était de sensibiliser le grand public aux rôles des algorithmes d’aide à la décision publique utilisés par exemple pour l