Reasoning over large-scale biological systems with heterogeneous and incomplete data
- document 1 document 2 document 3
- niveau 1 niveau 2 niveau 3
- audio 1 audio 2 audio 3
Descriptif
Data produced by the domain of life sciences in the next decade are expected to be highly challenging. In addition to scalability issues which are shared with other applications domains, data produced in life sciences have very specific characteristics: multi-scale, incomplete, heterogeneous but somehow interdependent. This makes data-mining methods less efficient than expected to assist knowledge discovery. An example of such limitations is the study of biological systems in molecular and cellular biology, which cannot be uniquely identified with the data at hand.In this talk, we will introduce a strategy to study biological systems in the framework of incomplete data.This strategy relies on reasoning and logical programming technics, allowing to model interactions within a system, take into account information carried by the overapproximated dynamics of the system, and finally extract relevant properties by solving combinatorial problems. We will illustrate this approach on the emerging field of systems ecology which aims at understanding interactions between a consortium of microbes and a host organism.
Thème
Notice
Documentation
Documents pédagogiques
Sur le même thème
-
21 Molecular Algorithms Using Reprogrammable DNA Self-AssemblyWoodsDamien
The history of computing tells us that computers can be made of almost anything: silicon, gears and levers, neurons, flowing water, interacting particles or even light. Although lithographically
-
Des métiers de la bio-informatique
Courtes vidéos pour sensibiliser le jeune public aux débouchés/métiers de la filière numérique et pour promouvoir les sciences du numérique, plus globalement les carrières scientifiques.L'objectif est
-
Biological Networks Entropies: examples in neural, genetic and social networksDemongeotJacques
The networks used in biological applications at different scales (molecular, cellular and populational) are of different types, genetic, neuronal, and social, but they share the same dynamical
-
Apport de l'informatique à la génomique des cancersViariAlain
La plupart des gènes de notre génome sont présents en deux copies (une sur chaque chromosome homologue). Dans un génome tumoral, en revanche, il est fréquent d'observer soit des pertes soit, au
-
5.6. La diversité des algorithmes informatiquesRechenmannFrançoisParmentelatThierry
Nous n'avons vu dans ce cours qu'un exemple extrêmement réduit d'algorithme bio informatique. Il existe en effet une très grande diversité de ces algorithmes bio informatiques qui sont motivés par l
-
4.8. Un algorithme récursifRechenmannFrançoisParmentelatThierry
Nous avons désormais en main tous les éléments pour écrire notre algorithme de détermination d'un alignement optimal, ici d'un chemin optimal. Avec les notations que nous avons introduites, je vous
-
5.2. L’arbre, objet abstraitRechenmannFrançoisParmentelatThierry
Vous l'aurez compris un arbre phylogénétique est un arbre abstrait qui n'a qu'un lointain rapport métaphorique avec un véritable arbre. L'arbre des bio-informaticiens et des informaticiens se
-
5.1. L’arbre des espècesRechenmannFrançoisParmentelatThierry
Dans cette cinquième et dernière partie de notre cours sur le génome et les algorithmes, qui se veut une introduction à l'analyse informatique de l'information génétique, nous regarderons de plus près
-
5.5. Quand les différences sont trompeusesRechenmannFrançoisParmentelatThierry
Il y a plusieurs raisons pour lesquelles la méthode UPGMA, que nous venons de voir, se révèle simpliste. L'une des raisons par exemple, c'est pourquoi quand on recalcule les distances, quand on a
-
4.7. Coûts et alignementRechenmannFrançoisParmentelatThierry
Nous avons vu l'ébauche de notre algorithme d'alignement optimal en considérant la possibilité de calculer le coût optimal, ou score optimal, de ce dernier noeud. Et nous avons vu que le coût de ce
-
4.4. L’alignement de séquences devient un problème d’optimisationRechenmannFrançoisParmentelatThierry
La distance de Hamming nous donne une première possibilité de mesurer la similarité entre 2 séquences. Mais elle ne reflète pas suffisamment la réalité biologique. Qu'est-ce que j'entends par là ? On
-
4.3. Quantifier la similarité de deux séquencesRechenmannFrançoisParmentelatThierry
Le principe est donc de rechercher, dans les bases de données, des séquences similaires à celles que nous sommes en train d'étudier. Nous faisons aussi l'hypothèse que plus les séquences sont