{ListeTraductions,#GET{ListeTraductions},#ARRAY{#LANG,#URL_ARTICLE}} {ListeTraductions,#GET{ListeTraductions},#ARRAY{#LANG,#URL_ARTICLE}}
 

Méthodes pour l’inférence un grande dimension avec des données correlées : application à des données génomiques
Eleonora De Leonardis (LPS)

La disponibilité de quantités énormes de données a changé le rôle de la
physique par rapport aux autres disciplines. Dans cette thèse, je vais
explorer les innovations introduites dans la biologie moléculaire grâce à
des approches de physique statistique. Au cours des 20 dernières années,
la taille des bases de données sur le génome a augmenté de façon
exponentielle : l’exploitation des données brutes, dans le champ
d’application de l’extraction d’informations, est donc devenu un sujet
majeur dans la physique statistique. Après le succès dans la prédiction de
la structure des protéines, des résultats étonnamment bons ont été
finalement obtenus aussi pour l’ARN. Cependant, des études récentes ont
révélé que, même si les bases de données sont de plus en plus grandes,
l’inférence est souvent effectuée dans le régime de sous-échantillonnage
et de nouveaux systèmes informatiques sont nécessaires afin de surmonter
cette limitation intrinsèque des données réelles. Cette thèse va discuter
des méthodes d’inférence et leur application à des prédictions de la
structure de l’ARN. Nous allons comprendre certaines approches
heuristiques qui ont été appliquées avec succès dans les dernières années,
même si théoriquement mal comprises. La dernière partie du travail se
concentrera sur le développement d’un outil pour l’inférence de modèles
génératifs, en espérant qu’il ouvrira la voie à de nouvelles applications.