Un modèle chimio-informatique pour une synthèse virtuelle

No Thumbnail Available
Date
2010
Journal Title
Journal ISSN
Volume Title
Publisher
Abstract
L’informatique appliquée à la chimie et à la biologie requiert d’énormes capacités de calcul, de moyens de traitement, de stockage et de logiciels. Le domaine de la chimio informatique est un domaine interdisciplinaire en plein essor. Il vise à apporter des solutions informatiques à des problèmes liés au traitement de l'information chimique (stockage, recherche, acquisition et exploitation de connaissances). Dans le cas où les entrées d’un système se présentent sous la forme d’une structure, comme pour certaines applications dans le domaine de la chimie où les entrées sont des molécules, il est plus avantageux d’utiliser directement cette structure pour modéliser les réponses du système, qui peuvent être les propriétés physico-chimiques de ces molécules ou leur activité. Ce travail présente à cette fin, une méthodologie à base de la modélisation par apprentissage statistique appelé graph machines, et basée sur le codage des entrées en graphes acycliques orientés. Le modèle construit par la méthode des graph machines se présente sous forme d’une composition de fonctions paramétrées élémentaires (de type réseaux de neurones) qui partagent les mêmes paramètres. Les fonctions associées aux différentes observations sont différentes les unes des autres parce qu’elles reflètent la structure inhérente à chaque observation, i.e. à des observations distinctes sont associés des modelés distincts. Nous avons montré que les techniques traditionnelles de sélection de modèle peuvent être utilisées dans le cadre des graph machines ; elles permettent d’évaluer les capacités en généralisation des modèles proposés, mais aussi de détecter les catégories de molécules sous représentées dans la base d’apprentissage, et d’estimer les intervalles de confiance des prédictions. Cette approche se positionne, de ce fait, en rupture avec les méthodes classiques de modélisation où les variables en entrée sont représentées par des vecteurs et le modèle construit est le même pour toutes les observations.
Description
Keywords
Citation