Molecular modeling of biologically active molecules using different theoretical approaches

No Thumbnail Available
Date
2021
Journal Title
Journal ISSN
Volume Title
Publisher
Abstract
Au cours de la dernière décennie, le développement rapide des techniques biologiques et chimiques tel que le criblage à haut débit et la synthèse parallèle a considérablement augmenté la quantité des données, ce qui nécessite la création et l'intégration de nouvelles méthodes analytiques et techniques d'apprentissage automatique. L'objectif principal de la première partie de cette thèse était de développer un modèle Auto Pass-Pass de quantification de la relation structure-activité-activité (PP-QSAAR) pour la prédiction directe de la toxicité de grand ensemble de composés. Le modèle développé s‟extrapole par la combinaison des valeurs de toxicité des espèces et les descripteurs moléculaires. Nous avons étudié un vaste ensemble de données sur la toxicité aiguë de cinq organismes aquatiques y compris des poissons, des Algues, d‟un crustacé, ainsi que Tetrahymenapyriformis et Vibriofischeri. Dans la deuxième partie de notre travail, nous avons proposé une approche de traitement de langage naturel basée sur l'intégration de réseaux de neurones profonds. Notre méthode vise à transformer le format Simplified Molecular Input Line Entry System en vecteurs d'embarquement de mots pour représenter la sémantique des composés. Ces vecteurs sont introduits dans des algorithmes d'apprentissage automatique supervisé tels que le réseau neuronal convolutif à mémoire de long-court terme, la machine à support vecteur et les forêts aléatoires pour construire des modèles QSAR sur des ensembles de données de la toxicité. Les résultats obtenus des IGC50 chez Tetrahymenapyriformis et les données aiguës chez le rat exprimées en (DL50) montrent que notre approche peut être utilisée pour prédire efficacement les activités de composés chimiques.
Description
Keywords
Citation