Molecular modeling of biologically active molecules using different theoretical approaches
No Thumbnail Available
Date
2021
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Abstract
Au cours de la dernière décennie, le développement rapide des techniques biologiques
et chimiques tel que le criblage à haut débit et la synthèse parallèle a considérablement
augmenté la quantité des données, ce qui nécessite la création et l'intégration de nouvelles
méthodes analytiques et techniques d'apprentissage automatique. L'objectif principal de la
première partie de cette thèse était de développer un modèle Auto Pass-Pass de quantification
de la relation structure-activité-activité (PP-QSAAR) pour la prédiction directe de la toxicité
de grand ensemble de composés. Le modèle développé s‟extrapole par la combinaison des
valeurs de toxicité des espèces et les descripteurs moléculaires. Nous avons étudié un vaste
ensemble de données sur la toxicité aiguë de cinq organismes aquatiques y compris des
poissons, des Algues, d‟un crustacé, ainsi que Tetrahymenapyriformis et Vibriofischeri. Dans
la deuxième partie de notre travail, nous avons proposé une approche de traitement de langage
naturel basée sur l'intégration de réseaux de neurones profonds. Notre méthode vise à
transformer le format Simplified Molecular Input Line Entry System en vecteurs
d'embarquement de mots pour représenter la sémantique des composés. Ces vecteurs sont
introduits dans des algorithmes d'apprentissage automatique supervisé tels que le réseau
neuronal convolutif à mémoire de long-court terme, la machine à support vecteur et les forêts
aléatoires pour construire des modèles QSAR sur des ensembles de données de la toxicité. Les
résultats obtenus des IGC50 chez Tetrahymenapyriformis et les données aiguës chez le rat
exprimées en (DL50) montrent que notre approche peut être utilisée pour prédire efficacement
les activités de composés chimiques.