La recommandation via l’analyse d’opinions
No Thumbnail Available
Date
2017
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Abstract
Les avis des clients sur les produits jouent un rôle primordial dans la décision du client
d'acheter un produit ou d'utiliser un service. Les préférences et opinions des clients sont
influencées par les avis des autres en ligne, sur les blogs ou sur les réseaux sociaux.
Actuellement, les systèmes de recommandation ont été largement utilisés dans de nombreux
sites de commerce électronique afin d’aider les utilisateurs à faire face au problème de
surcharge d'informations. Les systèmes de recommandation fournissent des recommandations
personnalisées aux utilisateurs et, par conséquent, aident à prendre de bonnes décisions
concernant le produit à acheter parmi le vaste choix de produits proposés.
La prise en compte des opinions des utilisateurs dans les systèmes de recommandation est
une nouvelle voix de recherche. Cela justifie l'importance croissante de l'analyse du sentiment
et précisément le domaine de la classification des opinions. Le classifieur de Séparateurs à
Vaste Marge représente la technique de classification la plus sollicitée dans ce domaine grâce
à ses résultats encourageants. Cette technique est précédée par une phase importante
d’extraction de multiples caractéristiques afin de représenter les textes de commentaires.
En fouille d’opinions, les systèmes de détection de polarité ont prouvé leur efficacité avec
des vecteurs de taille restrictive. Ainsi, la réduction du vecteur de caractéristiques peut altérer
les performances du système en supprimant celles qui sont pertinentes, notre idée est d'utiliser
l'algorithme de sous espaces aléatoires ou Random Sub Space pour générer plusieurs vecteurs
de caractéristiques de taille limitée ; tout en remplaçant le classifieur de base de Random Sub
Space qui est l’arbre de décision par un autre plus précis qui est le classifieur des Séparateurs à
Vaste Marge. De ce fait, chacun des sous-ensembles de caractéristiques générés sera l'entrée
d'un classifieur individuel. Malgré les résultats encourageants obtenus de cette approche
proposée, une autre proposition a été implémentée afin d'améliorer l'approche précédente en
introduisant les algorithmes génétiques comme générateur de sous-ensembles de
caractéristiques avec une fonction fitness basée sur des critères de corrélation pour éliminer la
sélection aléatoire du Random Sub Space et empêcher l’utilisation des sous- ensembles de
caractéristiques incohérente.
À partir de l'analyse de l'influence des caractéristiques, nous avons pu proposer de
nouvelles caractéristiques sémantiques pour améliorer le processus de détection de polarité. Ces
caractéristiques s'inspirent du discours arabe et des relations rhétoriques. Compte tenu de
l'importance des unités de phrase dans la langue arabe et des études linguistiques, nous avons
sélectionné les marqueurs des unités et les relations les plus courantes pour calculer les
caractéristiques proposées. Ces dernières ont été adoptées essentiellement pour représenter les
opinions dans la phase de classification, afin de calculer les scores de polarité des opinions
filtrées par le système de filtrage collaboratif dans le but de générer des recommandations
pertinentes.