Abstract:
Le courrier électronique rend vraiment service aux usagers, c'est un moyen rapide et
économique pour échanger des informations. Cependant, les utilisateurs se retrouvent assez vite
submergés de quantités de messages indésirables appelés aussi spam. Le spam est rapidement
devenu un problème majeur sur Internet. Dans le cadre de notre travail, la classification des
courriers électronique est effectuée à l'aide des algorithmes d'apprentissage automatique,
l'efficacité de ces classificateurs est testé avec des différentes représentations en utilisant le
corpus qui nous avons créé. Nous avons crié un modèle de filtrage des spams Arabe à base de
NLP, qui prédit l'origine d'un message d'entrée avec une précision de 95%. Grâce à l'utilisation
de machine learning, des solutions efficaces peuvent être réalisées en vue de renforcer la
capacité de détection des systèmes de détection des spams Arabe. Les résultats des tests
montrent que DecisionTreeClassifier est plus performant par rapport aux algorithmes NB et
KNN et SVM.