Fork me on GitHub

Library NLPTools

Introduction

Powered by

Cette bibliothèque fournit un ensemble d'outils basés sur le projet Apache OpenNLP pour identifier des entités telles que des noms de personnes dans un texte donné. Certaines de ces fonctionnalités peuvent être utilisées pour rendre anonymes les données dans un texte en supprimant les noms et les courriels par exemple.

Build

Cette bibliothèque fournit une interface de ligne de commande pour anonymiser un texte.

Pour construire le jar exécutable, lancer la commande suivante

                        mvn assembly
                    

Usage

Le programme en ligne de commandes se lance de la manière suivante.

                        java -jar java -jar nlpanonymizer.jar <file_name>