Salut,
le but de mon projet est de étudier un des processus de texte mining qui est reposé sur le traitement linguistique et précisément l'identification automatique de la langue par le clustering de texte en utilisons la méthode de carte auto organisatrice de kohonen,Les technologies du data mining consistent en tous procédés qui va permettre de brasser, trier et analyser des tera-bytes de données afin d’en extraire l’information cruciale, donc nombre de données important nécessitera de les réunir toutes sous une seule et même architecture appelée « data warehouse » ou entrepôts de données, avant de leur appliquer les technologies de data mining [SUL ,02].
Généralement, la fouille des textes a été regardée comme prolongation normale de la fouille des données « data mining » (Hearst, 2003, 1999). Cela explique le fait que l’avènement du text mining soit basé sur la progression du DATA MINING [EHR, 99].
. Cependant, à la différence de la fouille des données, qui se concentre sur des collections bien structurées qui existent dans les bases de données relationnelles ou les entrepôts des données « DATA WAREHOUSE ». Le text mining s’intéresse aux données qui sont moins structurées.
Les techniques du data mining suppose que l'information extraite est déjà sous forme de base des données relationnelles. Malheureusement, pour beaucoup d'applications, l'information électronique est seulement disponible sous forme de documents de langage naturel non structurés plutôt que des bases de données structurées. La solution est de transformer un corpus des documents textuels en base des données plus structurée, suggérant de ce fait un rôle évident qui peut être joué dans le text mining une fois combiné avec des méthodes standards de data mining.
alors si ta besoin de quelque chose à-propos de text mining je suis la .