PBi_Textmining en NLP

Met de komst van grote hoeveelheden ongestructureerde data werd de roep naar methoden om deze data te analyseren steeds groter. Textmining en natural language processing (NLP) houdt zich bezig het verkrijgen van informatie uit teksten. Woorden of groepen van woorden worden geclassificeerd als variabelen om bijvoorbeeld het sentiment te bepalen en te voorspellen.

De moeilijkheid van tekstmining is het omgaan met frequente en niet frequente woorden, net zoals met de meervoudige betekenis van woorden. Om dit probleem op te lossen zijn er allerlei algoritmen ontwikkeld.