
Novel Text Mining Methods and Applications
Nahezu 80 % aller Daten werden in der realen Welt erzeugt, wodurch eine große Menge unstrukturierter Daten entsteht. Diese unstrukturierten Daten erfordern im Gegensatz zu organisierten, in Datenbanken gespeicherten Daten komplexe Verarbeitungsmethoden.
Text Mining ist eine wirksame Methode zur Wissensextraktion und Entscheidungsfindung, da sie die Umwandlung unstrukturierter Texteingaben in ein strukturiertes Format umfasst. Klassifizierung, Clustering, Assoziationsregel-Mining, Themenerkennung und Zusammenfassung sind die wichtigsten Text Mining-Aufgaben. In diesem Buch werden modernste Text Mining-Techniken und -Anwendungen untersucht, z.
B. Kundenbeziehungsmanagement, Analyse sozialer Netzwerke, Finanzmarktprognosen und Dokumentenklassifizierung.
Die Dokumentenklassifizierung, die Programme wie Phishing-, Malware- und Spam-Erkennung umfasst, ist eine der schwierigsten Herausforderungen bei der Textklassifizierung. Das Buch schlägt brandneue hybride Modelle für die Dokumentenkategorisierung vor, die sowohl für binäre Klassen als auch für Ein-Klassen-Probleme funktionieren, wie OCSVM-LSI, PCA-OCSVM und LDA-CARM. Die schwierige Aufgabe der Börsenprognose, die von unstrukturierten Nachrichtendaten abhängt, wird in diesem Buch ebenfalls behandelt.
Das vorgeschlagene Modell prognostiziert Aktienkurse unter Verwendung einer Vielzahl von Regressionsansätzen, darunter GMDH, GRNN, MLP, RPART, SVR, RF und QRRF. Das Buch bietet aufschlussreiche Informationen über die Einsatzmöglichkeiten von Text Mining und wie man damit gute Entscheidungen trifft.