
Noise Filtering for Big Data Analytics
In diesem Buch wird erklärt, wie man Daten in großem Umfang mit zufriedenstellender Genauigkeit entrauschen kann.
Es werden drei Hauptthemen behandelt. Erstens, wie man die Fehlerfortpflanzung von einer Stufe zur nächsten eliminiert, während man ein gefiltertes Modell entwickelt.
Zweitens: Wie kann die Bedeutung der Position der Daten bei der Bereinigung beibehalten werden? Und schließlich ist die Erhaltung des Gedächtnisses in den Daten entscheidend für die Extraktion intelligenter Daten aus verrauschten Big Data. Wenn sich nach der Anwendung irgendeiner Form der Glättung oder Filterung das Gedächtnis der entsprechenden Daten stark verändert, können die endgültigen Daten einige wichtige Informationen verlieren. Dies kann zu falschen oder fehlerhaften Schlussfolgerungen führen.
Wenn man jedoch einen Informationsverlust durch Glättung oder Filterung voraussieht, kommt man um den Prozess der Entrauschung nicht herum, da andererseits jede Art von Analyse großer Daten in Gegenwart von Rauschen irreführend sein kann. Der gesamte Prozess erfordert also eine sehr sorgfältige Ausführung mit effizienten und intelligenten Modellen, um ihn effektiv zu bewältigen.