Bewertung:

Das Buch hat gemischte Kritiken erhalten. Einige Leser halten es für sehr wertvoll für das Verständnis und die Implementierung von Textanalysen im Data Warehousing, andere kritisieren, dass es veraltet ist und es ihm an Tiefe fehlt.
Vorteile:⬤ Bietet klare Erklärungen von Textanalysekonzepten und erleichtert so die Kommunikation mit dem Management.
⬤ Bietet neue Einblicke in Speicher- und Indizierungsstrategien, die für Data-Warehouse-Teams von Vorteil sind.
⬤ Enthält wertvolle Ideen, die den Umgang mit Daten und die Verwaltungspraktiken verbessern können.
⬤ Einige Leser fanden das Buch überteuert und es fehlte an nützlichen Informationen.
⬤ Kritik an den sich wiederholenden Inhalten und dem Rückgriff auf veraltete Konzepte des traditionellen Data Warehousing.
⬤ Andere bemängelten die Unfähigkeit des Autors, unstrukturierte Daten effektiv zu behandeln, und bezeichneten das Buch als voll von Jargon und Geschwätz.
(basierend auf 6 Leserbewertungen)
Building the Unstructured Data Warehouse: Architecture, Analysis, and Design
Lernen Sie von der Data-Warehouse-Legende Bill Inmon, wie Sie die Berichtsumgebung aufbauen, die Ihr Unternehmen jetzt braucht
Die Antworten auf viele wichtige geschäftliche Fragen sind im Text versteckt. Wie gut kann Ihre bestehende Berichterstattungsumgebung den erforderlichen Text aus E-Mails, Tabellenkalkulationen und Dokumenten extrahieren und ihn in ein für Analysen und Berichte nützliches Format bringen? Die Umwandlung eines herkömmlichen Data Warehouse in ein effizientes unstrukturiertes Data Warehouse erfordert zusätzliche Fähigkeiten von Analysten, Architekten, Designern und Entwicklern. Dieses Buch bereitet Sie darauf vor, ein unstrukturiertes Data Warehouse erfolgreich zu implementieren. Anhand von klaren Erklärungen, Beispielen und Fallstudien lernen Sie neue Techniken und Tipps zur erfolgreichen Erfassung und Analyse von Text.
Meistern Sie diese zehn Ziele:
⬤ Aufbau eines unstrukturierten Data Warehouse mit Hilfe des 11-Schritte-Ansatzes.
⬤ Integrieren Sie Text und beschreiben Sie ihn hinsichtlich Homogenität, Relevanz, Medium, Volumen und Struktur.
⬤ Überwinden Sie Herausforderungen wie Geschwätz, den Turmbau zu Babel und das Fehlen von natürlichen Beziehungen.
⬤ Vermeiden Sie den Datenschrottplatz und bekämpfen Sie das "Spinnennetz".
⬤ Wiederverwendung von Techniken, die im traditionellen Data Warehouse und Data Warehouse 2. 0, einschließlich iterativer Entwicklung.
⬤ Anwendung grundlegender Techniken für das Extrahieren, Transformieren und Laden von Text (ETL), wie z. B. Phrasenerkennung, Stoppwortfilterung und Synonymersatz.
⬤ Gestaltung des Dokumenteninventarsystems und Verknüpfung von unstrukturiertem Text mit strukturierten Daten.
⬤ Nutzen Sie Indizes für eine effiziente Textanalyse und Taxonomien für eine nützliche externe Kategorisierung.
⬤ Verwaltung großer Datenmengen mit Hilfe fortgeschrittener Techniken wie Rückwärtszeigern.
⬤ Evaluierung von Technologien, die für die Verarbeitung unstrukturierter Daten geeignet sind, wie z. B. Data-Warehouse-Anwendungen.