Praktische synthetische Datengenerierung: Abwägung zwischen Datenschutz und breiter Verfügbarkeit von Daten

Bewertung:   (3,8 von 5)

Praktische synthetische Datengenerierung: Abwägung zwischen Datenschutz und breiter Verfügbarkeit von Daten (El Emam Khaled)

Leserbewertungen

Zusammenfassung:

Das Buch erfüllt nicht die Erwartungen von Lesern, die nach einer technischen Ressource suchen, insbesondere im Bereich des maschinellen Lernens, da es an praktischen Anwendungen, Programmierbeispielen und substantiellen Inhalten mangelt.

Vorteile:

Der Autor scheint im Vergleich zu diesem Buch großes Vertrauen in seine eigene Arbeit zu haben, was darauf hindeutet, dass er glaubt, dass seine eigene Ressource viel umfassender und wertvoller ist.

Nachteile:

Das Buch ist nicht technisch, enthält keinen Code oder Formeln, hat nur wenige Verweise, ist mit 145 Seiten kurz und enthält große, uninformative Bilder und ist nicht für Praktiker des maschinellen Lernens geeignet.

(basierend auf 1 Leserbewertungen)

Originaltitel:

Practical Synthetic Data Generation: Balancing Privacy and the Broad Availability of Data

Inhalt des Buches:

Der Aufbau und das Testen von Modellen des maschinellen Lernens erfordert den Zugang zu großen und vielfältigen Daten. Aber wo kann man brauchbare Datensätze finden, ohne dass es zu Problemen mit dem Datenschutz kommt? Dieses praktische Buch stellt Techniken zur Generierung synthetischer Daten vor - also gefälschter Daten, die aus realen Daten generiert werden -, damit Sie Sekundäranalysen durchführen können, um zu forschen, das Kundenverhalten zu verstehen, neue Produkte zu entwickeln oder neue Einnahmen zu generieren.

Datenwissenschaftler lernen, wie die Generierung synthetischer Daten eine Möglichkeit bietet, solche Daten für sekundäre Zwecke breit verfügbar zu machen und gleichzeitig viele Datenschutzbedenken zu berücksichtigen. Analysten lernen die Grundsätze und Schritte zur Erzeugung synthetischer Daten aus realen Datensätzen kennen. Und Führungskräfte aus der Wirtschaft werden sehen, wie synthetische Daten dazu beitragen können, die Zeit bis zur Einführung eines Produkts oder einer Lösung zu verkürzen.

Dieses Buch beschreibt:

⬤ Schritte zur Erzeugung synthetischer Daten unter Verwendung multivariater Normalverteilungen.

⬤ Methoden zur Verteilungsanpassung, die verschiedene Anpassungsgüte-Metriken abdecken.

⬤ Wie man die einfache Struktur der Originaldaten repliziert.

⬤ Ein Ansatz zur Modellierung der Datenstruktur, um komplexe Beziehungen zu berücksichtigen.

⬤ Mehrere Ansätze und Metriken, die Sie zur Bewertung des Datennutzens verwenden können.

⬤ Wie Analysen, die mit echten Daten durchgeführt wurden, mit synthetischen Daten repliziert werden können.

⬤ Auswirkungen synthetischer Daten auf den Datenschutz und Methoden zur Bewertung der Offenlegung von Identitäten.

Weitere Daten des Buches:

ISBN:9781492072744
Autor:
Verlag:
Einband:Taschenbuch
Erscheinungsjahr:2020
Seitenzahl:175

Kauf:

Derzeit verfügbar, auf Lager.

Ich kaufe es!

Weitere Bücher des Autors:

Anonymisierung von Gesundheitsdaten: Fallstudien und Methoden für den Einstieg - Anonymizing Health...
Dieses praktische Buch wurde im August 2014...
Anonymisierung von Gesundheitsdaten: Fallstudien und Methoden für den Einstieg - Anonymizing Health Data: Case Studies and Methods to Get You Started
Praktische synthetische Datengenerierung: Abwägung zwischen Datenschutz und breiter Verfügbarkeit...
Der Aufbau und das Testen von Modellen des...
Praktische synthetische Datengenerierung: Abwägung zwischen Datenschutz und breiter Verfügbarkeit von Daten - Practical Synthetic Data Generation: Balancing Privacy and the Broad Availability of Data

Die Werke des Autors wurden von folgenden Verlagen veröffentlicht: