Statistische Methoden für die Annotationsanalyse

Originaltitel:

Statistical Methods for Annotation Analysis

Inhalt des Buches:

Die Kennzeichnung von Daten ist eine der grundlegendsten Tätigkeiten in der Wissenschaft und bildet seit Jahrzehnten die Grundlage für die Praxis, insbesondere in der Medizin, sowie für die Forschung in der Korpuslinguistik, zumindest seit der Entwicklung des Brown-Korpus. Mit der Verlagerung hin zum maschinellen Lernen in der künstlichen Intelligenz (KI) ist die Erstellung von Datensätzen für das Training und die Bewertung von KI-Systemen, in der KI auch als Korpora bezeichnet, ebenfalls zu einer zentralen Tätigkeit in diesem Bereich geworden.

Frühe KI-Datensätze wurden ad-hoc erstellt, um spezifische Probleme zu lösen. Als größere und wiederverwendbare Datensätze erstellt wurden, die größere Investitionen erforderten, entstand der Bedarf an einem systematischeren Ansatz zur Erstellung von Datensätzen, um eine höhere Qualität zu gewährleisten. Es wurde eine Reihe statistischer Methoden übernommen, die häufig, aber nicht ausschließlich, aus den medizinischen Wissenschaften stammen, um sicherzustellen, dass die verwendeten Bezeichnungen nicht subjektiv sind, oder um zwischen verschiedenen von den Codierern gelieferten Bezeichnungen zu wählen.

Eine breite Palette solcher Methoden wird heute regelmäßig eingesetzt. Dieses Buch soll einen Überblick über die am weitesten verbreiteten dieser statistischen Methoden zur Unterstützung der Annotationspraxis geben.

Soweit den Autoren bekannt ist, ist dies das erste Buch, das versucht, die beiden weit verbreiteten Methodenfamilien abzudecken. Die erste Methodenfamilie befasst sich mit der Entwicklung von Kennzeichnungsschemata und insbesondere mit der Sicherstellung, dass diese Schemata so beschaffen sind, dass eine ausreichende Übereinstimmung zwischen den Kodierern festgestellt werden kann.

Die zweite Familie umfasst Methoden, die entwickelt wurden, um die Ergebnisse der Codierer zu analysieren, sobald das Schema vereinbart wurde, insbesondere, wenn auch nicht ausschließlich, um die wahrscheinlichste Bezeichnung für ein Element unter den von den Codierern gelieferten zu ermitteln. Der Schwerpunkt dieses Buches liegt in erster Linie auf der natürlichen Sprachverarbeitung, dem Bereich der künstlichen Intelligenz, der sich mit der Entwicklung von Modellen der Sprachinterpretation und -produktion befasst, aber viele, wenn nicht sogar die meisten der hier behandelten Methoden sind auch auf andere Bereiche der künstlichen Intelligenz oder sogar auf andere Bereiche der Datenwissenschaft anwendbar.

Weitere Daten des Buches:

ISBN:	9783031037535
Autor:	Silviu Paun
Verlag:	Springer International Publishing AG
Sprache:	Englisch
Einband:	Taschenbuch
Erscheinungsjahr:	2022
Seitenzahl:	197

Kauf:

Derzeit verfügbar, auf Lager.

Statistische Methoden für die Annotationsanalyse

Originaltitel:

Inhalt des Buches:

Weitere Daten des Buches:

Kauf:

Weitere Bücher des Autors:

Die Werke des Autors wurden von folgenden Verlagen veröffentlicht: