
Natural Language Interfaces to Data
Natürlichsprachliche Schnittstellen bieten eine einfache Möglichkeit, Daten abzufragen und mit ihnen zu interagieren, und ermöglichen es technisch nicht versierten Benutzern, Datensätze zu untersuchen, ohne eine Abfragesprache beherrschen zu müssen. Jüngste Fortschritte beim Verstehen und Verarbeiten natürlicher Sprache haben zu einem neuen Interesse an natürlichsprachlichen Schnittstellen zu Daten geführt.
Die größten Herausforderungen bei der Abfrage in natürlicher Sprache sind die Identifizierung der Entitäten, die an der Benutzeräußerung beteiligt sind, die sinnvolle Verknüpfung der verschiedenen Entitäten über die zugrunde liegende Datenquelle, um die Absichten des Benutzers zu interpretieren, und die Erstellung einer strukturierten Abfrage. In der Literatur gibt es zwei Hauptansätze für die Interpretation von natürlichsprachlichen Abfragen eines Benutzers. Zum einen gibt es regelbasierte Systeme, die semantische Indizes, Ontologien und Wissensgraphen nutzen, um die Entitäten in der Abfrage zu identifizieren, die beabsichtigten Beziehungen zwischen diesen Entitäten zu verstehen und Grammatiken zur Generierung der Zielabfragen zu verwenden.
Zweitens gibt es hybride Ansätze, die sowohl regelbasierte Techniken als auch Deep-Learning-Modelle verwenden. Konversationsschnittstellen sind der nächste natürliche Schritt zur einmaligen Abfrage natürlicher Sprache, indem der Abfragekontext zwischen mehreren Gesprächsrunden für die Disambiguierung genutzt wird.
In dieser Monografie geben die Autoren einen Überblick über die regelbasierten und hybriden Technologien, die in natürlichsprachlichen Schnittstellen verwendet werden, und über die verschiedenen Ansätze zur Abfrage natürlicher Sprache. Sie beschreiben auch konversationelle Schnittstellen für die Datenanalyse und diskutieren mehrere Benchmarks, die für die Erforschung und Bewertung natürlichsprachlicher Abfragen verwendet werden.
Die Monographie schließt mit einer Diskussion über die Herausforderungen, die bewältigt werden müssen, bevor diese Systeme auf breiter Basis eingesetzt werden können.