
Analysing Language, Sex and Age in a Corpus of Patient Feedback
Dieses Element untersucht Ansätze zur Lokalisierung und Untersuchung sozialer Identität in Korpora mit und ohne Hilfe von demografischen Metadaten.
Dies ist ein zentrales Anliegen in korpusgestützten Studien zu Sprache und Identität, und dieses Element soll die wichtigsten Herausforderungen und Möglichkeiten, die mit beiden Ansätzen verbunden sind, untersuchen und aufzeigen, was beide Ansätze zeigen können (und was nicht). Es werden zwei Fallstudien beschrieben, die jeweils zwei Ansätze für soziale Identitätsvariablen - Geschlecht und Alter - in einem Korpus von 14 Millionen Wörtern von Patientenkommentaren über NHS-Krebsdienste in England vergleichen.
Beim ersten Ansatz werden demografische Tags verwendet, um die Kommentare nach Geschlecht/Alter der Patienten zu gruppieren, während beim zweiten Ansatz die Fälle kategorisiert werden, in denen die Patienten ihr Geschlecht/Alter in ihren Kommentaren offenlegen. Dieses Element vergleicht die Ergebnisse beider Ansätze, wobei die Ansätze selbst kritisch im Hinblick auf ihre Auswirkungen auf korpusgestützte Studien zu Sprache und Identität diskutiert werden.