Bewertung:

Das Buch bietet einen breiten Überblick über die Verarbeitung von Sprach- und Audiosignalen, der als Lektüre nützlich ist, auch wenn es keine detaillierten mathematischen Techniken enthält.
Vorteile:Die Kapitel können unabhängig voneinander zugewiesen werden, ohne die Schüler zu verwirren; guter Überblick über die Sprachverarbeitung und verwandte Themen, einschließlich oft übersehener Bereiche wie Psychoakustik und Ohrphysiologie.
Nachteile:Es fehlt an detaillierten mathematischen Techniken; wird im Vergleich zu anderen, umfassenderen Quellen als überteuert empfunden.
(basierend auf 3 Leserbewertungen)
Speech Audio Signal Processing
Als Speech and Audio Signal Processing 1999 veröffentlicht wurde, hob es sich von seinen Mitbewerbern durch seinen Umfang und seinen zugänglichen, intuitiven Stil ab. Dieses Buch richtete sich an einzelne Studenten und Ingenieure, die sich für das breite Spektrum der Audioverarbeitung begeistern und die verfügbaren Techniken verstehen wollten. Seit der Einführung des iPod im Jahr 2001 hat sich der Bereich der digitalen Audio- und Musiktechnik explosionsartig entwickelt, was zu einem wesentlich größeren Interesse an den technischen Aspekten der Audiobearbeitung geführt hat.
In dieser zweiten Auflage wird das ursprüngliche Buch aktualisiert und überarbeitet, um es mit neuem Material zu ergänzen, das sowohl die Grundlagentechnologien der digitalen Musikdistribution (vor allem denMP3) als auch eine Reihe von aufregenden neuen Forschungsbereichen der automatischen Verarbeitung von Musikinhalten (wie z. B. automatische Transkription, Musikähnlichkeit usw.) beschreibt, die in den letzten fünf Jahren, angetrieben durch die digitale Musikrevolution, entstanden sind.
Zu den neuen Kapitelthemen gehören:
⬤ Psychoakustische Audiocodierung, die Beschreibung von MP3 und verwandten Audiocodierungsverfahren, die auf der psychoakustischen Maskierung von Quantisierungsgeräuschen basieren.
⬤ Musik-Transkription, einschließlich der automatischen Ableitung von Noten, Beats und Akkorden aus Musiksignalen.
⬤ Music Information Retrieval, in erster Linie mit Schwerpunkt auf audiobasierter Genreklassifizierung, Identifizierung von Künstlern/Stilen und Ähnlichkeitsschätzung.
⬤ Audio Source Separation, einschließlich Multi-Mikrofon-Beamforming, Blind Source Separation und die von der Wahrnehmung inspirierten Techniken, die gewöhnlich als Computational Auditory Scene Analysis (CASA) bezeichnet werden.