Sprache ist nicht nur das wichtigste Medium zwischenmenschlicher Kommunikation, sondern ist auch für sprachgesteuerte Mensch-Maschine-Schnittstellen von großer Bedeutung. In beiden Fällen spielt die Signalverarbeitung in den technischen Anwendungen eine große Rolle. Das Institut für Kommunikationsakustik arbeitet intensiv an Projekten im Bereich der Sprach- und Audiosignalverarbeitung, des maschinellen Lernens, und der Hörforschung. Studierenden bietet sich die Möglichkeit, im Rahmen von Studien- Bachelor- und Masterarbeiten diesen Projekten beizutragen und somit neue Technologien aktiv zu gestalten.
Das Forschungsgebiet umfasst eine Reihe von Aufgabenfeldern, u.a. die
- Musiksignalverarbeitung für Cochlea-Implantate
- Melodieerkennung bei Cochlea-Implantat Nutzern
- Der Schutz der Privatsphäre in akustischen Sensornetzen
- Verbesserung gestörter Sprachsignale
- Statistische Modellierung von Sprach- und Audiosignalen
- Quellenlokaliation und Quellentrennung
- Robuste Sprachübertragung und Voice over IP
- Auditive virtuelle Umgebung
- Schätzung der Sprachverständlichkeit
Bild 1 zeigt, wie die Algorithmen der Sprachsignalverarbeitung z. B. in einem Smart-Phone
zusammenwirken. Das akustische Sprachsignal wird von mehreren
zu einem Mikrofonarray zusammengeschalteten Mikrofonen aufgenommen.
Das Mikrofonarray erlaubt eine richtungsabhängige Selektion
der Nutzsignalanteile und eine Unterdrückung störender
Geräusche. Es erfordert in der Regel a priori Wissen
über die Sprecherposition und kann mit einer automatischen
Sprecherlokalisation kombiniert werden. Ferner können
auch so genannte "blinde" Verfahren eingesetzt werden,
die ohne Kenntnis der Positionen eine Trennung der Quellen
herbeiführen.
Bild 1: Algorithmen der Sprachkommunikation
Mit dem Mikrofonarray wird häufig eine Geräuschreduktion (Trennung von Nutz- und Störschall aufgrund statistischer Merkmale) und eine Echokompensation verbunden. Das so aufbereitete Signal wird nun entweder komprimiert, mit Fehlerschutz versehen und übertragen (z. B. über einen Mobilfunkkanal) oder aber einer sprachgesteuerten Mensch-Maschine-Schnittstelle zugeführt.