Sprechertrennung / Separation of Speech Sources
Problembeschreibung und Aufgabenstellung
In vielen Anwendungen der Sprachkommunikation werden gleichzeitig mehrere Sprachsignale aufgenommen, von denen zumeist nur eines erwünscht ist, während die übrigen als störend empfunden werden und deshalb unterdrückt werden sollen.
Ein Hörgeräteträger möchte beispielsweise auf einer Party gezielt seinem Gesprächspartner zuhören, obwohl die Mikrofone der Hörgeräte auch die Sprache der übrigen Gäste aufnehmen, ein Sprachassistenzsystem soll Befehle und Anfragen möglichst fehlerfrei verstehen, auch wenn im Hintergrund Kinder spielen oder ein Fernseher läuft, und auch bei der Freisprechkommunikation mit einem Mobiltelefon soll mein Gesprächspartner vor allem meine Stimme hören und nicht sein eigenes Echo, welches vom Lautsprecher in das Mikrofon zurückgekoppelt wird.
In all diesen Fällen kann die Signalverarbeitung im Zusammenspiel mit Verfahren des maschinellen Lernens genutzt werden, um das gewünschte Sprachsignal von den übrigen Sprachsignalen zu trennen. In studentischen Arbeiten werden entsprechende Verfahren aus der wissenschaftlichen Literatur oder den aktuellen Forschungsarbeiten am Lehrstuhl durch Studierende erarbeitet und implementiert, um sie dann zu bewerten und weiterzuentwickeln.
Werkzeuge und Methoden
Bearbeitet werden die Aufgaben überwiegend in Matlab / Simulink, wobei auch eine Entwicklung in z.B. Python in einigen Arbeiten sinnvoll sein kann. Methodisch bilden Verfahren der digitalen und statistischen Signalverarbeitung (z.B. schnelle Faltung, Schätzverfahren) die Grundlage. Darüber hinaus können Methoden aus dem Bereich des maschinellen Lernens (z.B. neural networks, deep learning) oder adaptive Filter zum Einsatz kommen.
Beispiele abgeschlossener Arbeiten zur Sprechertrennung
- Echtzeitsimulation akustischer Echos in der Mobilkommunikation (Praxisprojekt)
- Untersuchung zu Problemen und Lösungsstrategien in der stereophonen Echokompensation (Bachelorarbeit)
- Models and Algorithms for Nonlinear Acoustic System Identification (Masterarbeit)
- ...
Ansprechpartner:
Prof. Dr.-Ing. Rainer Martin |
ID 2 / 233 |
0234 / 32 22595 |
rainer.martin@rub.de |