RWTH Aachen
University
Institute for Communication
Systems and Data Processing
Skip to content
Direkt zur Navigation
Home
Home

Publications – Details

HD-Voice-3D: Herausforderungen und Lösungen bei der Audiosignalverarbeitung

Authors:
Matthias Rüngeler, Hauke Krüger, Gottfried Behler, and Peter Vary
Book Title:
Workshop Audiosignal- und Sprachverarbeitung (WASP)
Venue:
Koblenz
Event Date:
20.-20.9.2013
Organization:
Gesellschaft für Informatik
Date:
Sept. 2013
Pages:
2972–2986
Note:
Workshop im Rahmen der 43. Jahrestagung der Gesellschaft für Informatik
Language:
German

Abstract

Der Übergang von Schmalband-Sprache zu Breitband-Sprache mit höherer Qualität - auch bezeichnet als HD-Voice - in öffentlichen Telefonnetzen war und ist (immer noch) ein steiniger Weg: Telekommunikationsanbieter fürchten zusätzliche Investitions- und Betriebskosten durch Einführung neuer Technologien mehr, als dass sie einen Vorteil in höherer Kommunikationsqualität im Kundensinne und damit Kundenzufriedenheit suchen.

Erst die Einführung von neuartigen Voice-over-Internet-Protocol (VoIP) Anwendungen im Zuge der weiten Verbreitung hochratiger Internetanschlüsse, in denen fast ausschliesslich HD-Voice-Technologie zum Einsatz kommt, scheint hier gerade einen Durchbruch zu schaffen, der zu einem Umdenken führt.

Aber was kommt nach HD-Voice? Wir denken, dass es HD-Voice-3D ist - auch bezeichnet als Binaurale Telefonie -, die den nächsten evolutionären Schritt darstellen wird. Dabei werden durch die Übertragung von Binauralsignalen anstatt monauraler Signale nicht nur die Inhalte von Sprache an sich, sondern auch die Atmosphäre und die akustische Umgebung realitätsnah von einem zum anderen Ende transportiert. Das Resultat ist das Gefühl, mit den Ohren des Kommunikationspartners zu hören - so als wäre man wirklich vor Ort. Der Vorteil bei HD-Voice-3D gegenüber einer Stereoübertragung liegt darin, dass nicht nur die Unterscheidung zwischen Signalen von links und rechts, sondern auch von oben, unten, hinten und vorne ermöglicht wird. Der Grund liegt in der binauralen Aufnahmetechnik, die durch Abschattungs-, Beugungs- und andere Filtereffekte an Korpus, Kopf und Ohren eine natürliche räumliche Klangwahrnehmung erreicht.

In Bezug auf die Sprach/Audiosignalverarbeitung muss bei der Binauralen Telefonie jedoch im Vergleich zur Signalverarbeitung bei der monauralen Telefonie einiges beachtet werden, um die sogenannten „Binauralen Cues“, also bestimmte Eigenschaften des binauralen Audiosignals die zu einem realistischen räumlichen Eindruck bei der Perzeption der übertragenen Signale führen, nicht zu zerstören.

In diesem Paper werden typische Funktionalitäten eines binauralen VoIP-Terminals vorgestellt, ihre Auswirkung auf Binauralsignale diskutiert und erste Lösungsansätze präsentiert. Weiter wird die Thematik mittels eines Echzeit-Demonstrators vertieft, der auf dem WASP-Event „HD-Voice-3D zum Anfassen“ vorgestellt werden soll.

Download of Publication

Copyright Notice

This material is presented to ensure timely dissemination of scholarly and technical work. Copyright and all rights therein are retained by authors or by other copyright holders. All persons copying this information are expected to adhere to the terms and constraints invoked by each author's copyright. In most cases, these works may not be reposted without the explicit permission of the copyright holder.

The following notice applies to all IEEE publications:
© IEEE. Personal use of this material is permitted. However, permission to reprint/republish this material for advertising or promotional purposes or for creating new collective works for resale or redistribution to servers or lists, or to reuse any copyrighted component of this work in other works must be obtained from the IEEE.

File

ruengeler2013c.pdf 17172 K