Sehr geehrte Abonnenten des Kolloquium-Newsletters,
gerne informieren wir Sie über den nächsten Termin unseres
Kommunikationstechnischen Kolloquiums.
*Donnerstag, 31. Oktober 2019*
*Vortragender:* Henrik Jansen
*Ort:* Hörsaal 4G IKS
*Zeit:* 14:00 Uhr
*Bachelor-Vortrag:* Optimierung und Vergleich von Verfahren zur
Übersprechkompensation im Frequenzbereich
Bei der Reproduktion von Binauralsignalen über zwei Lautsprecher muss
das Prinzip der Übersprechkompensation angewendet werden, um das
Binauralsignal gehörrichtig wiederzugeben. Das Prinzip beschreibt eine
Vorfilterung des Binauralsignals, um den jeweiligen Kanal im Idealfall
durch die Wiedergabe über den rechten bzw. linken Lautsprecher am
rechten bzw. linken Ohr perfekt zu reproduzieren. Die Übersprechanteile
vom linken bzw. rechten Lautsprecher zum rechten bzw. linken Ohr sollen
dabei vollständig eliminiert werden. Traditionelle Verfahren zur
Übersprechkompensation versuchen dies, unter zusätzlichen
Randbedingungen, bestmöglich umzusetzen.
Das Ziel dieser Arbeit ist es, den traditionellen Ansatz unter
Berücksichtigung der psychoakustischen Maskierung in Bezug auf die
Übersprechanteile zu erweitern und den Einfluss dieser Erweiterung zu
untersuchen. Die Idee ist, dass die Übersprechanteile durch die
Filterung nicht mehr vollständig eliminiert, sondern nur noch unter die
Simultanmaskierungsschwelle des am jeweiligen Ohr anliegenden
Direktsignalanteils gebracht werden. Um dies zu realisieren, wird
aufbauend auf einer mathematischen Modellierung des
Übersprechkompensationssystems und einer Beschreibung der traditionellen
Verfahren im Frequenzbereich, ein entsprechendes erweitertes Verfahren
entwickelt. Den Kern dieses erweiterten Verfahrens bildet die
Formulierung eines konvexen Optimierungsproblems zur Auslegung der
Überspechkompensationsfilter unter der obigen Bedingung.
Weiterhin wurde das erweiterte Verfahren in Bezug auf seine Parameter
analysiert und mit den traditionellen Verfahren verglichen. Es wurde
erkannt, dass die Berücksichtigung des Maskierungseffekts zur
Verbesserung des Systems genutzt werden kann, diese Verbesserung jedoch
nur für schlecht konditionierte Problemfälle oder eine hohe Begrenzung
der Filterverstärkungen im Frequenzbereich signifikant ist. In Bezug auf
die Echtzeitfähigkeit des erweiterten Verfahrens wurde festgestellt,
dass dieses grundsätzlich für eine Echtzeitanwendung geeignet sein
könnte, das traditionelle Invertierungsverfahren im Frequenzbereich in
dieser Hinsicht jedoch immer noch das effektivste Verfahren darstellt.
Alle Interessierten sind herzlich eingeladen, eine Anmeldung ist nicht
erforderlich.
Allgemeine Informationen zum Kolloquium, sowie eine aktuelle Liste der
Termine des Kommunikationstechnischen Kolloquiums finden Sie unter
http://www.iks.rwth-aachen.de/aktuelles/kolloquium/
--
Irina Ronkartz
Institute of Communication Systems (IKS)
RWTH Aachen University
Muffeter Weg 3a, 52074 Aachen, Germany
+49 241 80 26958 (phone)
ronkartz(a)iks.rwth-aachen.de
http://www.iks.rwth-aachen.de/
Sehr geehrte Abonnenten des Kolloquium-Newsletters,
gerne informieren wir Sie über die nächsten Termine unseres
Kommunikationstechnischen Kolloquiums.
*Dienstag, 22. Oktober 2019**
**Vortragender:* Maximilian Tillmann
*Ort:* Hörsaal 4G IKS
*Zeit:* 10:15 Uhr
*Bachelor-Vortrag:* Sprachverbesserung durch robustes Beamforming auf
Basis geschätzter Mikrofonpositionen
Der Freisprechmodus ist bei der Sprachsteuerung oder bei der
Sprachkommunikation ein häufiger Anwendungsfall. Bei einem großen
Abstand des Sprechers zur Aufnahmeeinheit im Freisprechmodus ist das
Signal-Rausch-Verhältnis am Mikrofon in der Regel klein. Daher werden
für diese Anwendungen gewöhnlich mehrere Mikrofone als Beamformer
betrieben, um das Sprachsignal des Sprechers zu verstärken.
Ziel dieser Arbeit ist es, verschiedene Mikrofonarrays mit gestörten
Mikrofonpositionen, also einer Abweichung der tatsächlichen Positionen
und der dem Beamformer bekannten Positionen, als Beamformer zu betreiben
und deren Robustheit bezüglich dieser Störungen zu untersuchen. Als
allgemeines Bewertungskriterium dafür wird der Gewinn, also ein Maß für
die Richtwirkung des Beamformers, berechnet. Es wird ein superdirektiver
Beamformer (MVDR-Beamformer) betrachtet, bei dem der Entwurfsparameter
/µ /ein zentraler Parameter ist. Hiermit kann ein Kompromiss zwischen
dem maximal erreichbaren Gewinn und der Robustheit eingestellt werden.
Es ist das Ziel, /µ /so auszuwählen, dass der mittlere Gewinn im Fall
einer Störung maximiert wird.
Es konnte gezeigt werden, dass es einen Unterschied macht, ob die
Fehler, bei den Mikrofonplatzierungen oder bei den beamformer-bekannten
Positionen auftreten. Störungen der beamformer-bekannten Positionen
führen zu einer höheren Robustheit als Störungen in den
Mikrofonplatzierungen.
Weiterhin wurde die Robustheit bei Verwendung eines Geometrie-Schätzers
untersucht. Zusätzlich wurde hier eine frequenzabhängige Optimierung von
/µ /vorgenommen. Dabei zeigte sich jedoch, dass bei großen Störungen die
Fehlerverteilung bei den Schätzfehlern des Geometrie-Schätzers von einer
Normalverteilung stark abwich und dadurch das verwendete
Optimierungsverfahren zur Wahl von /µ /nicht mehr sinnvoll eingesetzt
werden konnte. Bei kleineren Schätzfehlern erwies sich das verwendete
Verfahren zur Optimierung von /µ /jedoch als sinnvoll.
*Dienstag, 22. Oktober 2019*
*Vortragende:* Rebecca Pelke
*Ort:* Hörsaal 4G IKS
*Zeit: *11:15 Uhr
*Bachelor-Vortrag*: Modellierung von Kleinstlautsprechern für die
akustische Echokompensation in Mobiltelefonen
Bei der Kommunikation im Freisprechmodus über mobile Geräte, wie
beispielsweise Smartphones, werden akustische Echos als sehr störend
empfunden. Die Aufgabe der Echokompensation ist es, die Übertragung
zwischen Lautsprecher und Mikrofon herauszufiltern. Dies gelingt nur,
wenn sowohl das Verhalten des Lautsprechers als auch das Verhalten der
akustischen Umgebung ausreichend gut modelliert werden können. In der
Praxis werden dafür häufig lineare Filter verwendet. Die in Smartphones
verwendeten Kleinstlautsprecher zeigen jedoch ein ausgeprägtes
nichtlineares Verhalten. Bei hohen Amplituden ist die Kompensation mit
linearen Filtern nur sehr begrenzt möglich, da die nichtlinearen
Verzerrungen des Kleinstlautsprechers in diesem Bereich einen großen
Einfluss auf das ausgestrahlte Lautsprechersignal haben. Aus der Akustik
ist bekannt, dass das physikalische Lautsprechermodell ein
nichtlineares, rückgekoppeltes System ist.
In dieser Arbeit wird das Verhalten eines Kleinstlautsprechers durch
verschiedene Filter mit nichtlinearer, rückgekoppelter Filterstruktur
modelliert. Für solche Filter gibt es in der Literatur nur wenige
mathematische und systemtheoretische Beschreibungen, sodass zunächst
Adaptionsalgorithmen hergeleitet werden müssen, um die
Filterkoeffizienten an das Lautsprecherverhalten anzupassen. Es werden
verschiedene Adaptionsalgorithmen vorgestellt, die zunächst auf
simulierten Messdaten verifiziert und anschließend auf realen Messdaten
angewendet werden.
Alle Interessierten sind herzlich eingeladen, eine Anmeldung ist nicht
erforderlich.
Allgemeine Informationen zum Kolloquium, sowie eine aktuelle Liste der
Termine des Kommunikationstechnischen Kolloquiums finden Sie unter
http://www.iks.rwth-aachen.de/aktuelles/kolloquium/
//
--
Irina Ronkartz
Institute of Communication Systems (IKS)
RWTH Aachen University
Muffeter Weg 3a, 52074 Aachen, Germany
+49 241 80 26958 (phone)
ronkartz(a)iks.rwth-aachen.de
http://www.iks.rwth-aachen.de/
Sehr geehrte Abonnenten des Kolloquium-Newsletters,
gerne informieren wir Sie über die nächsten Termine unseres
Kommunikationstechnischen Kolloquiums.
*Montag, 21. Oktober 2019**
**Vortragender*: Till Hardenbicker
*Ort*: Hörsaal 4G IKS
*Zeit:* 11:00 Uhr
*Master-Vortrag*: Source Localization Using Binaural and Monaural Cues
Acoustic source localization exploiting binaural cues is used in
applications such as binaural conferencing and heairng aids. Binaural
cues are features that can easily be extracted from binaural signals but
only provide an ambiguous location estimation, since they do not, for
example, enable a front-back distinction. In the human auditory system,
this distinction is made based on so-called monaural cues, which are
signal features that arise from filtering effects of outer ear, head and
torso.
This thesis deals with the full-sphere localization of speech sources
based on binaural and monaural cues contained in binaural signals. It is
demonstrated that unlike binaural cues, monaural cues provide
information about the elevation angle. Attention is particularly paid to
the extraction of monaural cues. As the original source signal is not
known, this extraction is not trivial. Several algorithms are proposed
to estimate the source position by identifying Head-Related Transfer
Functions without knowledge of the source signal. The approaches can be
divided into least-square and codebook-based concepts and artificial
neural network-based concepts. Binaural and monaural cues are combained
such that the monaural estimators only resolve the ambiguities left by
the binaural estimators.
Different estimator topologies are individually optimized and then
analyzed with regard to their performance and potential for standalone
applications. The results indicate that all proposed estimators enable a
front-back distinction. While one estimator performs best in exchange
for a high computation time, two of them compromise well between
computation time and localization accuracy.
*
**Montag, 21. Oktober 2019*
*Vortragender:* Alexander Sobolew
*Ort:* Hörsaal 4G IKS
*Zeit:* 14:00 Uhr
*Bachelor-Vortrag*: Untersuchung geeigneter Features zur Rekonstruktion
verlorener Sprachsignalanteile
In der Praxis sind Audio- sowie Sprachsignale häufig Störungen
ausgesetzt. Dabei wird das Nutzsignal in frequenz- und zeit-begrenzten
Anteilen verzerrt. Bereits existierende Ansätze aus der
Störgeräuschreduktion oder der Echo-Kompensation gehen dieses Problem
an. Jedoch entstehen dabei hörbare Artefakte. Um diese Artefakte zu
vermeiden, soll das Nutzsignal mithilfe von Ansätzen aus dem
Machine-Learning rekonstruiert werden. Dieser Vorgang wird /Speech
Inpainting/ genannt. Ziel ist nun die Reduzierung der Komplexität des
Trainings der Machine-Learning-Modelle mithilfe einer
Dimensionsreduktion der verwendeten Signaldaten.
Zunächst werden die Ergebnisse einer umfassenden Recherche bezüglich
geeigneter Merkmalsgruppen aus der /Merkmalsextraktion/ präsentiert und
die Beschaffenheit der Merkmalstypen näher erläutert. Als Qualitätsmaß
der Merkmalsauswahl wird die Transinformation verwendet. Dazu wird ein
geeigneter Schätzer vorgestellt und die Wahl des unbestimmten Parameters
/k/ untersucht, der die Anzahl an Nachbarn im
/k-Nearest-Neighbor-Algorithmus/ innerhalb des Schätzers angibt. Des
Weiteren werden für die Auswahl der Merkmale nötigen, bereits
existierenden Algorithmen implementiert und weitere Algorithmen
entwickelt. Deren Ziel ist die Reduzierung der Laufzeit und der
Komplexität. Es erfolgt eine abschließende Evaluation der Algorithmen.
Unter Berücksichtigung dieser Evaluation werden die abschließenden
Ergebnisse der /Merkmalsauswahl /diskutiert und bewertet.
*Montag, 21. Oktober 2019*
*Vortragender*: Alexej Sobolew
*Ort*: Hörsaal 4G IKS
*Zeit*: 14:45 Uhr
*Bachelor-Vortrag*: Untersuchung der statistischen Abhängigkeiten
aufeinanderfolgender Sprachsegmente
In der Praxis sind Audio- und Sprachsignale Störungen ausgesetzt.
Dadurch entstehen zeit- und frequenzbegrenzte Verzerrungen, die z. B.
mithilfe der Störgeräuschreduktion oder der Echo-Kompensation
abgeschwächt werden können. Bei diesen Vorgängen entstehen allerdings
hörbare Artefakte. Die Linder dieser Artefakte kann durch die
Rekonstruktion der geschädigten Stellen erfolgen. Dieser
Rekonstruktionsprozess wird als Speech Inpainting bezeichnet. Zur
Rekonstruktion existieren Ansätze mithilfe von
Machine-Learning-Algorithmen. Dazu müssen die Eingangsdaten auf ihre
Relevanz hin untersucht und die signifikanten Anteile extrahiert werden.
Um dieses Ziel zu erreichen, werden die Daten zunächst auf die
Eigenschaften der Normalverteilung untersucht. Als Qualitätsmaß für die
statistischen Abhängigkeiten werden die Korrelation und die
Transinformation gewählt. Die Normalverteilung erweist sich hierbei für
die Untersuchung mithilfe der Korrelation als sinnvoll. Des Weiteren
werden die zeitlichen Abhängigkeiten analysiert und die Daten auf ihre
Frequenzabhängigkeit erforscht. Darauffolgend wird die Auswirkung der
Zunahme zusätzlicher Elemente ermittelt. Hierbei muss zunächst auf die
Vergleichbarkeit der Ergebnisse unterschiedlich-dimensionaler
Eingangsdaten geachtet werden. Dazu kann eine passend gewählte
Normierung verwendet werden. Im anschließenden Schritt werden die Daten
in unterschiedliche Cluster aufgeteilt, um weitere Zusammenhänge zu
erkennen.
Alle Interessierten sind herzlich eingeladen, eine Anmeldung ist nicht
erforderlich. Allgemeine Informationen zum Kolloquium sowie eine
aktuelle Liste der Termine des Kommunikationstechnischen Kolloquiums
finden Sie unter
http://www.iks.rwth-aachen.de/aktuelles/kolloquium/
--
Irina Ronkartz
Institute of Communication Systems (IKS)
RWTH Aachen University
Muffeter Weg 3a, 52074 Aachen, Germany
+49 241 80 26958 (phone)
ronkartz(a)iks.rwth-aachen.de
http://www.iks.rwth-aachen.de/
Sehr geehrte Abonnenten des Kolloquium-Newsletters,
gerne informieren wir Sie über den nächsten Termin unseres
Kommunikationstechnischen Kolloquiums.
*Dienstag, 15. Oktober 2019*
*Vortragender*: Erik Fleischhauer
*Ort*: Hörsaal 4G IKS
*Zeit:* 10:00 Uhr
*Bachelor-Vortrag:* Schätzung von selbstinduzierten Störungen bei
adaptiven ANC-Systemen
Kopfhörer mit aktiven Störgeräuschunterdrückungssystemen (engl. Active
Noise Control, ANC) verzeichnen steigende Beliebtheit. Kommerzielle
Kopfhörer verwenden dabei häufig ANC-Systeme mit festen Filtern. Eine
Alternative dazu sind auf adaptiven Algorithmen beruhende ANC-Systeme.
Diese sind in der Lage sich an verschiedene Benutzer und Störsignale
anzupassen. Dies führt dazu, dass mit adaptiven Filtern zumeist, im
Gegensatz zu auf festen Filtern beruhende ANC-Systemen, eine bessere
Störgeräuschunterdrückung erreicht werden kann.
Ein sehr performanter adaptiver Algorithmus ist das Kalman-Filter,
dessen Verwendung für ANC-Systeme im Rahmen dieser Arbeit untersucht
werden soll. Die Konvergenz adaptiver Algorithmen ist stark anfällig
gegenüber selbstinduzierten Störungen. Damit sich solche gemeint, welche
vom Benutzer des Systems selbst erzeugt wurden; zum Beispiel Sprache
oder Kabelrauschen. Ziel dieser Arbeit ist es, selbstinduzierte
Störungen zu schätzen und Techniken vorzustellen, welche die Robustheit
und Konvergenzgeschwindigkeit adaptiver ANC-Systeme verbessern.
Alle Interessierten sind herzlich eingeladen, eine Anmeldung ist nicht
erforderlich. Allgemeine Informationen zum Kolloquium, sowie eine
aktuelle Liste der Termine des Kommunikationstechnischen Kolloquiums
finden Sie unter:
http://www.iks.rwth-aachen.de/aktuelles/kolloquium/
--
Irina Ronkartz
Institute of Communication Systems (IKS)
RWTH Aachen University
Muffeter Weg 3a, 52074 Aachen, Germany
+49 241 80 26958 (phone)
ronkartz(a)iks.rwth-aachen.de
http://www.iks.rwth-aachen.de/
Sehr geehrte Abonnenten des Kolloquium-Newsletters,
gerne informieren wir Sie über den nächsten Termin unseres
Kommunikationstechnischen Kolloquiums.
*Montag, 14. Oktober 2019*
*Vortragender*: Khashayar Abryoghani
*Ort:* Hörsaal 4G IKS
*Zeit*: 11:00 Uhr
*Bachelor-Vortrag*: Numerische Analyse adaptiver Algorithmen basierend
auf einem FPGA SoC.
Die Notwendigkeit Störgeräusche zu beseitigen, hat seit den letzten
Jahren ständig zugenommen. Der beispielsweise durch Autos, Baumaschinen
oder Flugzeuge produzierte Lärm ist schädlich für die menschliche
Gesundheit. Daher ist es von Interesse, durch Entwicklung von
Lärmkompensationsgeräten Störgeräusche zu reduzieren.
Aktive Störgeräuschunterdrückung (engl.: Active Noise Cancellation, ANC)
ist die Technik, die entwickelt worden ist, um Störgeräusche abhängig
von der Art und Frequenz abzuschwächen. Im Falle eines ANC Kopfhörers
ist das Ziel, die Leistung des Signals direkt am Trommelfell des Hörers
durch Erzeugen eines Kompensationssignals zu unterdrücken. Zum Erzeugen
des Kompensationssignals können feste oder adaptive Filter eingesetzt
werden. Das ANC-System besitzt hohe Echtzeitanforderungen, da sonst bei
der Verarbeitung Latenz entstehen kann, die die Leistung des Systems
stark beeinträchtigt. Eine Möglichkeit, die Filterung auf einer
integrierten Schaltung in Echtzeit auszuführen, ist spezielle Hardware,
die exakt für die Berechnungen des Filters optimiert ist.
Im Rahmen dieser Arbeit werden zwei adaptive Algorithmen für die
Realisierung auf einem FPGA untersucht, nämlich der Normalized
Least-Mean-Squares (NLMS) und der Recursive-Least-Squares (RLS)
Algorithmus. Da die Rechenoperationen auf einem FPGA in
Festkommadarstellung sind, wird sich die Arbeit zunächst mit numerischen
Aspekten befassen. Dazu werden einige grundlegende Aspekte bezüglich der
Zahlensysteme und Quantisierung vorgestellt. Danach wird auf
verschiedene Möglichkeiten eingegangen, wie man ein FPGA für ein ANC
System einsetzen kann. Diese Möglichkeiten werden auf ihre Vor- und
Nachteile untersucht. Anschließend werden wichtige Herausforderungen
hervorgehoben, in der Literatur bekannte Ansätze zur Beseitigung dieser
Herausforderungen vorgestellt und experimentell überprüft.
Alle Interessierten sind herzlich eingeladen, eine Anmeldung ist nicht
erforderlich. Allgemeine Informationen zum Kolloquium, sowie eine
aktuelle Liste der Termine des Kommunikationstechnischen Kolloquiums
finden Sie unter:
http://www.iks.rwth-aachen.de/aktuelles/kolloquium/
--
Irina Ronkartz
Institute of Communication Systems (IKS)
RWTH Aachen University
Muffeter Weg 3a, 52074 Aachen, Germany
+49 241 80 26958 (phone)
ronkartz(a)iks.rwth-aachen.de
http://www.iks.rwth-aachen.de/
Sehr geehrte Abonnenten des Kolloquium-Newsletters,
gerne informieren wir Sie über die nächsten Termine unseres
Kommunikationstechnischen Kolloquiums.
*Donnerstag, 10. Oktober 2019*
*Vortragender*: Tarek Yann El Moghazi
*Ort*: Hörsaal 4G IKS
*Zeit*: 11:15 Uhr
*Bachelor-Vortrag*: Virtual Relocation of a Binaural Recording Device in
a Teleconference Application
Through binaural recording and playback techniques, intelligibility and
realism can be achieved for a distant participant in a teleconference.
For this, a recording device (e.g. an artificial head) is placed at the
desired location in the room. When listening to the artificial head's
recording, the distant participant experiences immersion and
spaciousness as if he were present in the room and can naturally
distinguish between speakers.
Using the above approach for multiple distant participants is complex
and costly, as each of the participants requires a unique recording
device at a distinct location in the conference room. With the goal of
reducing cost and effort, in this thesis an attempt to virtually shift
the acoustic scene to different locations in the room using a singular
artificial head's recorded signals, is presented.
The relocation is implemented by a table. Its function is to translate
the angles seen from the recording position into angles corresponding to
the target location. Multiple algorithms for constructing the table are
proposed and compared. Furthermore, the impact of distance perception is
considered by modifying the output signal's primary-to-ambient ratio
depending on the distance between source and recording device or
participant. Results of a listening test verify the validity of the
presented approach. With the aid of it the user experience in
teleconferencing scenarios and beyond can be improved.
und
*Freitag, 11. Oktober 2019*
*Vortragende*: Xiao Luo
*Ort*: Hörsaal 4G IKS
*Zeit*: 14:00 Uhr
*Master-Vortrag:* Multichannel Acoustic Echo Compensation for Spatial
Audio Communication
Emerging devices supporting 3D audio recording and reproduction
accelerate progress towards immersive telecommunications desired by
teleconferencing and many other application scenarios. However, the
massive number of microphones and loudspeakers required in such systems
poses challenges for acoustic echo compensation.
In this master thesis, it is verified that the classical acoustic echo
compensation is hardly scalable to the massive multichannel systems,
subject to the system complexity and the well-known non-uniqueness
problem. Therefore, a new method of echo compensation is proposed in
this work, attempting to apply spatial filtering on the 3D audio signal
for source separation and generate the desired echo estimates with much
fewer estimation channels. Typical techniques for source separation like
beamforming and principal component analysis are investigated, showing
high potential for satisfying the needs of massive multichannel echo
compensation with largely reduced complexity.
Alle Interessierten sind herzlich eingeladen, eine Anmeldung ist nicht
erforderlich.
Allgemeine Informationen zum Kolloquium, sowie eine aktuelle Liste der
Termine des Kommunikationstechnischen Kolloquiums finden Sie unter:
http://www.iks.rwth-aachen.de/aktuelles/kolloquium/
--
Irina Ronkartz
Institute of Communication Systems (IKS)
RWTH Aachen University
Muffeter Weg 3a, 52074 Aachen, Germany
+49 241 80 26958 (phone)
ronkartz(a)iks.rwth-aachen.de
http://www.iks.rwth-aachen.de/