+**********************************************************************
*
*
* Einladung
*
*
*
* Informatik-Oberseminar
*
*
*
+**********************************************************************
Zeit: Freitag, 12. Juli 2019, 10.00 Uhr
Ort: Informatikzentrum, E3, Raum 9222
Referent: Dipl.-Inform. Malte Nuhn
Thema: Unsupervised Training with Applications in Natural Language
Processing//
Abstract:
The state-of-the-art algorithms for various natural language processing
tasks require large amounts of labeled training data. At the same time,
obtaining labeled data of high quality is often the most costly step in
setting up natural language processing systems.Opposed to this,
unlabeled data is much cheaper to obtain and available in larger
amounts.Currently, only few training algorithms make use of unlabeled
data. In practice, training with only unlabeled data is not performed at
all. In this thesis, we study how unlabeled data can be used to train a
variety of models used in natural language processing. In particular, we
study models applicable to solving substitution ciphers, spelling
correction, and machine translation. This thesis lays the groundwork for
unsupervised training by presenting and analyzing the corresponding
models and unsupervised training problems in a consistent manner.We show
that the unsupervised training problem that occurs when breaking
one-to-one substitution ciphers is equivalent to the quadratic
assignment problem (QAP) if a bigram language model is incorporated and
therefore NP-hard. Based on this analysis, we present an effective
algorithm for unsupervised training for deterministic substitutions. In
the case of English one-to-one substitution ciphers, we show that our
novel algorithm achieves results close to human performance, as
presented in [Shannon 49].
Also, with this algorithm, we present, to the best of our knowledge, the
first automatic decipherment of the second part of the Beale
ciphers.Further, for the task of spelling correction, we work out the
details of the EM algorithm [Dempster & Laird + 77] and experimentally
show that the error rates achieved using purely unsupervised training
reach those of supervised training.For handling large vocabularies, we
introduce a novel model initialization as well as multiple training
procedures that significantly speed up training without hurting the
performance of the resulting models significantly.By incorporating an
alignment model, we further extend this model such that it can be
applied to the task of machine translation. We show that the true
lexical and alignment model parameters can be learned without any
labeled data: We experimentally show that the corresponding likelihood
function attains its maximum for the true model parameters if a
sufficient amount of unlabeled data is available. Further, for the
problem of spelling correction with symbol substitutions and local
swaps, we also show experimentally that the performance achieved with
purely unsupervised EM training reaches that of supervised training.
Finally, using the methods developed in this thesis, we present results
on an unsupervised training task for machine translation with a ten
times larger vocabulary than that of tasks investigated in previous work.
Es laden ein: die Dozentinnen und Dozenten der Informatik
_______________________________________________
--
--
Stephanie Jansen
Faculty of Mathematics, Computer Science and Natural Sciences
HLTPR - Human Language Technology and Pattern Recognition
RWTH Aachen University
Ahornstraße 55
D-52074 Aachen
Tel. Frau Jansen: +49 241 80-216 06
Tel. Frau Andersen: +49 241 80-216 01
Fax: +49 241 80-22219
sek(a)i6.informatik.rwth-aachen.de
www.hltpr.rwth-aachen.de
Tel: +49 241 80-216 01/06
Fax: +49 241 80-22219
sek(a)i6.informatik.rwth-aachen.de
www.hltpr.rwth-aachen.de
+**********************************************************************
*
*
* Einladung
*
*
*
* Informatik-Oberseminar
*
*
*
+**********************************************************************
Zeit: Montag, 13. Dezember 2021, 11:00 Uhr
Ort: Videokonferenz (Zoom-Meeting, Informationen siehe unten)
Referent: Stefan Kühnel, Dipl. Wirt.-Inf.
Informatik 3 - Software Engineering
Thema: Eine agile Methode zur simulativen Qualitätssicherung von Aktiven
Sicherheitssystemen
Kontext: Neben dem aktuellen Bestreben die Elektrizierung des Antriebs
von Automobilen durch Innovationen voranzutreiben kommt der Integration
von Fahrerassistenzsystemen im Rahmen der Automobilentwicklung eine
besondere Bedeutung sowohl zur Steigerung des Fahrkomforts als auch zur
Verbesserung der Sicherheit zu. Eine gewichtige Rolle spielen dabei
Consumer Tests wie z.B. von Organisationen wie EuroNCAP, welche sowohl
als Treiber aber auch zur Beurteilung der Leistungsfähigkeit der
getesteten Sicherheitssysteme dient. Um die Qualität der dafür
entwickelten Software besser beurteilen und steigern zu können, bilden
Tests sowohl in ausgewiesenen Prüfarealen unter realen Bedingungen als
auch simulationsbasierte Tests in synthetischen Umgebungen geeignete
Ansätze, den Herausforderungen der kontinuierlichen
Qualitätsverbesserung agil zu begegnen, wenngleich beide Ansätze über
unterschiedliche Hürden und Grenzen verfügen. Speziell der hier
betrachtete simulative Ansatz mündet nicht selten in dem Dilemma, dass
die Entwicklung geeigneter Umgebungen ebenfalls ein hohes Maß an
Ressourcen wie die eigentliche Systementwicklung benötigt und somit
Letztere weiter parallel voranschreitet mit der Folge, dass die
Simulationsumgebung aufgrund des hohen Aufwandes nicht rechtzeitig
einsetzbar ist. Dies kann dann bspw. eintreten, wenn dem Aspekt der
Modellbildung mit dem Güteziel einer möglichst engen Realitätsnähe ohne
Rückkopplung auf die eingangs zu definierende Fragestellung: “Was soll
durch die Simulation beantwortet werden?” erfolgt.
Ziel: Das Ziel dieser Arbeit besteht darin, den komplexen
Entwicklungsprozess von Aktiven Sicherheitssystemen im Rahmen der
Consumer Tests durch einen simulativen Ansatz zur Verbesserung der
Softwarequalität zu unterstützen. Weiterhin soll durch die
Verhaltensanalyse von Algorithmen die Ressourcenallokation während der
Entwicklung und der notwendigen realen Tests verbessert und damit
effektiver gestaltet werden.
Methode: Nach der Durchführung eines Systematic Literature Reviews (SLR)
zu Prüfung evtl. vorhandener Ansätze und Methoden zur Entwicklung
solcher Simulationsumgebungen wird eine eigene Methode entwickelt,
vorgestellt und unter Berücksichtigung der vorliegenden
Projektbedingungen diese Methode im Rahmen einer Fallstudie angewendet.
Ergebnisse: Die Analyse des Projektkontextes kommt zu dem Ergebnis, dass
es durchaus Simulationsaktivitäten gibt, jedoch eine strukturierte
Herangehensweise zu ihrer Entwicklung fehlt. Das Systematic Literature
Review bestätigt dieses Ergebnis, sodass der Bedarf der Entwicklung
einer agilen Methode zur simulativen Qualitätssicherung von Aktiven
Sicherheitssystemen insbesondere mit Blick auf Consumer Tests aufgezeigt
wird. Die vorgestellte Methode umfasst vier Bausteine: (a) die Analyse
und Modellierung des Untersuchungsraumes, (b) die Entwicklung einer
adäquaten Simulationsinfrastruktur, (c) die Entwicklung von
Bewertungsverfahren und (d) die Durchführung von Simulationsläufen sowie
ihrer Auswertung. Zum Schluss wird die Methode mit Hilfe einer
Fallstudie für ein Proof of Concept angewendet.
Schlussfolgerung: Es wird aufgezeigt, dass die Methode während der
qualitativen Bewertung von Softwarekomponenten auf simulativer Basis
einen positiven Beitrag leistet, speziell dort, wo
Äquivalenzklassentests nicht ausreichend sind, Consumer Test Szenarien
hinreichend zu testen. Einschränkungen und Erweiterungsbedarf der
Methode werden vorrangig in der Übertragung auf andere Kontexte im
Fahrerassistenzumfeld und die Erweiterung um zusätzliche Consumer Test
Szenarien wie den Fußgängerschutz gesehen.
Es laden ein: die Dozentinnen und Dozenten der Informatik
********************************
Thema: [Promotion Stefan Kühnel] Vortrag
Uhrzeit: 13. Nov. 2021 11:00 AM Amsterdam, Berlin, Rom, Stockholm, Wien
Zoom-Meeting beitreten
https://rwth.zoom.us/j/98203910423?pwd=UlRyWFNFSXpaNzZnQm9oZEE5T3lpZz09
Beste Grüße, Stefan Kühnel
--
----------------------------------------------------------------
Prof. Dr. Bernhard Rumpe | http://www.se-rwth.de
Lehrstuhl Software Engineering | Informatik 3
Ahornstr. 55, 52074 Aachen, Germany | RWTH Aachen University
Phone ++49 241 80-21301 / Fax -22218 |
+**********************************************************************
*
*
* Einladung
*
*
*
* Informatik-Oberseminar
*
*
*
+**********************************************************************
Zeit: Montag, 13. Dezember 2021, 11.00 Uhr
Ort: Zoom-Videokonferenz
https://rwth.zoom.us/j/93783577046?pwd=NjFUNFZZUWpzNjhLN2VlOHEyVk9nQT09
Meeting-ID: 937 8357 7046
Kenncode: 561405
Referent: Jens Deussen M.Sc.
Lehrstuhl Informatik 12: Software and Tools for
Computational Engineering
Thema: Global Derivatives
Abstract:
In this talk, we show how to obtain global derivatives that are
guaranteed enclosures of the derivative information on specified
domains. Therefore, we combine algorithmic differentiation (AD) methods
with interval arithmetic and McCormick relaxations. While naive interval
computations are prone to overestimation of exact value ranges, we
identify special cases for which the natural interval extension applied
to the AD methods compute exact value ranges for the global derivatives.
We present two applications that benefit from global derivatives:
deterministic global optimization by branch-and-bound methods, and
significance-driven unreliable and approximate computing. Within the
framework of the global optimization case study we introduce subdomain
separability. This local property enables the partitioning of the
optimization problem on subdomains that fulfill a certain monotonicity
condition. The approximate computing case study demonstrates how to
automatically prune artificial neural networks by using significance values.
Es laden ein: die Dozentinnen und Dozenten der Informatik