December 2021 - informatik-vortraege

Einladung Informatik-Oberseminar Malte Nuhn
by Sekretariat I6 30 May '22

30 May '22

+********************************************************************** * * * Einladung * * * * Informatik-Oberseminar * * * +********************************************************************** Zeit: Freitag, 12. Juli 2019, 10.00 Uhr Ort: Informatikzentrum, E3, Raum 9222 Referent: Dipl.-Inform. Malte Nuhn Thema: Unsupervised Training with Applications in Natural Language Processing// Abstract: The state-of-the-art algorithms for various natural language processing tasks require large amounts of labeled training data. At the same time, obtaining labeled data of high quality is often the most costly step in setting up natural language processing systems.Opposed to this, unlabeled data is much cheaper to obtain and available in larger amounts.Currently, only few training algorithms make use of unlabeled data. In practice, training with only unlabeled data is not performed at all. In this thesis, we study how unlabeled data can be used to train a variety of models used in natural language processing. In particular, we study models applicable to solving substitution ciphers, spelling correction, and machine translation. This thesis lays the groundwork for unsupervised training by presenting and analyzing the corresponding models and unsupervised training problems in a consistent manner.We show that the unsupervised training problem that occurs when breaking one-to-one substitution ciphers is equivalent to the quadratic assignment problem (QAP) if a bigram language model is incorporated and therefore NP-hard. Based on this analysis, we present an effective algorithm for unsupervised training for deterministic substitutions. In the case of English one-to-one substitution ciphers, we show that our novel algorithm achieves results close to human performance, as presented in [Shannon 49]. Also, with this algorithm, we present, to the best of our knowledge, the first automatic decipherment of the second part of the Beale ciphers.Further, for the task of spelling correction, we work out the details of the EM algorithm [Dempster & Laird + 77] and experimentally show that the error rates achieved using purely unsupervised training reach those of supervised training.For handling large vocabularies, we introduce a novel model initialization as well as multiple training procedures that significantly speed up training without hurting the performance of the resulting models significantly.By incorporating an alignment model, we further extend this model such that it can be applied to the task of machine translation. We show that the true lexical and alignment model parameters can be learned without any labeled data: We experimentally show that the corresponding likelihood function attains its maximum for the true model parameters if a sufficient amount of unlabeled data is available. Further, for the problem of spelling correction with symbol substitutions and local swaps, we also show experimentally that the performance achieved with purely unsupervised EM training reaches that of supervised training. Finally, using the methods developed in this thesis, we present results on an unsupervised training task for machine translation with a ten times larger vocabulary than that of tasks investigated in previous work. Es laden ein: die Dozentinnen und Dozenten der Informatik _______________________________________________ -- -- Stephanie Jansen Faculty of Mathematics, Computer Science and Natural Sciences HLTPR - Human Language Technology and Pattern Recognition RWTH Aachen University Ahornstraße 55 D-52074 Aachen Tel. Frau Jansen: +49 241 80-216 06 Tel. Frau Andersen: +49 241 80-216 01 Fax: +49 241 80-22219 sek(a)i6.informatik.rwth-aachen.de www.hltpr.rwth-aachen.de Tel: +49 241 80-216 01/06 Fax: +49 241 80-22219 sek(a)i6.informatik.rwth-aachen.de www.hltpr.rwth-aachen.de

3 15

Einladung: Informatik-Oberseminar, Stefan Kühnel
by Bernhard Rumpe 07 Dec '21

07 Dec '21

+********************************************************************** * * * Einladung * * * * Informatik-Oberseminar * * * +********************************************************************** Zeit: Montag, 13. Dezember 2021, 11:00 Uhr Ort: Videokonferenz (Zoom-Meeting, Informationen siehe unten) Referent: Stefan Kühnel, Dipl. Wirt.-Inf. Informatik 3 - Software Engineering Thema: Eine agile Methode zur simulativen Qualitätssicherung von Aktiven Sicherheitssystemen Kontext: Neben dem aktuellen Bestreben die Elektrizierung des Antriebs von Automobilen durch Innovationen voranzutreiben kommt der Integration von Fahrerassistenzsystemen im Rahmen der Automobilentwicklung eine besondere Bedeutung sowohl zur Steigerung des Fahrkomforts als auch zur Verbesserung der Sicherheit zu. Eine gewichtige Rolle spielen dabei Consumer Tests wie z.B. von Organisationen wie EuroNCAP, welche sowohl als Treiber aber auch zur Beurteilung der Leistungsfähigkeit der getesteten Sicherheitssysteme dient. Um die Qualität der dafür entwickelten Software besser beurteilen und steigern zu können, bilden Tests sowohl in ausgewiesenen Prüfarealen unter realen Bedingungen als auch simulationsbasierte Tests in synthetischen Umgebungen geeignete Ansätze, den Herausforderungen der kontinuierlichen Qualitätsverbesserung agil zu begegnen, wenngleich beide Ansätze über unterschiedliche Hürden und Grenzen verfügen. Speziell der hier betrachtete simulative Ansatz mündet nicht selten in dem Dilemma, dass die Entwicklung geeigneter Umgebungen ebenfalls ein hohes Maß an Ressourcen wie die eigentliche Systementwicklung benötigt und somit Letztere weiter parallel voranschreitet mit der Folge, dass die Simulationsumgebung aufgrund des hohen Aufwandes nicht rechtzeitig einsetzbar ist. Dies kann dann bspw. eintreten, wenn dem Aspekt der Modellbildung mit dem Güteziel einer möglichst engen Realitätsnähe ohne Rückkopplung auf die eingangs zu definierende Fragestellung: “Was soll durch die Simulation beantwortet werden?” erfolgt. Ziel: Das Ziel dieser Arbeit besteht darin, den komplexen Entwicklungsprozess von Aktiven Sicherheitssystemen im Rahmen der Consumer Tests durch einen simulativen Ansatz zur Verbesserung der Softwarequalität zu unterstützen. Weiterhin soll durch die Verhaltensanalyse von Algorithmen die Ressourcenallokation während der Entwicklung und der notwendigen realen Tests verbessert und damit effektiver gestaltet werden. Methode: Nach der Durchführung eines Systematic Literature Reviews (SLR) zu Prüfung evtl. vorhandener Ansätze und Methoden zur Entwicklung solcher Simulationsumgebungen wird eine eigene Methode entwickelt, vorgestellt und unter Berücksichtigung der vorliegenden Projektbedingungen diese Methode im Rahmen einer Fallstudie angewendet. Ergebnisse: Die Analyse des Projektkontextes kommt zu dem Ergebnis, dass es durchaus Simulationsaktivitäten gibt, jedoch eine strukturierte Herangehensweise zu ihrer Entwicklung fehlt. Das Systematic Literature Review bestätigt dieses Ergebnis, sodass der Bedarf der Entwicklung einer agilen Methode zur simulativen Qualitätssicherung von Aktiven Sicherheitssystemen insbesondere mit Blick auf Consumer Tests aufgezeigt wird. Die vorgestellte Methode umfasst vier Bausteine: (a) die Analyse und Modellierung des Untersuchungsraumes, (b) die Entwicklung einer adäquaten Simulationsinfrastruktur, (c) die Entwicklung von Bewertungsverfahren und (d) die Durchführung von Simulationsläufen sowie ihrer Auswertung. Zum Schluss wird die Methode mit Hilfe einer Fallstudie für ein Proof of Concept angewendet. Schlussfolgerung: Es wird aufgezeigt, dass die Methode während der qualitativen Bewertung von Softwarekomponenten auf simulativer Basis einen positiven Beitrag leistet, speziell dort, wo Äquivalenzklassentests nicht ausreichend sind, Consumer Test Szenarien hinreichend zu testen. Einschränkungen und Erweiterungsbedarf der Methode werden vorrangig in der Übertragung auf andere Kontexte im Fahrerassistenzumfeld und die Erweiterung um zusätzliche Consumer Test Szenarien wie den Fußgängerschutz gesehen. Es laden ein: die Dozentinnen und Dozenten der Informatik ******************************** Thema: [Promotion Stefan Kühnel] Vortrag Uhrzeit: 13. Nov. 2021 11:00 AM Amsterdam, Berlin, Rom, Stockholm, Wien Zoom-Meeting beitreten https://rwth.zoom.us/j/98203910423?pwd=UlRyWFNFSXpaNzZnQm9oZEE5T3lpZz09 Beste Grüße, Stefan Kühnel -- ---------------------------------------------------------------- Prof. Dr. Bernhard Rumpe | http://www.se-rwth.de Lehrstuhl Software Engineering | Informatik 3 Ahornstr. 55, 52074 Aachen, Germany | RWTH Aachen University Phone ++49 241 80-21301 / Fax -22218 |

1 0

Einladung: Informatik-Oberseminar Jens Deussen
by Jens Deussen 06 Dec '21

06 Dec '21

+********************************************************************** * * * Einladung * * * * Informatik-Oberseminar * * * +********************************************************************** Zeit: Montag, 13. Dezember 2021, 11.00 Uhr Ort: Zoom-Videokonferenz https://rwth.zoom.us/j/93783577046?pwd=NjFUNFZZUWpzNjhLN2VlOHEyVk9nQT09 Meeting-ID: 937 8357 7046 Kenncode: 561405 Referent: Jens Deussen M.Sc. Lehrstuhl Informatik 12: Software and Tools for Computational Engineering Thema: Global Derivatives Abstract: In this talk, we show how to obtain global derivatives that are guaranteed enclosures of the derivative information on specified domains. Therefore, we combine algorithmic differentiation (AD) methods with interval arithmetic and McCormick relaxations. While naive interval computations are prone to overestimation of exact value ranges, we identify special cases for which the natural interval extension applied to the AD methods compute exact value ranges for the global derivatives. We present two applications that benefit from global derivatives: deterministic global optimization by branch-and-bound methods, and significance-driven unreliable and approximate computing. Within the framework of the global optimization case study we introduce subdomain separability. This local property enables the partitioning of the optimization problem on subdomains that fulfill a certain monotonicity condition. The approximate computing case study demonstrates how to automatically prune artificial neural networks by using significance values. Es laden ein: die Dozentinnen und Dozenten der Informatik

1 0