+**********************************************************************
*
*
* Einladung
*
*
*
* Informatik-Oberseminar
*
*
*
+**********************************************************************
Zeit: Freitag, 12. Juli 2019, 10.00 Uhr
Ort: Informatikzentrum, E3, Raum 9222
Referent: Dipl.-Inform. Malte Nuhn
Thema: Unsupervised Training with Applications in Natural Language
Processing//
Abstract:
The state-of-the-art algorithms for various natural language processing
tasks require large amounts of labeled training data. At the same time,
obtaining labeled data of high quality is often the most costly step in
setting up natural language processing systems.Opposed to this,
unlabeled data is much cheaper to obtain and available in larger
amounts.Currently, only few training algorithms make use of unlabeled
data. In practice, training with only unlabeled data is not performed at
all. In this thesis, we study how unlabeled data can be used to train a
variety of models used in natural language processing. In particular, we
study models applicable to solving substitution ciphers, spelling
correction, and machine translation. This thesis lays the groundwork for
unsupervised training by presenting and analyzing the corresponding
models and unsupervised training problems in a consistent manner.We show
that the unsupervised training problem that occurs when breaking
one-to-one substitution ciphers is equivalent to the quadratic
assignment problem (QAP) if a bigram language model is incorporated and
therefore NP-hard. Based on this analysis, we present an effective
algorithm for unsupervised training for deterministic substitutions. In
the case of English one-to-one substitution ciphers, we show that our
novel algorithm achieves results close to human performance, as
presented in [Shannon 49].
Also, with this algorithm, we present, to the best of our knowledge, the
first automatic decipherment of the second part of the Beale
ciphers.Further, for the task of spelling correction, we work out the
details of the EM algorithm [Dempster & Laird + 77] and experimentally
show that the error rates achieved using purely unsupervised training
reach those of supervised training.For handling large vocabularies, we
introduce a novel model initialization as well as multiple training
procedures that significantly speed up training without hurting the
performance of the resulting models significantly.By incorporating an
alignment model, we further extend this model such that it can be
applied to the task of machine translation. We show that the true
lexical and alignment model parameters can be learned without any
labeled data: We experimentally show that the corresponding likelihood
function attains its maximum for the true model parameters if a
sufficient amount of unlabeled data is available. Further, for the
problem of spelling correction with symbol substitutions and local
swaps, we also show experimentally that the performance achieved with
purely unsupervised EM training reaches that of supervised training.
Finally, using the methods developed in this thesis, we present results
on an unsupervised training task for machine translation with a ten
times larger vocabulary than that of tasks investigated in previous work.
Es laden ein: die Dozentinnen und Dozenten der Informatik
_______________________________________________
--
--
Stephanie Jansen
Faculty of Mathematics, Computer Science and Natural Sciences
HLTPR - Human Language Technology and Pattern Recognition
RWTH Aachen University
Ahornstraße 55
D-52074 Aachen
Tel. Frau Jansen: +49 241 80-216 06
Tel. Frau Andersen: +49 241 80-216 01
Fax: +49 241 80-22219
sek(a)i6.informatik.rwth-aachen.de
www.hltpr.rwth-aachen.de
Tel: +49 241 80-216 01/06
Fax: +49 241 80-22219
sek(a)i6.informatik.rwth-aachen.de
www.hltpr.rwth-aachen.de
+**********************************************************************
*
*
* Terminänderung
*
*
*
* Informatik-Oberseminar
*
*
*
+**********************************************************************
++++++++
* ALTE ZEIT: Donnerstag, 7. November 2019, 10:00 Uhr
* NEUE ZEIT: Donnerstag, 7. November 2019, 9:30 Uhr
++++++++
Ort: Raum 2359|222 (9222), Informatikzentrum Erweiterungsbau 3
Referent: Florian Göbe, M.Sc.RWTH
Informatik 11 – Embedded Software
Thema: Überwachung von SPS-Programmen zur Laufzeit mittels ereignisdiskreter Systeme
Kurzfassung:
Bei der von Ramadge und Wonham eingeführten Supervisory Control Theory (SCT) handelt es sich um einen der verbreitetsten Ansätze für die Synthese von Lösungen im Bereich diskreter Steuerungen. In diesem Vortrag wird ein Ansatz vorgestellt, der das SCT-Rahmenwerk zur Überwachung existierender SPS-Steuerungsprogramme einsetzt. Letztere werden als vom Benutzer manuell implementiert angenommen, weswegen ihre Fehlerfreiheit in Bezug auf gewisse Anforderungen, beispielsweise an die funktionale Sicherheit, nicht in allen prinzipiell möglichen Situationen formal sichergestellt werden kann. Im vorgestellten Ansatz können diese Anforderungen als ereignisdiskrete Systeme formalisiert werden. Mittels einer modifizierten Form des Ramadge-Wonham-Rahmenwerkes wird aus diesen Modellen schließlich eine Überwachungsschicht generiert. Diese verhindert frühzeitig solche Aktionen der Steuerung, die schlussendlich zu einer Verletzung der Anforderungen führen könnten.
Um eine möglichst große Bandbreite realistischer Anwendungsfälle abzudecken, wurden mehrere Anpassungen am ursprünglichen Rahmenwerk vorgenommen und Erweiterungen eingeführt, beispielsweise bedingte Transitionen, Vorlagen sowie Ereigniserzwingung zur Verhinderung unerwünschter Vorkommnisse. Das vorgestellte Konzept bildet den gesamten Prozess von der Erstellung der Anforderungsmodelle bis hin zu einer auf der Zielhardware direkt einsetzbaren Sicherheitsschicht ab und wurde in Form eines Werkzeugs prototypisch realisiert und evaluiert.
Es laden ein: die Dozentinnen und Dozenten der Informatik
+**********************************************************************
*
*
* Einladung
*
*
*
* Informatik-Kolloquium
*
*
*
+**********************************************************************
Zeit: Montag, 21. Oktober 2019, 10.30 Uhr
Ort: Informatikzentrum, E3, Raum 9007
Referent: Prof. Salil Kanhere
School of Computer Science and Engineering, UNSW Sydney
Thema: TrustChain: Trust Management in Blockchain and IoT supported
Supply Chains
Abstract:
Traceability and integrity are major challenges for the increasingly
complex supply chains of today’s world. Although blockchain technology
has the potential to address these challenges through providing a
tamper-proof audit trail of supply chain events and data associated with
a product lifecycle, it does not solve the trust problem associated with
the data itself. Reputation systems are an effective approach to solve
this trust problem. However, current reputation systems are not suited
to the blockchain based supply chain applications as they are based on
limited observations, they lack granularity and automation, and their
overhead has not been explored. In this talk, we propose TrustChain, as
a three-layered trust management framework which uses a consortium
blockchain to track interactions among supply chain participants and to
dynamically assign trust and reputation scores based on these
interactions. The novelty of TrustChain stems from: (a) the reputation
model that evaluates the quality of commodities, and the trustworthiness
of entities based on multiple observations of supply chain events, (b)
its support for reputation scores that separate between a supply chain
participant and products, enabling the assignment of product-specific
reputations for the same participant, (c) the use of smart contracts for
transparent, efficient, secure, and automated calculation of reputation
scores, and (d) its minimal overhead in terms of latency and throughput
when compared to a simple blockchain based supply chain model.
Speaker Biography:
Salil Kanhere is a Professor in the School of Computer Science and
Engineering at UNSW Sydney. He is also a conjoint researcher at CSIRO's
Data61 and a participating researcher in the Cyber Security Cooperative
Research Centre. He has held visiting appointments at Technical
University Darmstadt, University of Zurich, Graz University of
Technology and Institute of Infocom Research Singapore. His research
interests include Internet of Things, blockchain, cyber physical
systems, applied machine learning and cybersecurity. His research has
been featured in various media outlets including ABC News Australia,
Forbes, IEEE Spectrum, Wired, ZDNET, Computer World, Medium and MIT
Technology Review. He serves as the Editor in Chief of the Ad Hoc
Networks Journal and as Associate Editor of Pervasive and Mobile
Computing and Computer Communications journals. He is an Humboldt
Research Fellow and ACM Distinguished Speaker. He regularly serves on
the organising committee of top-tier IEEE/ACM conferences in his
discipline.
Es laden ein: die Dozentinnen und Dozenten der Informatik
+**********************************************************************
*
*
* Einladung
*
*
*
* Informatik-Oberseminar
*
*
*
+**********************************************************************
Zeit: Donnerstag, 7. November 2019, 10.00 Uhr
Ort: Raum 2359|222 (9222), Informatikzentrum Erweiterungsbau 3
Referent: Florian Göbe, M.Sc.RWTH
Informatik 11 – Embedded Software
Thema: Überwachung von SPS-Programmen zur Laufzeit mittels ereignisdiskreter Systeme
Kurzfassung:
Bei der von Ramadge und Wonham eingeführten Supervisory Control Theory (SCT) handelt es sich um einen der verbreitetsten Ansätze für die Synthese von Lösungen im Bereich diskreter Steuerungen. In diesem Vortrag wird ein Ansatz vorgestellt, der das SCT-Rahmenwerk zur Überwachung existierender SPS-Steuerungsprogramme einsetzt. Letztere werden als vom Benutzer manuell implementiert angenommen, weswegen ihre Fehlerfreiheit in Bezug auf gewisse Anforderungen, beispielsweise an die funktionale Sicherheit, nicht in allen prinzipiell möglichen Situationen formal sichergestellt werden kann. Im vorgestellten Ansatz können diese Anforderungen als ereignisdiskrete Systeme formalisiert werden. Mittels einer modifizierten Form des Ramadge-Wonham-Rahmenwerkes wird aus diesen Modellen schließlich eine Überwachungsschicht generiert. Diese verhindert frühzeitig solche Aktionen der Steuerung, die schlussendlich zu einer Verletzung der Anforderungen führen könnten.
Um eine möglichst große Bandbreite realistischer Anwendungsfälle abzudecken, wurden mehrere Anpassungen am ursprünglichen Rahmenwerk vorgenommen und Erweiterungen eingeführt, beispielsweise bedingte Transitionen, Vorlagen sowie Ereigniserzwingung zur Verhinderung unerwünschter Vorkommnisse. Das vorgestellte Konzept bildet den gesamten Prozess von der Erstellung der Anforderungsmodelle bis hin zu einer auf der Zielhardware direkt einsetzbaren Sicherheitsschicht ab und wurde in Form eines Werkzeugs prototypisch realisiert und evaluiert.
Es laden ein: die Dozentinnen und Dozenten der Informatik