slides/title: fixes typos + feedback
authorVincent Dahmen <vdahm@workpit.dynport>
Wed, 21 Nov 2018 16:15:20 +0000 (17:15 +0100)
committerVincent Dahmen <vdahm@workpit.dynport>
Wed, 21 Nov 2018 16:15:20 +0000 (17:15 +0100)
presentation.tex
slides/01-motivations.md
slides/02-Methodology.md
slides/03-Experiments.md
slides/99-End.md

index 8a53c4a67f141234b3f4a6acbb62c807f0259a89..c7c1a0a34a40f101728a80529511680250a4ef2d 100755 (executable)
@@ -1,10 +1,10 @@
 \documentclass[14pt]{beamer}
 %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
 % Meta informations:
-\newcommand{\trauthor}{Vincent Dahmen (Dr. Sascha Griffiths, Tayfun Alpay)}
+\newcommand{\trauthor}{Vincent Dahmen}
 \newcommand{\trtype}{Spottalk} %{Proseminar} %{Seminar} %{Workshop}
-\newcommand{\trcourse}{Evaluating domain control mechanism on NMT using  real life data sets (WIP)}
-\newcommand{\trtitle}{Evaluating domain control mechanism on NMT using  real life data sets (WIP)}
+\newcommand{\trcourse}{Evaluating domain control mechanism on NMT using  real life data sets}
+\newcommand{\trtitle}{Evaluating domain control mechanism on NMT using  real life data sets}
 \newcommand{\trmatrikelnummer}{6689845}
 \newcommand{\tremail}{4dahmen@informatik.uni-hamburg.de}
 \newcommand{\trinstitute}{Dept. Informatik -- Knowledge Technology, WTM}
 \begin{frame}[plain] % plain => kein Rahmen
   \titlepage
 \end{frame}
-\setcounter{framenumber}{0}
-
- \frame{
-       \frametitle{Outline}
-       \tableofcontents
- }
+%\setcounter{framenumber}{0}
+%
+% \frame{
+%      \frametitle{Outline}
+%      \tableofcontents
+% }
 
 %%%%%%%%%%%%%%
 % Your Content
index f8e48760432d15394ab4e2646fe45ba6266db100..60b2854084274e9d6b56b3bc8e3220981c9e2bf8 100644 (file)
 ## Why does it matter?
 - supportive facts are complex to learn 
   - even for humans
-- evaluating a working approach with new data is necessary to proove it
+- evaluating a working approach with new data is necessary to prove it
 - collecting new datasets allows more precise evaluation of new models
 
-## research questions
+## Research Questions
 - How can we transform real life/industry data sets to use in deep learning?
-- How well perform current politeness control mechanism on real life data sets?
-- How well perform current politeness control mechanism on distant language pairs?
+- How well do current politeness control mechanism perform on real life data sets?
+- How well do current politeness control mechanism perform on distant language pairs?
+
 - How big is the impact of automated tone labeling in comparison to manual labeling?
index 7fab00fd03163cfc031c2fcf49d1bd844143a9f3..ff5ebbb103a67c7948968d13bbcbf7a35350d47f 100644 (file)
@@ -1,8 +1,8 @@
 # Methodology
 
 ## Methodology
-- We will try to reproduce the results from \textsuperscript{[Sennrich et. al, 2016]} with multiple data sets
-- Reuse all settings for net training
+- We show the approach from \textsuperscript{[Sennrich et. al, 2016]} with multiple data sets
+- Reuse training software (Groundhog)
 - Use 3 different data sets:
   1) [opensubtitles 2016](https://obj.umiacs.umd.edu/mt-data/OpenSubtitles2016.en-fr.clean.tgz) (original data)
   2) [GYAFC](https://github.com/raosudha89/GYAFC-corpus) (alternate public data)
index 79c6556e0adc504b981087ca0b3175d07aedf3df..6ef9535fb7948451954bd45cb474b20b1bfc3bf0 100644 (file)
@@ -1,12 +1,11 @@
 # Experiments and Evaluation
 
-## Experiment 
-- train a neuronal net on multiple data sets using BPE and a fixed vocabulary
-- reduced dataset
+### Experiment 
+- Train a neuronal net on multiple data sets using BPE and a fixed vocabulary
+- Reduced dataset
   - depending on available support through PhraseApp
 
-
-## Evaluation
-- BLUE
+### Evaluation
+- BLEU
 - automated annotaion system by Sennrich
 - for industry data: distance to same translation of other category (if avaialble)
index 0ff7b806ca705d0b9b677780747b1f2138b46670..66971b06ed53069fcdfec2f32f2719c56d483785 100644 (file)
@@ -10,5 +10,3 @@
 ### Literature:
 - Rico Sennrich, Barry Haddow and Alexandra Birch. NAACL\_HLT. \emph{In: Proceedings NAACL\_HLT, pages 35-40}, 2016 
 - Xing Niu, Sudha Rao, and Marine Carpuat. COLING 2018 \emph{In Proceedings of the 27th International Conference on Computational Linguistics} ,  2018
-- Author, Author, and Author. Name of the Article. \emph{Name of the Journal}, 42:111-133, Year
-- Author, and Author. \emph{Name of the Book}. Publisher, Year