Bachelor-Seminar WIF 640 (BUJ): Reports publizieren mit Markup-Sprachen

Koordinaten:

Zur gleichzeitigen Codierung von Text, Programmen und Daten haben sich seit einigen Jahren textbasierte Markup-Sprachen wie reStructuredText, Wiki-Markup und Markdown auf breiter Front durchgesetzt:

  • In der Data Science werden mit Jupyter-Notebooks Programm und sein Dokumentation engestens miteinander verwoben und mit Pandoc Cross-Media publiziert.
  • Mathematiker, Physiker und viele andere technische Autoren benutzen seit gut 40 Jahren sowieso nichts anderes als LaTeX;
  • Um menschenlesbar komfortabel Daten notieren und austauschen zu können bietet sich json und yaml an.
  • Im Semantic Web Umfeld werden mit textbasierte RDF-Serialisierungen wie Turtle komplexe Knowledge Graphs notiert.

Im Seminar stellen wir die verschiedenen Formate und Technologie-Stacks vor, mit denen sich Wirtschafts- und Unternehmensdaten publizieren lassen.

Wir untersuchen vergleichend, worin ihre Stärken und Schwächen liegen, und welche Teilmengen an Ausdrucksmitteln sich verlustfrei ineinander überführen lassen.

Insgesamt geht es darum im Detail zu verstehen, wie eine integrierte Datenhaltung von Text, Code und Daten für Cross-Media-Publishing verwendet werden kann.

Themen

Jeder Seminarteilnehmer muss sich die Grundlagen aneignen von Markdown, LaTeX, Pandoc und json.

Themen und Termine

KW Thema
41, 42 Vorstellung der Themen
Themenwahl in Moodle
43 Besprechung Termine
Hausaufgabe siehe http://jbusse.de/2019_ws_dsci/dsci-lab.html: Virtualbox installieren, OVA downloaden, nach Möglichkeit zum Laufen bringen
44 Einführung JB in die virtuelle Maschine; Linux-Grundlagen
45 Dienstreise JB / Vorbereitungszeit für TN, kein Unterricht
46 Git Basics
Distributed Git - Distributed Workflows
47 LaTeX https://en.wiktionary.org/wiki/TeX: The final consonant of TeX is intended by its developer to be pronounced similar to loch or Bach. The letters of the name are meant to represent the capital Greek letters Τ (tau), Ε (epsilon), and Χ (chi), as TeX is an abbreviation of Ancient Greek τέχνη (tékhnē), which is also the root word of technical. However, English speakers often pronounce it /tɛk/, like the first syllable of technical.
Citavi
Markdown
48 Tag der Lehre, also keine Veranstaltung
49 Jeder (!): Pandoc
Zotero
50 reStructuredText
html5
Dokuwiki und Media-Wiki
51 Transclusion in Dokuwiki
Json
BibTeX
JB: Jupyter Notebooks, ipynb, markdown
FREI: Citeproc
2/2010 keine Veranstaltung
3 Integrations-Workshop

Präsentation

Aspekte

  • das Format selbst
  • Geschichte: Wer, wozu? Rezeption, aktuelle Entwickungen?
  • typischer Einsatz-Kontext
  • Editor-Unterstützung (z.B. notepad++, emacs, andere?)
  • Zusammenarbeit mit der Literaturverwaltung
  • Roundtrip mit Pandoc zu und von Markdown
  • Publizieren als html und pdf
  • Demo-Dokument: möglichst fancy: ausreizen und zeigen, was geht!
  • Demo am laufenden System

Medien

  • Im mündlichen Vortrag ist einen live-Demonstration enthalten, wie in dem jeweiligen Umfeld ein Dokument als Web- und/oder pdf-Dokument publiziert werden kann.
  • Sujet-typisch bietet es sich an, in diesem Demo-Dokument den Inhalt des Vortrags selbst zu spiegeln, d.h. das Dokument als ein erweitertes schriftliches Handout zum Vortrag zu konzipieren.
  • Als Texttyp für dieses Handout bietet sich ein wissenschaftlichen Short-Paper im Umfang von ca 2000 Wörter an, incl. Abbildungen, wiss. Zitaten und einem ordentlichen Literaturverzeichnis.
  • Wir verwenden das Seminar insbesondere auch dazu, an einem kleinen, vergleichsweise einfachen Thema das wissenschaftliche Präsentieren (Vortrag plus wissenschaftliches Handout) auszuprobieren.

Abgabe

Abgabe der schriftlichen Ausarbeitung bis 15.2.2010 auf Moodle: https://moodle.haw-landshut.de/mod/assign/view.php?id=154766