66 Matching Annotations
  1. Last 7 days
    1. Hotspot für Openness in den Anwendungsdomänen Digital Humanities

      Viele Fremd- und Fachwörter, für Personen, die aus den Geisteswissenschaften kommen vielleicht schwer zu verstehen

    1. Kontakt: Universität Potsdam Potsdam Graduate School QUADRIGA Datenkompetenzzentrum Am Kanal 47 14467 Potsdam Tel.: +49 331 977-4595 Fax: +49 331 977-4555 E-Mail: robin.moeser@uni-potsdam.de Impressum der Universität Potsdam

      Das ist richtig so?

    1. In diesem Kapitel wurde durch eine quantitative Analyse von Worthäufigkeiten des semantischen Felds “Grippe” die Forschungsfrage untersucht,

      Haben wir untersucht...

    1. Inzwischen lassen sich zahlreiche weitere Beispiele finden, die zeigen, wie aufschlussreich n-Gramm-Analysen sein können. Betrachtet man etwa im englischen Google-Books-Korpus alle 2-Gramme, die mit dem Verb “to hate” (hassen) beginnen und mit einem Substantiv enden, so gehört 2-Gramme “hate war” (den Krieg hassen) zu den häufigsten Treffern. Auffällig sind dabei zwei sehr ausgeprägte Häufigkeitsspitzen, die zeitlich mit dem Ersten und dem Zweiten Weltkrieg zusammenfallen.

      Spannend

    1. Die Grundlage unserer Analyse besteht darin, die Textstellen zu identifizieren

      Die Analyse hat das Ziel Textstellen... Sehr komplizierter Satz gerade

    2. In der Korpusanalyse kehren wir wieder zu unserer Fragestellung und auf die Operationalisierung der Fragestellung zurück. Unsere Fragestellung lautet:

      Kehren wir zu unserer Fragestellung zurück, die lautet...

    1. Im Folgenden wird exemplarisch der Roman “Feldblumen” von Adalbert Stifter (txt-Datei) mit der Bibliothek spaCy annotiert. Es werden folgendene Schritte durchgeführt:

      ganz oft folgend

    1. CSV-Datei, bei der in der ersten Zeile ein Tabellenkopf steht, in den dann folgenden Zeilen jeweils zunächst eine durchzählende ID, dann ein Wort, gefolgt von weiteren linguistischen Informationen: der Grundform (“Lemma”) und der Wortart (“POS”, “Part of Speech”)

      Hier sieht man auch schön, den Zusammenhang zwischen Text und Tabelle. Es lässt sich nicht immer so leicht trennen

    2. Beispiel für eine XML-Kodierung nach TEI-Standard. Im Kopfbereich der Datei steht der <teiHeader> mit Metadaten, es folgt das <text>-Element, in dem der Text mit Strukturinformationen (z.B. <head> für Überschrift) gesoeichert wird

      Mega!

    3. Zudem ist die Erstellung in den entsprechende Editoren unterschiedlich, etwa des weit verbreiteten Oxygen XML Editors, Notepad++ oder Atom, was den Einstieg erschwert.

      Sind die open-source? Oxygen zumindest nicht. Ein Hinweis dazu wäre vielleicht sinnvoll

    4. Die Grippe wütet weiter Zunahme der schweren Fälle in Berlin.  Die Zahl der Grippefälle ist in den letzten beiden Tagen auch in Groß-Berlin noch deutlich gestiegen. Die Warenhäuser und sonstigen Geschäfte, die Kriegs- und die privaten Betriebe klagen, dass übermäßig viele Angestellte krank melden müssen, und auch bei der Post und bei der Straßenbahn ist die Zahl der Grippekranken bedeutend gestiegen. Beispiel für Reinen Text ohne jede Formatierung, üblicherweise als TXT-Datei gespeichert

      Sehr schön, gern mehr Beispiele einbauen

    1. Sammlungen von maschinenlesbaren Textdokumenten, die nach bestimmten Kriterien zusammengestellt wurden.

      Deutlicher Machen. Korpora sind sehr grundlegend für das OER. Das sollte auf jeden Fall hängen bleiben

    1. – sowohl für das gesamte Korpus als auch für einzelne Elemente –

      die Gedankenstriche geben ChatGPT-Vibes. Vielleicht lieber Kommas?

    1. Im zurückliegenden Kapitel haben wir die Forschungsfrage der vorliegenden Fallstudie expliziert und mithilfe von historischen Visualisierungen veranschaulicht. Um die Forschungsfrage für eine quantitativ-digitale Analyse adressierbar zu machen, haben wir eine Operationalisierung vorgenommen, durch die wir einen Messvorgang definieren können, der als Antwort für die Frage gelten kann. Im nächsten Kapitel werden wir nun unser Forschungskorpus aufbauen, auf dem wir den Messvorgang durchführen werden. { requestKernel: true, binderOptions: { repo: "binder-examples/jupyter-stacks-datascience", ref: "master", }, codeMirrorConfig: { theme: "abcdef", mode: "python" }, kernelOptions: { name: "python3", path: "./research_question" }, predefinedOutput: true } kernelName = 'python3'

      Sehr schön mit dem "Wir"

    2. Jede Operationalisierung bringt diskutable Einschränkungen mit sich. Die kritische Reflexion dieser Grenzen ist essentieller Bestandteil von Digital-Humanities-Projekten.

      Vielleicht etwas dazu schreiben, dass auch traditionelle Methoden Einschränkungen mit sich bringen. Sonst bleibt hängen, dass DH super kritisch ist und der Rest nicht