Andere Projekte:
* epidat (jüdische Grabinschriften)
- komplett webbasiert
- z.Z. Umstieg von TEI P4 auf P5

Community Building
Interessengemeinschaft Digital Humanities auf nicht-institutionalisierter Ebene
- Webseite / Portal
– Ankündigungen
– Projektvorstellungen
– Job offers
- Zielgruppe: Nicht Lehrstühle

International gibt es bereits centernet
In Deutschland das virtuelle Institut für Dokumentologie und Editorik

Ein Portal wird im Rahmen der Etablierung des Studierens von Digital Humanities in Deutschland erstellt; darüber gab es einen Vortrag auf der Digital Humanities London (hier? -> Jannidis)

Studiengänge und Studienmodule im Bereich der “Digital Humanities”
-> jeder kann auf den Verteiler
-> mitreden kann man, wenn man Lehre (ab Modul-Level) anbietet, die sich als DH versteht

Feedback und Ausblick
(bitte ergänzen! wollte doch jemand mitschreiben und posten?!)

No tags

recensio.net
DFG-Projekt: BSB, DHI Paris, Inst. f. europäische Geschichte (Mainz)
Rezensionen zur europäischen Geschichte
-> Zusammenführung “klassischer” Rezensionen aus Fachzeitschriften (z.T. mit Moving Wall)
-> Online-Publikationen
=> zentraler Anlaufpunkt

- Veröffentlichung als PDFs
- Kommentarfunktion (zumindest in der ersten Phase moderiert; Veröffentlichung unter Klarnamen)
- Publikationen von Abstracts, die Autoren selbst von ihren Werken verfasst haben,

Etablierung? Motivation?
- Vorläufer: sehepunkte
- Argument: Sichtbarkeit
- Seriosität durch Institutionen gegeben
- (persönliches) Anschreiben von Institutionen und einzelnen Wissenschaftlern

Anderes Bsp.: Book Notices in eLanguage
- WordPress postings
- (Unbeabsichtigter) Effekt: wird mit google gut gefunden! (besser als rezensierter Artikel selbst)
- Retrodigitalisierung (Printartikel von kleinen Fachgesellschaften) brachte Aufmerksamkeit (durch Masse)

Nachnutzung??

Kommentare:
- muss sich gegen etablierte Plattfomen durchsetzen
– sehepunkte werden eingebunden
– H-Soz-Kult?
- Content muss bereits bei Projektstart vorhanden sein – wird auch

Hinweis: recensio.net wurde auch auf der Digitale Wissenschaft 2010 vorgestellt; ein Abstract des Vortrages von Prof. Dr. Gudrun Gersmann und Dr. Lilian Landes ist im PDF und auf iversity zu finden.

Sozialer Zettelkasten
(bitte ergänzen!)

No tags

Visualisierung

Stichworte:
- Interaktivität
- sinnvoll?
- Navigation
- Geoinformationssysteme
- Ästhetik
- …

* immer eine Art von Interpretation (?)
* Werkzeug für die Forschung?
* Ästhetisierung von Daten?
* Demokratisierung (was das Verständnis angeht)?

Tools:
* wordle.net
- erstellt Word-Clouds
* Many Eyes (IBM)
- Wordclouds
- Netzstrukturen
* Google Charts
* igraph (Erweiterung von R)
* gephi.org
- graphische Oberfläche
- OS
- liest alle gängigen Graphenformate
- kann Gewichtungen, Highlighting, bewegliche Darstellung der Graphenformate
* openprocessing.org
- produziert Applets, kann in Webseiten eingettet werden (die meisten anderen auch)
- code-Beispiele und Visualisierung: benfry.com

Auswertung von visualisierten Daten?
- dann wieder auf Zahlen / Textdaten zurückgreifen
- Visualisierungen eher zum Auffinden von Besonderheiten

Literaturempfehlung: Edward R. Tufte, “Envisioning Information” bzw. “The visual display of quantitative information”

Sprachdokumentation: das DoBeS-Archiv

Archiv: MPI Nijmegen
- ca. 80TB, 300.000 Objekte

Tools:
Elan: Transkripte, die mit audio und video mitlaufen
- das Format kann von anderen Programmen gelesen werden, z.B. praat, Toolbox
- es kann auch die Formate von den anderen Programmen einlesen

Portale:
* Community portal (für die Sprechergemeinschaft)
* Allgemeines Portal (Journalisten, Allgemeinheit, Wissenschaftler)

Fragen:
* Navigation: Wie finde ich heraus, was die Nutzer wollen?
- Stichwort Usability testing
- Experten (Konzeptioner, Web-Designer) hinzuziehen

* Welche Funktionen könnte das Archiv noch anbieten? (Web 2.0, wiss. Tools)
- Vernetzung: bei anderen Webseiten Teaser anbringen; an Lexika / Wörterbücher, Ontologien anknüpfen

Kommentare:
- Daten freigeben!?

No tags

Wikipedia, Wikimedia, Wikisource

* heute: Wie kriege ich Inhalte aus Wiki… raus, um sie für die Forschung zu benutzen?
* Wikipedia als “Weltwissen”, konsensualer, common sense Diskurs
* Wikimedia / Wiki Commons als Materialarchiv
* Wikisource als Textarchiv

* Wikipedia-Artikel sind hochgradig strukturiert / formalisiert
- Infoboxen
- Kategorisierungen
- Verlinkung mit externen Ressourcen, Normdaten
- Internationale Parallelversionen
- Versionierung

* Nachteile:
- auch die Kategorisierung – wenn da nämlich was nicht stimmt / die Definition unklar ist
- Gleichmäßigkeit; Qualität der Information
- Parsebarkeit der Information – des Fließtexts

Wikipedia, Voraussetzungen für Weiterverarbeitung:
- kanonische Namen (URLs) als permanente Adressen
- XHTML -> als XML-Baum parsebar
- Wikiseiten sind auf Sammelseiten (Listen) zusammengefasst
– mit Schleifen, rekursiv, zu verarbeiten (weil Listen auf andere Listen verweisen)
- z.B. Tortendiagramme können von google gemacht werden (1 Zeile, man schickt Parameter)

Bsp. aus der Lehre: http://itzert.phil-fak.uni-koeln.de/

Fortgeschrittene Beispiele:
- WikiPhiloSofia
– Daten aus Wikipedia wurden als semantische Informationen aufbereitet
- DBpedia (angesiedelt hauptsächlich in Leipzig) = nochmal andere Aufbereitung
– Semantic Web Ansätze, Einbindung von Ontologien

Fazit:
Man sollte seine Daten so als XHTML veröffnetlichen, dann kann jede_r sie so weiterverarbeiten

Open Source für gruppierte Suche: Solr

No tags

Brain/Concept/Writing a.k.a. Der Tisch
* ein Projekt am humtec RWTH
* Human Computer Interaction (HCI)
* Ausgangspunkt: Beobachtung des Arbeitsablaufs bei Erstellung von Editionen
- üblicherweise sowohl analoger als auch digitaler Arbeitsplatz
* Ziel: Das Gute des analogen Arbeitens beibehalten und mit digitalen Möglichkeiten kombinieren

=> Entwicklung eines interaktiven Tisches
- analoge Bücher werden erkannt
- Notizen können auf den Tisch geschrieben werden und werden gespeichert
– werden den Seiten zugeordnet, weil eine Kamera auf den Tisch schaut!
- Datenbankanbindung (prototypisch): TextGrid
- Speichern der Notizen / Projekte auch in TextGrid
- Kosten (nur Hardware): 10-15k
- Software ist eng an die Hardware gebunden – deshalb nicht frei angedacht! (?!)

Pläne: Scanner-Stift
Kritik: Sinnvoller wäre es, auch mit einem digitalen Buch zu arbeiten
Hinweis: Dieses Projekt wurde auch von Prof. Karin Herrmann auf der Digitale Wissenschaft 2010 vorgestellt. Das Abstract zum Vortrag findet sich sowohl im PDF als auch auf iversity.

Interfaces – Bsp. Arachne
* arachne.uni-koeln.de
* work in progress
* Grundlage: Relationale Datenbank, indexiert mit Lucene
* -> “RDF ist nicht performant genug für so große Datenmengen”
* Suche in einzelnen Kontexten, die untereinander vernetzt sind
Ausgehend von einem Objekt
- Metadaten im Datensatz, werden gleich angezeigt
- Kontextbrowser
– zentrierter Baum: Objekt in der Mitte, 2 Ebenen
– Verknüpfungen automatisch?

Diskussion:
Suche / Visualisierung ist vorbildlich
-> Wie kann man ein intuitiv / allgemein verständliches Interface für digitale Ressourcen schaffen?

Blogs
-> dort passieren: intensive Auseinandersetzungen mit Themen
–> das wollen wir auch in der Lehre

3 Modelle von Blogs in der Lehre:
- Lehrerblog; Schüler lesen
- gemeinsames Projektblog
- Schüler und Lehrer haben jeweils eigene Blogs

-> Es funktioniert meist nicht :(
–> Was tun?

Der “Blogging-Blick”: Blick auf die Welt UND Blick auf mich selbst
Es gibt eine Blogging-Technik, die z.B. auch von kommerziellen Bloggern angewendet wird.
Diese Technik sollten auch Schüler lernen.

No tags

XML
- wurde dafür erfunden, verschachtelte Strukturen abzubilden
–> Relationale Datenbanken können z.B. nicht: Wörter in Sätzen
2 Prinzipien können XML beschreiben:
“XML ist wie HTML, nur anders” und “Erfinde deine eigenen Tags”

XML schema: gibt die Tags und die Struktur vor

X-Path: ermöglicht die Suche in Baumstrukturen, also XML

XSLT: Transformationssprache
-> ca. 50 Befehle, aber man kommt mit wenigen schon zurecht
-> Transformationen in alles möglich, das zeichenbasiert ist

TEI
-> De-facto-Standard für die digitalen Geisteswissenschaften
–> In Anträgen muss Nicht-Benutzung begründet werden
- basiert auf dem “Pizza-Modell” = Costumizing
– man kann sich sein eigenes Schema zusammenstellen

Best practice / Einigung auf Standard?
-> ja, bei Handschriften, Wörterbüchern ( -> Trierer Wörterbuchnetz)
und Epigraphen (epidoc)
- ansonsten entwickelt oft jedes Projekt seinen eigenen Dialekt
– wissenschaftliche Interessen sind unterschiedlich
– konkurrierende “Schulen”

Editoren für XML gibt es auf 3 Ebenen:
1) einfache Texteditoren
2) XML-Editoren (Syntax highlighting, Eingabehilfe), z.B. oXygen (kostenpflichtig)
3) visuelle Editoren (man sieht keine spitzen Klammern)
–> müssen für jedes Projekt spezifisch gebaut werden

Korpora
- Ziel ist oft: repräsentative Aussagen über eine Sprache
- aber auch andere Ziele: z.B. in der Literaturwissenschaft
- (noch) selten frei zugänglich
– Gegenbeispiel: corpus.byu.edu
- Üblichste Annotation: Wortklassen (“getaggt”)
- Üblicherweise selbst erfundene Form der Annotation
- TEI möglich, auch teilw. verwendet (Bsp. British National Corpus)

R
- beliebt in der Korpuslinguistik, aber keine nativen (linguistischen) Features
- free software =)
- Grundlegende Datenstruktur: “Vektor”
- bietet die Möglichkeit, Operationen über mehrere Elemente gleichzeitig auszuführen
- kann Visualisierung
- zahlreiche Extenstions, z.B. iGraph (interaktive Visualisierung)

No tags

Sep/10

17

Einfache Frequenzliste in R

Liebe Leute,

hier wie versprochen der R-Code für die Erstellung einer Frequenzliste.

# Einfache Frequenzliste
# v1.0

# Datei einlesen -- mit der Funktion
# file.choose() geht das interaktiv
# unter Windows/MacOS
txt<-scan(file.choose(), what="char", sep="\n")

# In Kleinbuchstaben konvertieren
txt<-tolower(txt)

# Alle Zeichen entfernen, die nicht
# Leerzeichen, Buchstaben, Zahlen oder "-" sind
txt<-gsub("[^ a-zA-Z0-9-]", "", txt, perl=T)

# Nach Leerzeichen splitten
words<-unlist(strsplit(txt, "\\W+"))

# Eine Tabelle erstellen und diese sortieren
freqs<-sort(table(words), decreasing=T)

# Daten für den Output in eine Datei vorbereiten
output<-paste(names(freqs), "\t", freqs)

# In eine CSV-Datei (lesbar mit Excel,
# OpenOffice Calc usw) schreiben
cat("Token\tFreq", output, file=file.choose(), sep="\n")

# Fertig :-)

# Wenn man noch ein Barplot machen möchte...
# [1:10] bedeutet hier die ersten 10 Einträge
# aus der Frequenzliste
barplot(freqs[1:10])

No tags

Sep/10

17

Raum für Samstag

Bitte nicht vergessen! Am Samstag sind wir im HAUPTGEBÄUDE, Raum 4.016. Wir starten wie geplant um 9:30 Uhr.

No tags

Sep/10

17

Raum

Unser genauer Standort heute ist übrigens der Raum S55 im Philosophikum.

No tags

I would like to propose a session on multimedia archives containing “Language Documentations” and their possible exploitation in linguistics and related fields.

We have been working on the DoBeS-archive for some time now and would be interested in sparking a discussion among digital humanists about what one can do with the data and what tools could be used but also: what limits exist for this type of data. Since this is a new type of resource there don’t seem to be any established methods as of yet (or maybe there are?): Corpuslinguistic tools are usually not fit for this small data collection and video is not yet typically part of large corpora.  We will briefly introduce the DoBeS-archive housed at the MPI in Nijmegen and the tools that have been used for archiving, annotation, etc. We are looking forward to a brainstorm session with all kinds of ideas for uses of our data and new creative techniques or tools that might be useful in our context.

· ·

Im Gespräch mir Patrick ist mir gerade etwas aufgefallen: wir sollten darauf hinweisen, dass beim TCC natürlich auch Projekte (Dissertationen, kooperative Forschung, Tools, Dienste) vorgestellt werden können. Wie gehen eigentlich von einer Dreiteilung in Themensession (Visualisierung, Datenbanken), Tutorials (eine kurze Einführung in Processing, TEI….) und Projektvorstellungen aus (alles mit einen guten Schuss Diskussion, versteht sich), lassen uns aber von euren Ideen überraschen. :-)

See you soon!

Cornelius

No tags

Sep/10

16

Databases

Hello everyone,
Even though this might fit in with some of the topics already proposed, I´d like to suggest a session on databases. This might range from personal databases such as post-it mosaics and bibliography software such as Zotero, Citavi, EndNote and the like to ones that are designed (or not so well designed) for use in small research groups or in classroom to databases potentially open to the public. I am interested in everyone’s experience with handling different media within such databases: scans, paper copies, books, photographs. And I would like to discuss ownership and copyright questions of the data and the thoughts given to them.

· · · · ·

Since it looks like several freshly baked (more or less) PhD students are going to be in mix, I thought I’d suggest a session on Digital Humanities PhD projects. This could include both conceptual and practical things such as:

– What do potential research projects in DH look like?

– How should I approach data?

– What methods (computational and otherwise) are at my disposal?

– Where do I publish my thesis? Paper, electronic, or both?

– What to do if I run out of ideas?

– What to do if I can’t finish?

Et cetera. This could be both about giving advice and simply presenting your approach — I think since most of us work either alone or in very small teams scattered across the country it will be interesting in itself to just hear who is doing what.

No tags

Sep/10

9

Blogging in the humanities

Perhaps it would be interesting to do a session on use of blogs in the humanities? We could touch on topics like organizing research via collaborative blogs, using blogs to share your ideas with colleagues, students, the general public, using blogging in teaching, etc. I’d love to do a little something about “student blogging”, and I hope there are  other people here who’d like to share their experiences with and ideas about blogging in the humanities.

No tags

Aug/10

20

Program structure is up

We’ve posted a general overview of the schedule for the 1.5 days of the camp here. The sessions will take place at the Philosophikum at U Cologne, probably in 3-4 rooms. Snacks and wireless Internet access will provided by the CCeH.

Older posts >>

Modified jQ theme, logo design by Gero Brümmer. THATCamp is a trademark of the Center for History and New Media