Anmerkungen
Beispiele der Textauswahl
Gellert: Eine sehr umfassende Auswahl aus den poetischen Werken, die in
der Insel-Ausgabe zu finden sind: Alle Fabeln, Von den Gedichten nur die
Geistlichen Oden, nicht aber die Moralischen Gedichte und
die Moralischen Charaktere. Von den Lustspielen Die zärtlichen
Schwestern, nicht aber Die Betschwester. Aus dem 2. Band wurde
nur noch der Roman "Leben der Schwedischen Gräfin von G**" aufgenommen,
die theoretischen Schriften und Briefe aber weggelassen.
Schiller: Sehr umfassende Gedichtauswahl. Alle größeren Dramen
(es fehlen die Texte unter der Rubrik "Kleinere dramatische Arbeiten" aus
dem 2. Band, sowie alle dramatischen Fragmente, Übersetzungen und
Bühnenbearbeitungen). Leider fehlen auch die historischen Schriften
vollständig. Vier von den sieben Erzählungen Schillers wurden
aufgenommen, es fehlen"Eine großmütige Handlung", "Spiel des
Schicksals" und "Haoh-Kiöh-Tschuen". Eine einsichtige Auswahl aus
den theoretischen Schriften ergänzt den Schillerteil.
Fontane: Von den 17 Romanen der Aufbau-Ausgabe wurden fünf der
kleineren (Ellernklipp, Graf Petöfy, Unterm Birnbaum,
Quitt, Die Poggenpuhls) weggelassen. Die Gedichte, Reisebeschreibungen,
Theaterschriften fehlen ganz.
Boolesche Operatoren
Nach dem Mathematiker Boole bezeichnete Operatoren für die Formulierung
von Abfragen. Inzwischen in fast allen Suchmaschinen implementiert. Üblicherweise
stehen die Operatoren UND, ODER und NICHT zur Verfügung.
Die Abfrage "Herz UND Schmerz" findet alle Vorkommnisse, in denen sowohl
"Herz" als auch "Schmerz" vorhanden sind. Mit "Herz ODER Schmerz" wird
die Menge gefunden, in der sich entweder "Herz" oder "Schmerz" (oder beides)
befindet. Treffer für die Abfrage "Herz NICHT Schmerz" ist die Menge,
in der sich nur "Herz", aber nicht "Schmerz" findet. Der Operator NICHT
steht in der Digitalen Bibliothek nicht zur Verfügung.
Welche Einheit der Suche zugrundeliegt, ist von der Suchmaschine abhängig.
Internet-Suchmaschinen verwenden als Einheit, in der z.B. die Worte "Herz"
und "Schmerz" vorkommen müssen, die Datei. Andere Maschinen verwenden
interne Einheiten (z.B. Records) oder Textseiten. Die Digitale Bibliothek
überläßt dem Anwender die Definition der Einheit, da er
/sie den Wortabstand festlegen können. Treffer sind dann alle Texte,
in denen "Herz" und "Schmerz" im Abstand von x Worten vorkommt. Dies erlaubt
sehr flexible Fragestellungen, Suchen in Einheiten wie "in einem Absatz"
oder "in einer Gedichtstrophe" oder "in einem Vers" sind jedoch nicht möglich.
Text Encoding Initiative (TEI)
Eine internatione Kooperation von Philologen, um einen Standard zur Textauszeichnung
zu definieren, der unabhängig von der verwendeten Hardware, dem Betriebssystem
und dem Anwendungsprogramm ist. TEI wird inzwischen in zahlreichen größeren
editorischen Projekten verwendet. Die Homepage der TEI finden sie hier.
Weitere Links zum Thema TEI finden Sie in der Linksammlung der Computerphilologie.
Reguläre Ausdrücke
Ein regulärer Ausdruck (regular expression) bezeichnet - sehr
abstrakt formuliert - die Definition einer Zeichenmenge. Diese Definition
wird bei der Suche verwendet, um zu entscheiden, ob die augenblicklich
untersuchten Zeichen Treffer sind oder nicht. Die bekannten Platzhalter
* und ? sind eine sehr abgemagerte Version der Syntax zur Formulierung
eines r.A. Allerdings ist die Sytax r.A. meist deutlich komplexer. So steht
das * zumeist nicht für "beliebig viele beliebige Zeichen", sondern
für "das vorhergehende Zeichen gar nicht oder beliebig oft". Außerdem
lassen sich Zeichenmengen bilden. Einige Beispiele:
10+ Bedeutung: suche eine 1 und eine oder mehrere 0. Treffer:
10, 100, 1000
10* Bedeutung: suche eine 1 und keine, eine oder mehrere
0. Treffer: 1, 10, 100
d[aei]s Bedeutung suche ein d, dann entweder ein a, ein e oder ein
i, dann ein s. Treffer: das, des, dis
Kombinationen sind ebenfalls möglich:
d[aei]+s Bedeutung: suche ein d, dann entweder mindestens ein
a, ein e oder ein i beliebig oft. dann ein s. Treffer: das, dies,
R.A. wurden im Bereich der Anwendungswerkezuge des Betriebssystems
Unix standardisiert. Besondere Verbreitung hat die Syntax der Skriptsprache
Perl gefunden, in der auch die Beispiele
notiert sind; Perl steht inzwischen auf nahezu allen Betriebssystem zur
Verfügung.