Anmerkungen

Beispiele der Textauswahl

Gellert: Eine sehr umfassende Auswahl aus den poetischen Werken, die in der Insel-Ausgabe zu finden sind: Alle Fabeln, Von den Gedichten nur die Geistlichen Oden, nicht aber die Moralischen Gedichte und die Moralischen Charaktere. Von den Lustspielen Die zärtlichen Schwestern, nicht aber Die Betschwester. Aus dem 2. Band wurde nur noch der Roman "Leben der Schwedischen Gräfin von G**" aufgenommen, die theoretischen Schriften und Briefe aber weggelassen.

Schiller: Sehr umfassende Gedichtauswahl. Alle größeren Dramen (es fehlen die Texte unter der Rubrik "Kleinere dramatische Arbeiten" aus dem 2. Band, sowie alle dramatischen Fragmente, Übersetzungen und Bühnenbearbeitungen). Leider fehlen auch die historischen Schriften vollständig. Vier von den sieben Erzählungen Schillers wurden aufgenommen, es fehlen"Eine großmütige Handlung", "Spiel des Schicksals" und "Haoh-Kiöh-Tschuen". Eine einsichtige Auswahl aus den theoretischen Schriften ergänzt den Schillerteil.

Fontane: Von den 17 Romanen der Aufbau-Ausgabe wurden fünf der kleineren (Ellernklipp, Graf Petöfy, Unterm Birnbaum, Quitt, Die Poggenpuhls) weggelassen. Die Gedichte, Reisebeschreibungen, Theaterschriften fehlen ganz.
 

Boolesche Operatoren

Nach dem Mathematiker Boole bezeichnete Operatoren für die Formulierung von Abfragen. Inzwischen in fast allen Suchmaschinen implementiert. Üblicherweise stehen die Operatoren UND, ODER und NICHT zur Verfügung.
Die Abfrage "Herz UND Schmerz" findet alle Vorkommnisse, in denen sowohl "Herz" als auch "Schmerz" vorhanden sind. Mit "Herz ODER Schmerz" wird die Menge gefunden, in der sich entweder "Herz" oder "Schmerz" (oder beides) befindet. Treffer für die Abfrage "Herz NICHT Schmerz" ist die Menge, in der sich nur "Herz", aber nicht "Schmerz" findet. Der Operator NICHT steht in der Digitalen Bibliothek nicht zur Verfügung.
Welche Einheit der Suche zugrundeliegt, ist von der Suchmaschine abhängig. Internet-Suchmaschinen verwenden als Einheit, in der z.B. die Worte "Herz" und "Schmerz" vorkommen müssen, die Datei. Andere Maschinen verwenden interne Einheiten (z.B. Records) oder Textseiten. Die Digitale Bibliothek überläßt dem Anwender die Definition der Einheit, da er /sie den Wortabstand festlegen können. Treffer sind dann alle Texte, in denen "Herz" und "Schmerz" im Abstand von x Worten vorkommt. Dies erlaubt sehr flexible Fragestellungen, Suchen in Einheiten wie "in einem Absatz" oder "in einer Gedichtstrophe" oder "in einem Vers" sind jedoch nicht möglich.
 

Text Encoding Initiative (TEI)

Eine internatione Kooperation von Philologen, um einen Standard zur Textauszeichnung zu definieren, der unabhängig von der verwendeten Hardware, dem Betriebssystem und dem Anwendungsprogramm ist. TEI wird inzwischen in zahlreichen größeren editorischen Projekten verwendet. Die Homepage der TEI finden sie hier. Weitere Links zum Thema TEI finden Sie in der Linksammlung der Computerphilologie.
 

Reguläre Ausdrücke

Ein regulärer Ausdruck (regular expression) bezeichnet - sehr abstrakt formuliert - die Definition einer Zeichenmenge. Diese Definition wird bei der Suche verwendet, um zu entscheiden, ob die augenblicklich untersuchten Zeichen Treffer sind oder nicht. Die bekannten Platzhalter * und ? sind eine sehr abgemagerte Version der Syntax zur Formulierung eines r.A. Allerdings ist die Sytax r.A. meist deutlich komplexer. So steht das * zumeist nicht für "beliebig viele beliebige Zeichen", sondern für "das vorhergehende Zeichen gar nicht oder beliebig oft". Außerdem lassen sich Zeichenmengen bilden. Einige Beispiele:
10+   Bedeutung: suche eine 1 und eine oder mehrere 0. Treffer: 10, 100, 1000
10*   Bedeutung: suche eine 1 und keine, eine oder mehrere 0. Treffer: 1, 10, 100
d[aei]s Bedeutung suche ein d, dann entweder ein a, ein e oder ein i, dann ein s. Treffer: das, des, dis
Kombinationen sind ebenfalls möglich:
d[aei]+s  Bedeutung: suche ein d, dann entweder mindestens ein a, ein e oder ein i beliebig oft. dann ein s. Treffer: das, dies,
R.A. wurden im Bereich der Anwendungswerkezuge des Betriebssystems Unix standardisiert. Besondere Verbreitung hat die Syntax der Skriptsprache Perl gefunden, in der auch die Beispiele notiert sind; Perl steht inzwischen auf nahezu allen Betriebssystem zur Verfügung.