Ulrich Müller & Raimund Drewek RZU Zürich
EXPERIMENTELLE LINGUISTIK April 25, 1987
  dok gmlgdoc

SARA-DOKUMENTATION

BESCHREIBUNG DES TEXTGENERIERENDEN
PROGRAMMES SARA

>

Methode
>
>
LDVLlB:
>
>
Linguistische Datenverabeitungs Library RZU Rechenzentrum der Universität Zürich Raimund Drewek
>
>
LDVLIB analysiert Texte und verarbeitet die erfassten Daten linguistisch, statistisch und lexikographisch. SARA synthetisiert Texte; mit Zufalls- generatoren werden Gedichte und Prosa generiert.
>
>
Analyse: LDVLIB (PLI)
> Lexikographie, linguistische Analyse: Raimund Drewek Wiesentalstr. 1 B D-7000 Stuttgart 70 Tel: 0049711 7656460
>
>
Synthese: SARA (MPROLOG) Experimentelle Linguistik:
>
>
Ulrich Müller Badenerstr. 682 8048 Zürich Tel: 0 I 62 17 17
>
>
MPROLOG:
>
>
EXPERIMENTELLE LINGUISTIK Seite 2

Programm SARA: Satz-Random-Generator
>
>

Das MPROLOG-Programm SARA produziert mit Zufallsgeneratoren, Selektionsmatrizen und einem Wortgedächtnis auf variierenden Aktions­ebenen verstehbare Texte mit stimmbaren Adjektiven und satzübergreifen­dem semantischem Ductus. Das Weltwissen von Sara, die Textmodelle und Denkmusterlliegen in mehrdimensionalen Matrizen. Strukturen sind vernetzte Nischen. Medikamente und Enzyme sind zwei- bis drei-dimensi­onale Nischennetze; neue Stoffe werden durch Variation der Nischenfül­lungen kreiert; ihre Verwendbarkeit prüft das Wirkungsprofil.
Ein Satz ist ein eindimensionales Nischennetz, ein lineares Nischenkollek­tiv. Ein Satz besteht aus syntaktischen Nischen. Zur synthetischen Herstellung von Texten füllt Sara diese syntaktischen Nischen mit ran­domisiertem Inhalt. Das Wirkungsprofil, die Akzeptanz der kreierten Texte entscheidet über deren Verwendbarkeit. Sara generiert moderne Lyrik, Gedichte und Prosa. Für Text-Variationen randomisiert Sara Syntax oder Inhalt der ausgewählten Texte. Es entstehen "Artefakte von Celan bis Blick". In Anlehnung an cad (computer aided design) nenne ich dieses "poetische Randomsystem" carp (computer aided random poetry).

Sara imitiert die menschliche Textproduktion; anstelle der Phantasie des Schriftstellers tritt der Zufallsgenerator. Die Macht des Zufalls prägt diese Texte. Randomisierte Geschichten verfügen über eine erstaunlich hohe Akzeptanz. Der stochastische Textgenerator ermöglicht Stilimitationen, die kaum mehr als Artefakte erkannt werden können. Die Celan-Variationen "erstrahlen" durch die Magie des Zufalls; sie zeigen zudem die Dominanz der syntaktischen Struktur. Werden die syntaktischen Nis­chen eines Celangedichtes nicht mit Zufalls worten aus dem Celanlexikon, sondern mit Zufallsworten aus dem Nietzschelexikon gefüllt, so bleibt das Gedicht ein "Celan-Gedicht"; die syntaktische Struktur dominiert, das Lexikon coloriert.

Der deutsche Vers ist ein komplexes Gebilde dessen genaue Struktur selbst Dichter und Wissenschafter oft nicht recht durchschauen. [1:34]
Sara imitiert die Texte empirisch; gesteuert durch die syntaktischen und semantischen Topographien der zugrunde liegenden Texte generiert sie die randomisierten Textvariationen.

Bei archäologischen Funden versuchen Laboratorien Figuren und Formen nachzubilden; das Landesmuseum kopiert mit modernsten Mitteln solche Funde; die Kopien können kaum mehr vom Original unterschieden wer­den. Sara kopiert in ähnlicher Weise "literarische Funde". Bei der Nachbil­dung bleiben wir nicht bei einer reinen Kopie des Gedichtes stehen, son­dern übernehmen nur die metrische Struktur und varüeren mit dem Zufalls generator den Inhalt. Die Akzeptanz der "neu kreierten" Gedichte

1von Matt, NZZ Tagebücher

EXPERIMENTELLE LINGUISTIK Seite 3

gibt Aufschluss über die Macht der metrischen und semantischen Struktu­ren. Sara kreiert Gedichte und Prosa mit variierenden literarischen Algo­rhythmen. Dichter giessen oft Banalitäten in starre magische Formen; stereotyp wiederholte Banalitäten in starren syntaktischen Formen gehör­ten schon zum rituellen Inventar der alt ägyptischen Priester. Stereotypien sind naturgemäss die Domäne des Computers.
Frasmen sind individuelle Wortverbindungen, solche also, die der Sprecher aufgrund der syntaktischen Regeln der Sprache produziert, freie Wortverbindungen. [21: 2] Alle kommunikativen Prozesse verlaufen in Frasmen. Altägyptische Sarcophagaufschriften wirken ebenfalls durch Frasmen; schreiben, spre­chen, gehen, essen, lieben, riechen, zum Arzt laufen, beten, sterben, alles geschieht in verbalen oder averbalen Frasmen.
Ein Schriftsteller kann seinen syntaktischen Frasmen nicht entrinnen, er ist ihr Gefangener; er hat seinen Stil, er hat seine Frasmenstereotypie. Die syntaktischen Frasmen sind die Atome des Stils.
Mit Chomsky-Mathematoiden lässt sich die Sprache nicht fassen; man kann nur Abdrücke von ihr nehmen, Frasmen-Moulds, Frasmen­Landschaften, syntaktische und semantische Topographien. [44] Die semantischen oder syntaktischen Topographien steuern die Gener­ierung der Imitationen.
> Ein Sara-Text entsteht folgendermassen:
> Ohne Computer wird ein beliebiger Text in Nischen zerlegt; pro Nische werden dem Lexikon diverse Variationen eingegeben. Das Programm Sara füllt mit dem Zufalls generator diese Nischen mit dem entsprechenden Inhalt. Die Nischenfüllungen, also Worte oder Frasmen, können im Lexi­kon mit semantischen oder syntaktischen Markern versehen werden.
> Es gibt Menschen, aber es gibt weder Farbe noch Kunst; letztere ent­stehen nur im Betrachter, sie sind Hirnreizmittel. Hirnreizung ist ein Bez­iehungsproblem; es hängt sehr ab von der höchstpersönlichen Innenlage [4:37] des jeweiligen Kulturkonsumenten. Schrifsteller produzieren Hinmreizmittel, Mist zwischen zwei Buchdeckeln. [2:220]
> Sara ermöglicht die synthetische Herstellung geistiger Drogen.
> Sara generiert Imitationen, Fälschungen und Creationen.
> Sara ist ein neues Hilfsmittel für Dichter und Schriftsteller.
> Sara entflieht der lauernden Gefahr einer kombinatorischen Explosion durch Beschränkung ihrer Möglichkeiten.
>



EXPERIMENTELLE LINGUISTIK Seite 4

KüNSTLICHE INTELLIGENZ
>
>
Expertensysteme: Minestroneproduktion Weltwissen: Hermine isst einen Hamburger
>
>
DAS SPIEL - URSPRUNG DER KREA TIVITäT
>
>
'Niemand weiss genau, was Kreativität eigentlich ist. Ist es göttliche Ein­gebung, spontane Einsicht, zufilliges Kombinieren von Fakten?' [35:85]
>
>
'Vereinfacht ausgedrückt stammt jeder kreative Gedanke aus einem Zufalls generator, der Fakten, Bilder, Ideen, Erinnerungen, Perzeptionen in kleinen Gruppen aus dem Meer von Information schöpft, das in unserem Zentralnervensytem gespeichert ist.' [35:85]
> , Alle diese Elemente sind mit dem Begriff Spiel verbunden, stehen somit im Gegensatz zu dem, was gemeinhin als Arbeit bezeichnet wird. Bei spielerischen Tätigkeiten ist die Motivation oft sehr hoch, und die Resul­tate sind entsprechend gut. Die Schlussfolgerung scheint also klar: wenn Kreativität und aussergewöhliche Leistungen erwartet werden, muss der Arbeitsplatz zum Spielplatz werden.' [35:85]
>
>
SCHRIFTSTELLER
>
>
James Joyce
>
>
mingo minxi mictum mingere
>
>
[27:287]
>
>
Ulysses-Lesen = Schwimmen in einem Strom. [27] Anna Livia-Lesen = Strudeln in einem Bergbach. [28]
>
>
Ernst Jandl
>
>
montage
> dienstage mittwoche donnerstage etc eignen sich alle sieben tage zur mon­tage, dert modeme dichter neigt zur montage, er eignet sich die montage an, die modemen maler haben etwas, der modeme dichter macht es sich zu nutzen, max ernst wurde 1891 in brühl bei köln geboren, der modeme dichter überklebt die modemen maler. [22:85]
>
>


EXPERIMENTELLE LINGUISTIK Seite 5

Marianne Fritz
>
>
IlTitation als Methode. Antigrammatik. Spröde Satzstummel. Die Spra­chzerstörung kaschiert Gemeinplätze, gedankliche Unschärfen, möglicher­weise auch stilistische DefIzite. Deformiertes Sprachmaterial.
> Familie Null: Johannes Null, der Vogelfreie. [34:150]
>
>
Thomas Bernhard
>
>
Genialer Erzähler. Megalophiler Schirnpftromrnler aus katholisch­nationalsozialitischem Sumpf mit homophilen und damit naturgemäss misogynen Präferenzen. Meister der rotierenden, bohrenden syntaktischen Variationen in stagnierendem semantischem Morast.
>
>
'Denn alles, was gedacht wird, ist überflüssig'.
>
>
[6: 10]
>
>
'Sie mögen mich jetzt für verrückt halten, sagt Oehler, aber wirkliches und das heisst, tatsächliches Denken ist vollkommen ausgeschlossen' .
>
>
[6:15]
>
>
HERUNTERGEKOMMENE GRAMMA TIK
>
>
land! übernimmt bewusst von Schwitters (Anna Blum) falschen Dativ in 'ich liebe dir'.
>
>
[40:66]
>
>
DENKBLASE
>
>
In der Serie R (Roman) generiert Sara einen Zufallstext, ein Satzmeer, ein linguistisches Biotop. Geworfen in dieses Meer reagiert auf grund ihres Weltwissens und ihres momentanen psychischen Stress zustandes, geste­uert durch ein logisches Modul die Denkblase.
>
>


EXPERIMENTELLE LINGUISTIK Seite 6

KOSMISCHE PROSA
>
>
SARA bezieht die Zufallsreihen aus einem Pseudozufallsgenerator. N aturgemäss kann ein Computer nur Pseudozufallszahlen liefern; daraus entstehende Prosa ist somit nur pseudorandomgesteuert. Absoluter Zufall ist eine göttliche Dimension. Annähernd göttlicher Zufall lässt sich aus den Intervallen der kosmischen Strahlung ablesen. SARA decodiert die kosmischen Impulse, es entsteht kosmosgesteuerte Prosa.
>
>
FLUSSDIAGRAMM
>
>
Die flow chart in Tab.l zeigt die Zusammenschaltung der verschiedenen Module. Der Randomgenerator erstellt die numerische Satzstruktur; die Selektionsmatrizen eliminieren syntaktische und semantische Fehler, der Wortgenerator concateniert die passenden Endungen für Declination und Superlativ von Adjektiven. Das numerische Wortgedächtnis verhindert stilistisch unakzeptable W ortwiederholungen. Mit dem wiederholt einges­etzten Satzgenerator erstellt der Textgenerator den selektiv randomisierten Endtext.
>
>


EXPERIMENTELLE LINGUISTIK Seite 7

Tab. 1: SARAFLUSSDIAGRAMM
>
>
LEXIKON
>
>
RANDOM-GENERA TOR
>
> SELEKTIONSMA TRIZEN Bayessches Modell des vernünftigen Handeins heuristisch Verb-Adverb Wortfolge Verb-Aktionsebene
>
>
WORT-GENERA TOR decision maker für stimmungsgesteuerte Wortwahl Adjektiv-Endungen für Declination Adjektiv-Superlativ NK NKP VV 00 ARa AD AG ARA UM Wort-Gedächtnis
>
> SA TZ-GENERA TOR Wort-Positionierung P1 P2 P3 P4 P5 P6 P7 P8 P9 P10
>
>
TEXT-GENERA TOR Generierung von randomisierten Texten Geschichte - pronominal Essay - nominal Text mit wählbaren Verb-Aktionsebenen
>
>


EXPERIMENTELLE LINGUISTIK Seite 8

Tab. 2: OUTPUT-CODE für soh.mprolo (Bernhard-Prosa)
>
>
START: pdss/ c soh.mprolo/ c lsoh.mprolo/c dar.mprolo
>
>
.
>
>
le.: Lexikon
>
>
.
>
>
ZZ.: Zufallszahlen
>
>
.
>
>
tn.: nomina, Täter
>
>
.
>
>
ma.: Originalmatrix
>
>
.
>
>
or.: Original Th.S. Stimmenimitator
>
>
.
>
>
va.: randomisierter Text
>
>
.
>
>
sk.: Skelett
>
>
.
>
>
pf.: frasmen-psychotisch
>
>
.
>
>
pZ.: matrixzeilen-psychtoisch
>
>
.
>
>
It.: Literatur
>
>
Das Programm Imitationen: domisiert.
>
>
kreiert
>
>
randomisierte
>
>
Prosa-
>
>
Metrik gemäss Original, Wortwahl ran-
>
>
Original: Thomas Bernhard, [5: 166]
>
>
Der Stimmenimitator: SORGFALT
>
>
Lexikon:
> Thomas Bernhard,
>
>
Der Stimmenimitator: SORGFALT
>
>
[5] 3.12.85:0K.
>
>


EXPERIMENTELLE LINGUISTIK Seite 9

STICHWORTE
>
>
Antigrammatik... 5
>
>
Pseudozufallsgenerator ... 6
>
>
Fälschungen ... 3 falscher Dativ... 5 Frasmen ... 3
>
>
Sarcophagaufschriften ... 3 Satzmeer ... 5
> Spielplatz ... 4
>
>
Imitation ... 3
> Irritation als Methode ... 5
>
>
Textmodelle und Denkmuster ... 2 Topographien ... 3
>
>
kosmische Impulse ... 6
>
>
Ulysses ... 4
>
>
Mist ... 3
>
>
verrückt ... 5
>
>
Nische... 2-3 Nischenkollektiv... 2
>
>
Weltwissen ... 2
>
>
Zufallsgenerator ... 2-3
>
>

>
> 3.
>
>
4.
>
>
5.
>
>
6.
>
>
7.
>
>
8.
>
>
9.
>
>
10.
>
>
11.
>
>
12.
>
>
13.
>
>
14.
>
>
15.
>
>
16.
>
>
17.
>
>
18.
>
>


EXPERIMENTELLE LINGUISTIK Seite 10

BIBLIOGRAPHIE
>
>
1.
>
>
Asmuth, B. Aspekte der Lyrik. Düsseldorf 1979 Frankfurt am Main 1971
>
>
2.
>
>
Bernhard, Th. Alte Meister. Frankfurt am Main 1985
>
>
Bernhard, Th. Auslöschung. Frankfurt am Main 1986
>
>
Bernhard, Th. Der Kulterer. Salzburg 1974
>
>
Bernhard, Th. Der Stimmenimitator. Frankfurt am Main 1982
>
>
Bernhard, Th. Gehen.
>
>
Bernhard, Th. Korrektur. Frankfurt am Main 1975
>
>
Bibel Vater Unser. Mathäus 6.9
>
>
Binder, A. Einführung in Metrik und Rhetorik. Taunus, 1980
>
>
Celan, P. Gedichte 1-111. Frankfurt am Main, 1975
>
> Chomsky, N. Aspekte der Syntax­Theorie. Frankfurt am Main, 1973
>
>
Drewek, R. LDVLlB - Dokumentation der programmme zur computerunterstützten Textanalyse. Zürich, 1975
>
> Eigen.M, Winkler,R. Das Spiel, Naturgesetze steuern den Zufall. München, 1975
>
> Fischer, B. "Gehen" von Thomas Bernhard.
> Eine Studie zum Problem der Moderne.
Bonn, 1985
>
> Fritz, Marianne "Was soll man da machen. "
>
Eine Einführung zu dem Roman 'Dessen Sprache du nicht verstehst'. Frankfurt am Main, 1985
>
> George, S. Gedichte. Stuttgart 1958 (1868-1933)
>
> Goethe, J.W. Ein Gleiches (6.Sept. 1780). Artemis Zürich 1977
>
> Grass, Günter Die Rättin. Luchterhand Darmstadt 1986
>
>
>
> EXPERIMENTELLE LINGUISTIK
>
>
Seite 11
>
>
19.
>
>
20.
>
>
21.
>
>
22.
>
>
23.
>
>
24.
>
>
25.
>
>
26.
>
>
27.
>
>
28.
>
>
29.
>
>
30.
>
>
31.
>
>
32.
>
>
33.
>
>
34.
>
>
35.
>
>
Grimmelshausen Der Abentheurliche Simplicissimus Teutsch 1669. Tübingen,1984
>
>
Gustas, A. Erotische Gedichte von Frauen. München, 1985
>
>
Häusermann, J. Phraseologie. Tübingen, 1977
>
>
Jandl, E. der künstliche baum. Darmstadt 1970
>
>
Jandl, E. falamaleikum. Darmstadt 1983
>
>
Janz, M. Vom Engagement absoluter Poesie zur Lyrik und Ästhetik Paul Celans. Frankfurt a.M. 1976
>
>
Jeffrey, R.C. Logik der Entscheidungen. Oldenburg 1967
>
>
Jean Paul Siebenkäs. Berlin 1796
>
>
Joyce, J. UIysses. Frankfurt a. Main 1975, es 1100 NF 100
>
>
Joyce, J. Finnegans Wake. 1.8 Anna Livia Plurabelle übertragen von Wolfgang Hildesheimer und Hans Wollschläger Frankfurt a. Main 1981, es NF 438
>
>
Jung, C.G. Wirklichkeit der Seele: 132. Zürich 1947, pg. 132: Ulysses
>
>
Kirsch, Sarah Irrstern. Stuttgart 1986
>
>
Menninghaus, W. Paul Celan Magie der Form. Edition Suhrk­amp 1026
> Frankfurt a.Main 1980
>
> Müller, U. Computerlinguistische Studie an 315 altägyptischen Göttersprüchen. Zürich, 1979
>
> MusiI, R. Der Mann ohne Eigenschaften. Hamburg, 1978
>
>
Nagel, W. 2.8 kg Weltliteratur; über Marianne Fritz 'Dessen Sprache Du nicht verstehst'. Spiegel 16.12.1985
>
>
nxf. Das Spiel ­Ursprung der Kreativität. NZZ: Nr. 221 Zürich, 1986
>
>
36.
>
>
Peyer, R. Annäherung an eine Legende.
>
>

>
> EXPERIMENTELLE LINGUISTIK
>
>
Seite 12
>
>
37.
>
>
38.
>
>
39.
>
>
40.
>
>
41.
>
>
42.
>
>
43.
>
>
44.
>
>
45.
>
>
Begegnungen mit Paul Celan. NZZ: Nr. 85 April pg. 66 Zürich, 1987
>
>
Queneau, R. Exercices de style. Paris, 1947
>
>
Rakusa, I. Daniil Charms: Fälle. NZZ: Nr. 267 Zürich, 1985
>
>
Stramm, A. Dramen und Gedichte. Stuttgart, 1979
>
>
von Matt, Beatrice Über Jandl zu Jandl, Stein, Schwitters, Heis­senbüttel. NZZ: Nr. 218 Zürich, 1986
>
>
Wahrig, G. Deutsches Wörterbuch. Gütersloh, 1978
>
>
Wawrzyn, L. Der Automatenmensch, E. T.A. Hoffmanns Erzäh­lung vom Sandmann. Gütersloh, 1978
>
>
Weinrich, H. Linguistik der Lüge. Heidelberg, 1974
>
>
Whorf, G. Sprache, Denken, Wirklichkeit, Beiträge zur Metal­inguistik und Sprachphilosophie. Hamburg 1963
>
>
Wittgenstein, L. Tractatus logico-philosophicus. Frankfurt a.M. 1960
>
>

>
> EXPERIMENTELLE LINGUISTIK
>
>
Seite i
>
>
INHAL T
>
>
Beschreibung des textgenerierenden Programmes SARA. . . . .. 1 Methode. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 1
>
LDVLIB . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 1
>
MPROLOG . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 1
> Programm SARA: Satz-Random-Generator2
>
>
Künstliche Intelligenz. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 4
>
>
Das Spiel - Ursprung der Kreativität. . . . . . . . . . . . . . . . . . . . . . .. 4
>
>
Schriftsteller. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 4 James Joyce . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 4 Ernst Jandl 4
> Marianne Fritz
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 5 Thomas Bernhard .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 5
>
>
Heruntergekommene Grammatik. . . . . . . . . . . . . . . . . . . . . . . . . .. 5
>
>
Denkblase. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 5
>
>
Kosmische Prosa. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 6
>
>
Flussdiagramm. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 6
>
>
Stichworte. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 9
>
>
BIBLIOGRAPHIE. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 10
>
>
TABELLEN
>
>
1.
>
>
SARA FLUSSDIAGRAMM. . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 7
>
>
2.
>
>
OUTPUT-CODE tür soh.mprolo (Bernhard-Prosa) . . . . . . . . . . .. 8
>
>