TY - THES T1 - Ein sprachunabhängiger Ansatz zur Entwicklung deklarativer, robuster LA-Grammatiken mit einer exemplarischen Anwendung auf das Deutsche und das Englische A1 - Schulze,Markus Y1 - 2004/07/29 N2 - iel dieser Arbeit ist es, eine Umgebung zur Verfügung zu stellen, mit der Grammatiken zur robusten syntaktischen Analyse freier Texte entwickelt werden können. Die enthaltene linguistische Information soll dabei gut lesbar sein, um den Bezug zu linguistischen Grammatiken und eine gute Wart- und Erweiterbarkeit sicherzustellen. Dazu wird in dieser Arbeit ein eigenes Grammatikmodell entwickelt und implementiert und am Beispiel von jeweils aufeinander aufbauenden Ausbaustufen einer deutschen bzw. englischen Syntaxgrammatik illustriert. Der Grammatikformalismus Als Ausgangsbasis dient das Grammatikmodell der linksassoziativen Grammatik (LAG), das auf dem Prinzip der möglichen Fortsetzungen basiert. Durch diese besondere Berücksichtigung der linearen Struktur der Sprache ist der Analyseprozess von LAGs inhärent inkrementell. Aufbauend auf der LAG wird das spezialisierte Grammatikmodell der LLAG (Loom-LAG, oder Webstuhl-LAG) definiert. Unter Erhalt der Inkrementalität integriert es den linguistisch motivierten Satzgliedbegriff sowie das linguistische Konzept der Topologie (Satzstruktur, Satzgliedstellung) in den Rahmen der LAG. Dazu unterteilt die LLAG die Syntax in die Ebene der Satzglieder und die übergeordnete Ebene der Satzstruktur. Analog zum Zusammenspiel von Morphologie und Syntax in der traditionellen LAG arbeiten Morphologie, Satzglied-Ebene und Satzstruktur-Ebene in der LLAG inkrementell verzahnt. Die Definition der LLAG trennt außerdem sprachpezifische von sprachübergreifenden Mechanismen. Letztere werden in Form der sprachunabhängigen Webstuhlgrammatik sowie durch linguistisch motivierte Operationen, wie beispielsweise Kongruenzprüfung oder Valenzkürzen realisiert. Die sprachspezifische Information einer LLAG enthält unter anderem Beschreibungen des Aufbaus der verschiedenen Satzglied- oder Satztypen. Diese werden einzeln in Form sogenannter Pläne modelliert. Die Information über die Struktur eines Satz- oder Satzgliedtyps ist in einem einzelnen Plan gekapselt, der nur über fest spezifizierte Schnittstellen mit anderen Plänen interagiert. Die LLAG ist also von vorneherein für die Anwendung auf natürliche Sprache konzipiert worden. Die Schicht der Webstuhlgrammatik formuliert Beschreibungsmittel für allgemeine linguistische Phänomene, die die einzelnen Grammatiken dann verwenden. Daraus resultiert ein verringerter Arbeitsaufwand bei der Grammatikerstellung, eine gute Vergleichbarkeit von Grammatiken und eine Explizierung sprachlicher Universalien. Verallgemeinerungen der LAG In Rahmen der Definition der LLAG wird untersucht, inwieweit Alternativen zur traditionell von der LAG verwendeten Darstellungsform der syntaktischen Kategorie, der double-ended queue (Deque), mächtigere und lesbarere Grammatiken ermöglichen. Dies wird am Beispiel formaler Sprachen untersucht. Die traditionellen Methoden der Komplexitätsermittlung werden auf die untersuchten Darstellungsformen erweitert. Dies wird insbesondere für Attribut-Werte-Strukturen durchgeführt, da dieses Kategorieformat in den deutschen und englischen Beispielgrammatiken verwendet wird. Implementierung von Grammatiken Anhand der algebraischen Definition der LLAG wurde LIPS, ein konkretes System zur Erstellung von LLAGs, entwickelt. Es enthält zusätzliche Mittel zur expliziten Hypothesenbildung und den Umgang mit nur teilweise grammatischen Konstruktionen. Die Modellierungsmittel von LIPS werden exemplarisch an vier aufeinander aufbauenden Grammatiken für das Englische und neun für das Deutsche vorgestellt. Diese modellieren auch syntaktische Phänomene, die bisher nicht im Rahmen der LAG behandelt wurden (z.B. deutsche Partizipialgruppen oder das Attachment). KW - Syntaktische Analyse KW - Grammatik KW - MALAGA CY - Erlangen PB - Universitätsbibliothek der Universität Erlangen-Nürnberg AD - Universitätsstraße. 4, 91054 Erlangen L2 - http://www.opus.ub.uni-erlangen.de/opus/volltexte/2004/77 ER -