Papers by Dieter Metrzing
Aisthesis Verlag, Jul 18, 2018
Als Teil der Linguistik untersucht die Computerlinguistik Sprache mit Hilfe linguistischer und in... more Als Teil der Linguistik untersucht die Computerlinguistik Sprache mit Hilfe linguistischer und informationstechnischer Verfahren. Die Vorgehensweise bei der Untersuchung des Problems "Sprache" orientiert sich an den in den klassischen Naturwissenschaften gängigen Methoden: Ein auf empirischen Beobachtungen aufbauendes theoretisches Modell wird in eine algorithmische Entsprechung überführt und kann so durch Simulation auf einem Computer validiert werden. Diese Vorgehensweise hat in der Vergangenheit dazu geführt, daß Sprache als isoliertes Phänomen, ohne weitergehende Einbeziehung des extralinguistischen Kontextes, betrachtet wurde. Dieser Effekt wurde noch verstärkt durch die Nutzung von transkribierten und "bereinigten" Auschnitten natürlicher Sprache als Eingabe in die Computerprogramme. Will man, im Gegensatz dazu, Sprachverstehensprozesse modellieren, wie sie etwa in einer Instruktionssituation auftreten, so ist die Integration von situativen Informationen in die Sprachanalyse unumgänglich. Hierbei sind
Nach-Chomskysche Linguistik, 1985
Sprache und Literatur, 1975
Ta Informations, 1987
Dans la production de textes on distingue souvent deux phases: la construction des messages (comp... more Dans la production de textes on distingue souvent deux phases: la construction des messages (composante strategique) et la production de l'enonce (composante tactique). Les procedes d'organisation de textes font partie de la premiere phase. Des procedes d'organisation de textes ont ete determines a partir de donnees empiriques dans un domaine choisi (descriptions d'un chemin a suivre dans une situation experimentale). Des procedes d'organisation de textes sont analyses et «synthetises», c'est-a-dire mis sur ordinateur comme une des composantes d'un systeme de production de textes (KLEIST). Cet article se refere a des travaux qui font partie d'un programme de recherche de longue duree (DFG Forschergruppe KOHARENZ a l'Universite de Bielefeld). Vus dans un contexte plus global, ces travaux contribuent au developpement de «modeles partiels d'interlocuteur»
Studies in Fuzziness and Soft Computing
ABSTRACT We will explore the role of an advanced type of document grammar, RelaxNG, in the contex... more ABSTRACT We will explore the role of an advanced type of document grammar, RelaxNG, in the context of different approaches to the formalization of linguistic regularities based on corpora and XML annotations. Our domain of exploration will be Kilivila verb morphology. The following topics will be focused on: Which kind of regularities in the domain can be expressed given formal limitations of document grammars, i.e. tree grammars? Which linguistic analyses may be taken as a basis for document grammar development? In which way can a document grammar be sensitive to properties of annotations and raw data (document validation and data validation)? Which kinds of formalization may be helpful in the (semi-automatic) development of a document grammar in the case explored? In the first part we will consider aspects of Kilivila verb morphology from the point of view of linguistic analyses. In the second part different strategies for the development of a RelaxNG based document grammar will be examined.
Kognitionswissenschaft, 1999
Communicating agents: Gesture and natural language interaction Summary. An important scientific m... more Communicating agents: Gesture and natural language interaction Summary. An important scientific method within cognitive science consists in the synthesis of cognitive abilities, of forms of behavior by developing specific artificial agents. Many current approaches make use of the notion of an agent in order to develop concepts of cognitive behavior on different levels of abstraction. Basic properties of agents are:
Proceedings of the 8th conference on Computational linguistics -, 1980
An attempt has been made to use an Augmented Transition Network IO as a 'procedural dialog model'... more An attempt has been made to use an Augmented Transition Network IO as a 'procedural dialog model'. The development of such a model appears to be important in several respects:-as a device to represent and to use different dialog schemata proposed in empirical conversation analysis;-as a device to represent and to use models of verbal interaction;-as a device combining knowledge about dialog schemata and about verbal interaction with knowledge about taskoriented and goal-directed dialogs. A standard ATN should be further developed in order to account for the verbal interactions of task-oriented dialogs.
Sprache und Wissen, 1990
Es gibt Grammatiktheorien, die Hypothesen uber den Sprachverarbeitungsprozes einschliesen (starke... more Es gibt Grammatiktheorien, die Hypothesen uber den Sprachverarbeitungsprozes einschliesen (starke/schwache Kompetenzhypothesen, vgl. Bresnan 1981, 1982). Es erscheint schwierig, Parsern, die auf solchen Grammatiktheorien aufbauen, eine minimale kognitive Relevanz abzusprechen. Andererseits sind sie nicht auf empirischen Untersuchungen zu Sprachverarbeitungsprozessen aufgebaut. Wir mochten diese Parser daher nur als kognitive Parser,nicht jedoch als ‚psychologische Parser‘ bezeichnen. Fur Parser, die zur Forschungsrichtung ‚Sprachverarbeitende Kunstliche Intelligenz‘ gehoren, gilt ahnliches. Es gibt Parser, die so konstruiert sind, das sie mit plausiblen Annahmen uber Satzverarbeitungsprozesse naturlicher Sprecher ubereinstimmen (vgl. Marcus 1980). Wir mochten diese kognitive Parser nennen, nicht jedoch psychologische Parser. Fur letzere sind empirische psychologische Untersuchungen von Sprachverarbeitungsprozessen unabdingbar.
Kohärenzprozesse, 1991
Die Erzeugung von Texten ist ein recht komplexer Prozes: Produktionsentscheidungen sind zu treffe... more Die Erzeugung von Texten ist ein recht komplexer Prozes: Produktionsentscheidungen sind zu treffen, zwischen denen vielfache und sich entwickelnde Abhangigkeiten bestehen. Auswahlprozesse sind zu koordinieren, die den mitzuteilenden Sachverhalt betreffen, den Adressaten und die Ziele des Sprechers und vor allem die sprachliche Form auf den verschiedenen Produktionsebenen zwischen Wort und Text. Der Weg, der im Projekt “Textgenerierung” gewahlt wurde, um einen Teil dieser Auswahlprozesse genauer zu verstehen, ist der folgende: 1. Die genannten Auswahlprozesse sind der direkten Beobachtung nicht zuganglich. Direkt zuganglich sind bestenfalls wesentliche Ausgangsdaten (z.B. Eigenschaften einer Modellstadt), Zwischenergebnisse (z.B. kurze, telegrammstilartige Vorformen elaborierter Texte) und das Endresultat (z.B. Wegbeschreibungstexte). Auf der Basis direkt zuganglicher Daten konnen im Rahmen einer empirischen Untersuchung strukturelle Regularitaten bestimmt werden, z.B. bezuglich Beschreibungsperspektiven’, Auswahl von prominenten Objekten (Landmarken) und Eigenschaften sowie deren Darstellung in einem koharenten Beschreibungstext. In einer Pilotstudie erstellten Versuchsteilnehmer, bezogen auf eine vorgegebene Modellstadt, Wegbeschreibungen, und zwar so, das auch sehr fruhe Ergebnisse von Auswahlprozessen dokumentiert wurden (vgl. Knapel, Rutz & Siegel 1987, Rutz 1988a).
Informatik-Fachberichte, 1989
Sprache in Mensch und Computer, 1988
Sprache in Mensch und Computer, 1988
Wir konnen davon ausgehen, das die Verwendung naturlicher Sprache in erster Linie einer Vielfalt ... more Wir konnen davon ausgehen, das die Verwendung naturlicher Sprache in erster Linie einer Vielfalt von Zielen dient. Diese mogen bestimmt werden: als Herstellung und Strukturierung sozialer Situationen; als Herstellung und Erhalt individueller und kultureller Identitaten; als Mitteilung von Absichten, Einschatzungen, Planen, Tatsachen, Empfindungen; als Einwirkung auf andere in kooperativer oder nichtkooperativer Absicht, darunter z.B. Handlungskoordinierung zur Losung gemeinsamer Aufgaben und zur Steuerung von Arbeitsprozessen; und schlieslich als Instxument von Reflektionen und Selbstreflektionen.
Informatik-Fachberichte, 1989
Gegenstand des Beitrags sind Arbeiten der Bielefelder DFG-Forschergruppe KOHARENZ. Zu den Rahmena... more Gegenstand des Beitrags sind Arbeiten der Bielefelder DFG-Forschergruppe KOHARENZ. Zu den Rahmenannahmen der Forschergruppe gehort, das Koharenzeigenschaften von Diskursen von Sprechern aktiv konstruiert werden, in der Rezeption als auch in der Produktion; das Koharenzprozesse Prozesse kognitiver Informationsverarbeitung sind; das Koharenzeigenschaften auf der Basis empirischer, experimenteller Untersuchungen formal nachkonstruiert und als Programmsysteme implementiert werden.
Studies in Computational Intelligence, 2011
Seamless integration of various, often heterogeneous linguistic resources in terms of their outpu... more Seamless integration of various, often heterogeneous linguistic resources in terms of their output formats and a combined analysis of the respective annotation layers are crucial tasks for linguistic research. After a decade of concentration on the development of formats to structure single annotations for specific linguistic issues, in the last years a variety of specifications to store multiple annotations over the same primary data has been developed. The paper focuses on the integration of the knowledge resource logical document structure information into a text document to enhance the task of automatic anaphora resolution both for the task of candidate detection and antecedent selection. The paper investigates data structures necessary for knowledge integration and retrieval.
Linguistic Modeling of Information and Markup Languages, 2009
In this chapter, two different ways of grouping information represented in document markup are ex... more In this chapter, two different ways of grouping information represented in document markup are examined: annotation levels, referring to conceptual levels of description, and annotation layers, referring to the technical realisation of markup using e.g. document grammars. In many current XML annotation projects, multiple levels are integrated into one layer, often leading to the problem of having to deal with overlapping hierarchies. As a solution, we propose a framework for XML-based multiple, independent XML annotation layers for one text, based on an abstract representation of XML documents with logical predicates. Two realisations of the abstract representation are presented, a Prolog fact base format together with an application architecture, and a specification for XML native databases. We conclude with a discussion of projects that have currently adopted this framework.
Proceedings of the 5th Workshop on NLP and XML Multi-Dimensional Markup in Natural Language Processing - NLPXML '06, 2006
The paper discusses two topics: firstly an approach of using multiple layers of annotation is ske... more The paper discusses two topics: firstly an approach of using multiple layers of annotation is sketched out. Regarding the XML representation this approach is similar to standoff annotation. A second topic is the use of heterogeneous linguistic resources (e.g., XML annotated documents, taggers, lexical nets) as a source for semiautomatic multi-dimensional markup to resolve typical linguistic issues, dealing with anaphora resolution as a case study. 1
Uploads
Papers by Dieter Metrzing