Ergebnisse für *

Es wurden 34 Ergebnisse gefunden.

Zeige Ergebnisse 1 bis 25 von 34.

Sortieren

  1. Extending effect annotation with lexical decomposition
    Erschienen: 2016

    Export in Literaturverwaltung
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Englisch
    Medientyp: Unbestimmt
    Format: Online
    DDC Klassifikation: Germanische Sprachen; Deutsch (430)
    Schlagworte: opinion inference; Annotation; German data
    Lizenz:

    kostenfrei

  2. Tagset und Richtlinie für das PoSTagging von Sprachdaten aus Genres internetbasierter Kommunikation
  3. Linguistische Annotationen für die Analyse von Gliederungsstrukturen wissenschaftlicher Texte
    Erschienen: 2016
    Verlag:  Institut für Deutsche Sprache, Bibliothek, Mannheim

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: Verbundkataloge
    Beteiligt: Hebborn, Mariana (Verfasser); Klawitter, Jana (Herausgeber); Lobin, Henning (Herausgeber); Schmidt, Torben (Herausgeber)
    Sprache: Deutsch
    Medientyp: Buch (Monographie)
    Format: Online
    Weitere Identifier:
    DDC Klassifikation: Germanische Sprachen; Deutsch (430)
    Schlagworte: Annotation; Ontologie <Wissensverarbeitung>; Korpus <Linguistik>; Überschrift; Gliederung; Codierung; Kopfzeile; Korpus <Linguistik>; Annotation; Ontologie <Wissensverarbeitung>
    Umfang: Online-Ressource
    Bemerkung(en):

    In: Kulturwissenschaften Digital. Neue Forschungsfragen und Methoden. - Frankfurt am Main : Campus, 2012., S. 155-176, ISBN 978-3-593-41287-0

  4. IGGSA-STEPS: Shared Task on Source and Target Extraction from Political Speeches
    Erschienen: 2016
    Verlag:  Institut für Deutsche Sprache, Bibliothek, Mannheim

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: Verbundkataloge
    Beteiligt: Struß, Julia Maria (Verfasser); Wiegand, Michael (Herausgeber); Remus, Robert (Herausgeber); Gindl, Stefan (Herausgeber)
    Sprache: Englisch
    Medientyp: Buch (Monographie)
    Format: Online
    Weitere Identifier:
    DDC Klassifikation: Germanische Sprachen; Deutsch (430)
    Schlagworte: Korpus <Linguistik>; Annotation; Parlamentsdebatte; Data Mining; Politische Sprache; Automatische Sprachanalyse
    Weitere Schlagworte: selection of textual sources; annotation guidelines; gold standard corpus
    Umfang: Online-Ressource
    Bemerkung(en):

    In: Journal for Language Technology and Computational Linguistics . 29, 2014., 1., S. 33-46

  5. Tagset und Richtlinie für das PoSTagging von Sprachdaten aus Genres internetbasierter Kommunikation
    Erschienen: 2016
    Verlag:  Institut für Deutsche Sprache, Bibliothek, Mannheim

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: Verbundkataloge
    Beteiligt: Bartz, Thomas (Verfasser); Storrer, Angelika (Verfasser); Westpfahl, Swantje (Verfasser)
    Sprache: Deutsch
    Medientyp: Buch (Monographie)
    Format: Online
    Weitere Identifier:
    DDC Klassifikation: Germanische Sprachen; Deutsch (430)
    Schlagworte: Semantik; Korpus <Linguistik>; Internet; Automatische Spracherkennung; Annotation
    Umfang: Online-Ressource
  6. Datenbank für Gesprochenes Deutsch (DGD)
    Erschienen: 2016
    Verlag:  Institut für Deutsche Sprache, Bibliothek, Mannheim

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: Verbundkataloge
    Sprache: Deutsch
    Medientyp: Buch (Monographie)
    Format: Online
    Weitere Identifier:
    DDC Klassifikation: Germanische Sprachen; Deutsch (430)
    Schlagworte: Gesprochene Sprache; Korpus <Linguistik>; Datenbank; Annotation; Metadaten; Mundart; Transkription; Korpus <Linguistik>; Datenbank; Gesprochene Sprache
    Umfang: Online-Ressource
    Bemerkung(en):

    In: DHd 2016. Modellierung - Vernetzung - Visualisierung. Die Digital Humanities als fächerübergreifendes Forschungsparadigma. Konferenzabstracts. Universität Leipzig 7. bis 12. März 2016. - Duisburg : Nisaba, 2016., S. 364-365, ISBN 978-3-941379-05-3

  7. Das Dortmunder Chat-Korpus in CLARIN-D: Modellierung und Mehrwerte
    Erschienen: 2016
    Verlag:  Institut für Deutsche Sprache, Bibliothek, Mannheim

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: Verbundkataloge
    Beteiligt: Herold, Axel (Verfasser); Lüngen, Harald (Verfasser); Storrer, Angelika (Verfasser)
    Sprache: Deutsch
    Medientyp: Buch (Monographie)
    Format: Online
    Weitere Identifier:
    DDC Klassifikation: Germanische Sprachen; Deutsch (430)
    Schlagworte: Korpus <Linguistik>; Chatten <Kommunikation>; Mehrwert; Computerlinguistik; Modellierung; Annotation; Sprachgebrauch; Deutsch; Chatten <Kommunikation>; Korpus <Linguistik>
    Weitere Schlagworte: CLARIN-D
    Umfang: Online-Ressource
    Bemerkung(en):

    In: DHd 2016. Modellierung - Vernetzung - Visualisierung. Die Digital Humanities als fächerübergreifendes Forschungsparadigma. Konferenzabstracts. - Duisburg : nisaba, 2016., S. 274-277, ISBN 978-3-941379-05-3

  8. Handbuch Textannotation
    Potsdamer Kommentarkorpus 2.0
    Autor*in:
    Erschienen: 2016
    Verlag:  Universitätsverlag Potsdam, Potsdam

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Hinweise zum Inhalt
    Quelle: Verbundkataloge
    Beteiligt: Stede, Manfred (Herausgeber)
    Sprache: Deutsch
    Medientyp: Buch (Monographie)
    Format: Druck
    ISBN: 9783869563435
    Schriftenreihe: Potsdam cognitive science series ; 8
    Schlagworte: Deutsch; Korpus <Linguistik>; Annotation
    Weitere Schlagworte: linguistische Annotation; linguistisches Korpus; Textstruktur; Zeitungskommentare; linguistic annotation; linguistic corpus; text structure; newspaper commentary
    Umfang: xvii, 211 Seiten, Illustrationen, 21 cm
    Bemerkung(en):

    Das Potsdamer Kommentarkorpus ist eine Sammlung von Zeitungstexten, die dem Genre ‘Kommentar' zuzuordnen sind. Der öffentlich verfügbare Teil besteht aus 175 Texten aus der Märkischen Allgemeinen Zeitung, die hinsichtlich Syntax, Koreferenz, Konnektoren und Rhetorische Struktur manuell annotiert wurden. Weitere Ebenen werden bei zukünftigen Korpusversionen hinzukommen. Dieses Buch enthält die Annotationsrichtlinien, die der Bearbeitung des öffentlichen Teils des Korpus zugrunde lagen, sowie auch anderer Teile, bei denen mit weiteren Annotationsebenen experimentiert wurde. Die meisten der Richtlinien werden auch für ähnliche Text-Genres und für andere Sprachen verwendbar sein.

  9. Auf der Suche nach dem "goldnen Baum"
    Digitale Annotation des Metaphernbegriffs in Poetiken : Erkenntnisprozess, diskursive Praktik und "tertium comparationis"
    Autor*in:
    Erschienen: 2016

    Der Begriff der Metapher wird in Poetiken auf der theoretischen Ebene und anhand von literarischen Beispielen kritisch verhandelt. Im Zuge der Entwicklung eines Annotationsschemas differenziert das Projekt ePoetics die wesentlichen Komponenten der... mehr

    Herzog August Bibliothek Wolfenbüttel
    keine Fernleihe

     

    Der Begriff der Metapher wird in Poetiken auf der theoretischen Ebene und anhand von literarischen Beispielen kritisch verhandelt. Im Zuge der Entwicklung eines Annotationsschemas differenziert das Projekt ePoetics die wesentlichen Komponenten der Explikation des Metaphernbegriffs aus und erschließt darüber hinaus die damit verbundenen Diskurs- und Referenzstrukturen. Dabei wird deutlich, welche Erkenntnismöglichkeiten und ‑grenzen sich im kollaborativ-diskursiven Auszeichnungsprozess schon vor der informationstechnischen Auswertung bieten – mit dem digitalen, algorithmischen Paradigma als Folie – und wie Hermeneutik und Algorithmen in Wechselwirkung treten können – im Sinne des ›Algorithmic Criticism‹ nach Stephen Ramsay.

     

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Hinweise zum Inhalt
    Volltext (OpenAccess Lizenz (Creative Commons License))
    Quelle: Herzog August Bibliothek Wolfenbüttel
    Beteiligt: Alscher, Stefan (VerfasserIn); Bender, Michael (VerfasserIn)
    Sprache: Deutsch
    Medientyp: Buch (Monographie)
    Format: Online
    Weitere Identifier:
    Übergeordneter Titel: Enthalten in: 2016; 1(2016), 1; Online-Ressource (HTML, XML, PDF)

    Schlagworte: Annotation; Diskurs; Taxonomie; ; Elektronische Publikation;
    Umfang: Online-Ressource (HTML, XML, PDF)
  10. Handbuch Textannotation
    Potsdamer Kommentarkorpus 2.0
    Autor*in:
    Erschienen: 2016
    Verlag:  Univ.-Verl., Potsdam

    Universität Potsdam, Universitätsbibliothek
    keine Fernleihe
    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Hinweise zum Inhalt
    Quelle: Verbundkataloge
    Beteiligt: Stede, Manfred (HerausgeberIn)
    Sprache: Deutsch
    Medientyp: Ebook
    Format: Online
    ISBN: 9783869563435
    Weitere Identifier:
    Schriftenreihe: Potsdam Cognitive Science Series ; 8
    Schlagworte: Deutsch; Korpus <Linguistik>; Annotation;
    Umfang: Online-Ressource (PDF-Datei: xvii, 211 S., 4162 KB), Diagramme
    Bemerkung(en):

    Das Potsdamer Kommentarkorpus ist eine Sammlung von Zeitungstexten, die dem Genre ‘Kommentar' zuzuordnen sind. Der öffentlich verfügbare Teil besteht aus 175 Texten aus der Märkischen Allgemeinen Zeitung, die hinsichtlich Syntax, Koreferenz, Konnektoren und Rhetorische Struktur manuell annotiert wurden. Weitere Ebenen werden bei zukünftigen Korpusversionen hinzukommen. Dieses Buch enthält die Annotationsrichtlinien, die der Bearbeitung des öffentlichen Teils des Korpus zugrunde lagen, sowie auch anderer Teile, bei denen mit weiteren Annotationsebenen experimentiert wurde. Die meisten der Richtlinien werden auch für ähnliche Text-Genres und für andere Sprachen verwendbar sein.The Potsdam Commentary Corpus is a collection of newspaper texts belonging to the ‘commentary’ genre. The public part consists of 175 texts from Märkische Allgemeine Zeitung that have been manually annotated for syntax, coreference, connectives, and rhetorical structure. Further layers will be added to future releases of the corpus. This book assembles the annotation guidelines that have been used for that public part, as well as for other portions, where other layers of annotation have been experimented with. Most of the guidelines will be applicable to similar genres, and also to other languages

  11. Annotating and editing with Canonical Text Services (CTS)
    project funded by the Andrew W. Mellon Foundation: 2016-2017 ; project announcement
    Erschienen: 2016

    Universitätsbibliothek Heidelberg
    keine Fernleihe
    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Hinweise zum Inhalt
    Volltext (Kostenfrei)
    Quelle: Verbundkataloge
    Beteiligt: Schubert, Charlotte (VerfasserIn)
    Sprache: Englisch
    Medientyp: Aufsatz aus einer Zeitschrift
    Format: Online
    Weitere Identifier:
    Übergeordneter Titel: Enthalten in: Digital classics online; Leipzig : Univ., Historisches Seminar, 2015; 2(2016), 1, Seite 94-99; Online-Ressource

    Schlagworte: Klassische Philologie; Programm; Edition; Annotation; Andrew W. Mellon Foundation;
    Umfang: Illustrationen
  12. Handbuch Textannotation
    Potsdamer Kommentarkorpus 2.0
    Autor*in:
    Erschienen: 2016
    Verlag:  Univ.-Verl., Potsdam

    Universität Potsdam, Universitätsbibliothek
    uneingeschränkte Fernleihe, Kopie und Ausleihe
    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Hinweise zum Inhalt
    Quelle: Verbundkataloge
    Beteiligt: Stede, Manfred (HerausgeberIn)
    Sprache: Deutsch
    Medientyp: Ebook
    Format: Online
    ISBN: 9783869563435
    Weitere Identifier:
    Schriftenreihe: Potsdam Cognitive Science Series ; 8
    Schlagworte: Deutsch; Korpus <Linguistik>; Annotation;
    Umfang: Online-Ressource (PDF-Datei: xvii, 211 S., 4162 KB), Diagramme
    Bemerkung(en):

    Das Potsdamer Kommentarkorpus ist eine Sammlung von Zeitungstexten, die dem Genre ‘Kommentar' zuzuordnen sind. Der öffentlich verfügbare Teil besteht aus 175 Texten aus der Märkischen Allgemeinen Zeitung, die hinsichtlich Syntax, Koreferenz, Konnektoren und Rhetorische Struktur manuell annotiert wurden. Weitere Ebenen werden bei zukünftigen Korpusversionen hinzukommen. Dieses Buch enthält die Annotationsrichtlinien, die der Bearbeitung des öffentlichen Teils des Korpus zugrunde lagen, sowie auch anderer Teile, bei denen mit weiteren Annotationsebenen experimentiert wurde. Die meisten der Richtlinien werden auch für ähnliche Text-Genres und für andere Sprachen verwendbar sein.The Potsdam Commentary Corpus is a collection of newspaper texts belonging to the ‘commentary’ genre. The public part consists of 175 texts from Märkische Allgemeine Zeitung that have been manually annotated for syntax, coreference, connectives, and rhetorical structure. Further layers will be added to future releases of the corpus. This book assembles the annotation guidelines that have been used for that public part, as well as for other portions, where other layers of annotation have been experimented with. Most of the guidelines will be applicable to similar genres, and also to other languages

  13. Handbuch Textannotation
    Potsdamer Kommentarkorpus 2.0
    Autor*in:
    Erschienen: 2016
    Verlag:  Universitätsverlag Potsdam, Potsdam

    Bayerische Staatsbibliothek
    uneingeschränkte Fernleihe, Kopie und Ausleihe
    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Hinweise zum Inhalt
    Volltext (kostenfrei)
    Quelle: Verbundkataloge
    Beteiligt: Stede, Manfred (Herausgeber)
    Sprache: Deutsch
    Medientyp: Buch (Monographie)
    ISBN: 9783869563435
    DDC Klassifikation: Englisch, Altenglisch (420)
    Schriftenreihe: Potsdam Cognitive Science Series ; 8
    Schlagworte: Annotation; Deutsch; Korpus <Linguistik>
    Weitere Schlagworte: Arbeitsgedächtnis; Computermodell; Psycholinguistik; Syntax
    Umfang: XVII, 211 Seiten, Illustrationen, 210 mm x 148 mm
  14. Multidimensional markup and heterogeneous linguistic resources

    The paper discusses two topics: firstly an approach of using multiple layers of annotation is sketched out. Regarding the XML representation this approach is similar to standoff annotation. A second topic is the use of heterogeneous linguistic... mehr

     

    The paper discusses two topics: firstly an approach of using multiple layers of annotation is sketched out. Regarding the XML representation this approach is similar to standoff annotation. A second topic is the use of heterogeneous linguistic resources (e.g., XML annotated documents, taggers, lexical nets) as a source for semiautomatic multi-dimensional markup to resolve typical linguistic issues, dealing with anaphora resolution as a case study.

     

    Export in Literaturverwaltung
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Englisch
    Medientyp: Konferenzveröffentlichung
    Format: Online
    DDC Klassifikation: Linguistik (410)
    Schlagworte: Korpus; Multimodalität; Annotation
    Lizenz:

    creativecommons.org/licenses/by-nc-nd/2.5/nl/ ; info:eu-repo/semantics/openAccess

  15. Making CONCUR work
    Erschienen: 2016
    Verlag:  Montreal : Extreme Markup Languages Conference

    The SGML feature CONCUR allowed for a document to be simultaneously marked up in multiple conflicting hierarchical tagsets but validated and interpreted in one tagset at a time. Alas, CONCUR was rarely implemented, and XML does not address the... mehr

     

    The SGML feature CONCUR allowed for a document to be simultaneously marked up in multiple conflicting hierarchical tagsets but validated and interpreted in one tagset at a time. Alas, CONCUR was rarely implemented, and XML does not address the problem of conflicting hierarchies at all. The MuLaX document syntax is a non-XML syntax that enables multiply-encoded hierarchies by distinguishing different “layers” in the hierarchy by adding a layer ID as a prefix to the element names. The IDs tie all the elements in a single hierarchy together in an “annotation layer”. Extraction of a single annotation layer results in a well-formed XML document, and each annotation layer may be associated with an XML schema. The MuLaX processing model works on the nodes of one annotation layer at a time through Xpath-like navigation. CONCUR lives!

     

    Export in Literaturverwaltung
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Englisch
    Medientyp: Konferenzveröffentlichung
    Format: Online
    DDC Klassifikation: Linguistik (410)
    Schlagworte: Computerlinguistik; Auszeichnungssprache; Annotation
    Lizenz:

    rightsstatements.org/page/InC/1.0/ ; info:eu-repo/semantics/openAccess

  16. Declarations of Relations, Differences and Transformations between Theory-specific Treebanks: A New Methodology
    Erschienen: 2016
    Verlag:  Växjö : Växjö University Press

    This paper deals with the problem of how to interrelate theory-specific treebanks and how to transform one treebank format to another. Currently, two approaches to achieve these goals can be differentiated. The first creates a mapping algorithm... mehr

     

    This paper deals with the problem of how to interrelate theory-specific treebanks and how to transform one treebank format to another. Currently, two approaches to achieve these goals can be differentiated. The first creates a mapping algorithm between treebank formats. Categories of a source format are transformed into a target format via a given set of general or language-specific mapping rules. The second relates treebanks via a transformation to a general model of linguistic categories, for example based on the EAGLES recommendations for syntactic annotations of corpora, or relying on the HPSG framework. This paper proposes a new methodology as a solution for these desiderata.

     

    Export in Literaturverwaltung
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Englisch
    Medientyp: Konferenzveröffentlichung
    Format: Online
    DDC Klassifikation: Linguistik (410)
    Schlagworte: Korpus; Annotation; Methode
    Lizenz:

    rightsstatements.org/page/InC/1.0/ ; info:eu-repo/semantics/openAccess

  17. Meaning and interpretation of concurrent markup
    Autor*in: Witt, Andreas
    Erschienen: 2016
    Verlag:  Tübingen : ZDV Universität Tübingen

    Export in Literaturverwaltung
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Englisch
    Medientyp: Konferenzveröffentlichung
    Format: Online
    DDC Klassifikation: Linguistik (410)
    Schlagworte: Korpus; Annotation; Auszeichnungssprache
    Lizenz:

    rightsstatements.org/page/InC/1.0/ ; info:eu-repo/semantics/openAccess

  18. Linguistische Informationsmodellierung mit XML
    Autor*in: Witt, Andreas
    Erschienen: 2016
    Verlag:  Wiesbaden : VS Verlag

  19. Linguistische Annotationen für die Analyse von Gliederungsstrukturen wissenschaftlicher Texte
    Erschienen: 2016
    Verlag:  Frankfurt am Main : Campus

  20. IGGSA-STEPS: Shared Task on Source and Target Extraction from Political Speeches
    Erschienen: 2016
    Verlag:  Gesellschaft für Sprachtechnologie und Computerlinguistik : Regensburg

    Accurate opinion mining requires the exact identification of the source and target of an opinion. To evaluate diverse tools, the research community relies on the existence of a gold standard corpus covering this need. Since such a corpus is currently... mehr

     

    Accurate opinion mining requires the exact identification of the source and target of an opinion. To evaluate diverse tools, the research community relies on the existence of a gold standard corpus covering this need. Since such a corpus is currently not available for German, the Interest Group on German Sentiment Analysis decided to create such a resource and make it available to the research community in the context of a shared task. In this paper, we describe the selection of textual sources, development of annotation guidelines, and first evaluation results in the creation of a gold standard corpus for the German language.

     

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Englisch
    Medientyp: Aufsatz aus einer Zeitschrift
    Format: Online
    DDC Klassifikation: Linguistik (410)
    Schlagworte: Korpus; Annotation; Parlamentsdebatte; Data Mining; Politische Sprache; Automatische Sprachanalyse
    Lizenz:

    creativecommons.org/licenses/by-nc-sa/3.0/de ; info:eu-repo/semantics/openAccess

  21. A CUP of CoFee: A Large Collection of Feedback Utterances Provided with Communicative Function Annotations
    Erschienen: 2016
    Verlag:  Paris : European Language Resources Association (ELRA)

    There have been several attempts to annotate communicative functions to utterances of verbal feedback in English previously. Here, we suggest an annotation scheme for verbal and non-verbal feedback utterances in French including the categories base,... mehr

     

    There have been several attempts to annotate communicative functions to utterances of verbal feedback in English previously. Here, we suggest an annotation scheme for verbal and non-verbal feedback utterances in French including the categories base, attitude, previous and visual. The data comprises conversations, maptasks and negotiations from which we extracted ca. 13,000 candidate feedback utterances and gestures. 12 students were recruited for the annotation campaign of ca. 9,500 instances. Each instance was annotated by between 2 and 7 raters. The evaluation of the annotation agreement resulted in an average best-pair kappa of 0.6. While the base category with the values acknowledgement, evaluation, answer, elicit and other achieves good agreement, this is not the case for the other main categories. The data sets, which also include automatic extractions of lexical, positional and acoustic features, are freely available and will further be used for machine learning classification experiments to analyse the form-function relationship of feedback.

     

    Export in Literaturverwaltung
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Englisch
    Medientyp: Konferenzveröffentlichung
    Format: Online
    DDC Klassifikation: Linguistik (410)
    Schlagworte: Pragmatik; Gesprochene Sprache; Rückmeldung; Automatische Sprachanalyse; Annotation
    Lizenz:

    creativecommons.org/licenses/by-nc/4.0/ ; info:eu-repo/semantics/openAccess

  22. Discourse Level Opinion Relations: An Annotation Study
    Erschienen: 2016
    Verlag:  Pittsburgh : University of Pittsburgh

    This work proposes opinion frames as a representation of discourse-level associations that arise from related opinion targets and which are common in task-oriented meeting dialogs. We define the opinion frames and explain their interpretation.... mehr

     

    This work proposes opinion frames as a representation of discourse-level associations that arise from related opinion targets and which are common in task-oriented meeting dialogs. We define the opinion frames and explain their interpretation. Additionally we present an annotation scheme that realizes the opinion frames and via human annotation studies, we show that these can be reliably identified.

     

    Export in Literaturverwaltung
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Englisch
    Medientyp: Konferenzveröffentlichung
    Format: Online
    DDC Klassifikation: Linguistik (410)
    Schlagworte: Automatische Textanalyse; Propositionale Einstellung; Annotation
    Lizenz:

    rightsstatements.org/page/InC/1.0/ ; info:eu-repo/semantics/openAccess

  23. Yes we can!? Annotating the senses of English modal verbs
    Erschienen: 2016
    Verlag:  Paris : European Language Resources Association (ELRA)

    This paper presents an annotation scheme for English modal verbs together with sense-annotated data from the news domain. We describe our annotation scheme and discuss problematic cases for modality annotation based on the inter-annotator agreement... mehr

     

    This paper presents an annotation scheme for English modal verbs together with sense-annotated data from the news domain. We describe our annotation scheme and discuss problematic cases for modality annotation based on the inter-annotator agreement during the annotation. Furthermore, we present experiments on automatic sense tagging, showing that our annotations do provide a valuable training resource for NLP systems.

     

    Export in Literaturverwaltung
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Englisch
    Medientyp: Konferenzveröffentlichung
    Format: Online
    DDC Klassifikation: Linguistik (410)
    Schlagworte: Englisch; Modalverb; Annotation
    Lizenz:

    rightsstatements.org/page/InC/1.0/ ; info:eu-repo/semantics/openAccess

  24. There’s no Data like More Data? Revisiting the Impact of Data Size on a Classification Task
    Erschienen: 2016
    Verlag:  European Language Resources Association

    In the paper we investigate the impact of data size on a Word Sense Disambiguation task (WSD). We question the assumption that the knowledge acquisition bottleneck, which is known as one of the major challenges for WSD, can be solved by simply... mehr

     

    In the paper we investigate the impact of data size on a Word Sense Disambiguation task (WSD). We question the assumption that the knowledge acquisition bottleneck, which is known as one of the major challenges for WSD, can be solved by simply obtaining more and more training data. Our case study on 1,000 manually annotated instances of the German verb drohen (threaten) shows that the best performance is not obtained when training on the full data set, but by carefully selecting new training instances with regard to their informativeness for the learning process (Active Learning). We present a thorough evaluation of the impact of different sampling methods on the data sets and propose an improved method for uncertainty sampling which dynamically adapts the selection of new instances to the learning progress of the classifier, resulting in more robust results during the initial stages of learning. A qualitative error analysis identifies problems for automatic WSD and discusses the reasons for the great gap in performance between human annotators and our automatic WSD system.

     

    Export in Literaturverwaltung
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Englisch
    Medientyp: Konferenzveröffentlichung
    Format: Online
    DDC Klassifikation: Linguistik (410)
    Schlagworte: Dokumentverarbeitung; Automatische Sprachanalyse; Annotation
    Lizenz:

    rightsstatements.org/page/InC/1.0/ ; info:eu-repo/semantics/openAccess

  25. Bringing Active Learning to Life
    Erschienen: 2016
    Verlag:  Beijing : Tsinghua University Press

    Active learning has been applied to different NLP tasks, with the aim of limiting the amount of time and cost for human annotation. Most studies on active learning have only simulated the annotation scenario, using prelabelled gold standard data. We... mehr

     

    Active learning has been applied to different NLP tasks, with the aim of limiting the amount of time and cost for human annotation. Most studies on active learning have only simulated the annotation scenario, using prelabelled gold standard data. We present the first active learning experiment for Word Sense Disambiguation with human annotators in a realistic environment, using fine-grained sense distinctions, and investigate whether AL can reduce annotation cost and boost classifier performance when applied to a real-world task.

     

    Export in Literaturverwaltung
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Englisch
    Medientyp: Konferenzveröffentlichung
    Format: Online
    DDC Klassifikation: Linguistik (410)
    Schlagworte: Computerlinguistik; Annotation
    Lizenz:

    creativecommons.org/licenses/by-nc-sa/3.0/de ; info:eu-repo/semantics/openAccess