Ergebnisse für *

Es wurden 29 Ergebnisse gefunden.

Zeige Ergebnisse 1 bis 25 von 29.

Sortieren

  1. FnhdC/HTML und FnhdC/S
    Erschienen: 2018
    Verlag:  Duisburg : Universitätsverlag Rhein-Ruhr OHG

    Wir beschreiben kurz den explorativen (Fnhd/HTML) und analytischen Zugang (Fnhd/S) zum Bonner Frühneuhochdeutsch-Korpus, auf das über http://www.ikp.uni-bonn.de/fnhd/ zugegriffen werden kann. ; We shortly describe an explorative (Fnhd/HTML) and an... mehr

     

    Wir beschreiben kurz den explorativen (Fnhd/HTML) und analytischen Zugang (Fnhd/S) zum Bonner Frühneuhochdeutsch-Korpus, auf das über www.ikp.uni-bonn.de/fnhd/ zugegriffen werden kann. ; We shortly describe an explorative (Fnhd/HTML) and an analytic interface (Fnhd/S) to the Bonn Corpus of Early New High German that can be accessed via www.ikp.uni-bonn.de/fnhd/.

     

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Deutsch
    Medientyp: Aufsatz aus einer Zeitschrift
    Format: Online
    DDC Klassifikation: Germanische Sprachen; Deutsch (430)
    Schlagworte: Frühneuhochdeutsch; Korpus; Computerlinguistik; HTML; XML
    Lizenz:

    rightsstatements.org/page/InC/1.0/ ; info:eu-repo/semantics/openAccess

  2. XML-Kodierung des Bonner Frühneuhochdeutschkorpus
    Erschienen: 2018
    Verlag:  Bonn : Institut für Kommunikationsforschung und Phonetik

  3. Lexikonexpansion: Vom XML-annotiertem Stammformenlexikon zum Vollformenlexikon
    Erschienen: 2018
    Verlag:  Norderstedt : Libri Books on Demand

    Im Folgenden wird eine texttechnologische Komponente zur Expansion eines XML- annotierten Stammformenlexikons, das auf Einträgen eines Standardwörterbuchs basiert, vorgestellt. Diese Expansion wurde in der Document Style Semantics and Specification... mehr

     

    Im Folgenden wird eine texttechnologische Komponente zur Expansion eines XML- annotierten Stammformenlexikons, das auf Einträgen eines Standardwörterbuchs basiert, vorgestellt. Diese Expansion wurde in der Document Style Semantics and Specification Language implementiert. Ihr Ergebnis ist ein Vollformenlexikon, das ebenfalls in XML repräsentiert ist.

     

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Deutsch
    Medientyp: Aufsatz aus einem Sammelband
    Format: Online
    DDC Klassifikation: Germanische Sprachen; Deutsch (430)
    Schlagworte: XML; DSSSL; Computerunterstützte Lexikographie; Texttechnologie; Computerlinguistik
    Lizenz:

    creativecommons.org/licenses/by-nc-nd/3.0/de/deed.de ; info:eu-repo/semantics/openAccess

  4. TEI-based XML-Applications: Transcriptions
    Autor*in: Witt, Andreas
    Erschienen: 2018

    Export in Literaturverwaltung
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Englisch
    Medientyp: Konferenzveröffentlichung
    Format: Online
    DDC Klassifikation: Germanische Sprachen; Deutsch (430)
    Schlagworte: Computerlinguistik; Text Encoding Initiative; SGML; XML
    Lizenz:

    rightsstatements.org/page/InC/1.0/ ; info:eu-repo/semantics/openAccess

  5. [tiger2] As a standardized serialisation for ISO 24615 - SynAF

    This paper presents the application of the format to various linguistic scenarios with the aim of making it the standard serialisation for the ISO 24615 [1] (SynAF) standard. After outlining the main characteristics of both the SynAF metamodel and... mehr

     

    This paper presents the application of the format to various linguistic scenarios with the aim of making it the standard serialisation for the ISO 24615 [1] (SynAF) standard. After outlining the main characteristics of both the SynAF metamodel and the format, as extended from the initial Tiger XML format [2], we show through a range of different language families how covers a variety of constituency and dependency based analyses. ; Cet article présente l'application du format pour divers scenari linguistiques dans le but de l'utiliser comme sérialisation de la norme ISO 24615 (SynAF). Après un rappel des caractéristiques principales du métamodèle de SynAF et du format, en tant qu'extension du format originel Tiger XML (König & Lezius, 2000), nous montrons au travers d'un panel de différentes familles de langues comment couvre une large gamme d'analyses syntaxiques fondées sur des constituants et sur des dépendances.

     

    Export in Literaturverwaltung
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Englisch
    Medientyp: Konferenzveröffentlichung
    Format: Online
    DDC Klassifikation: Germanische Sprachen; Deutsch (430)
    Schlagworte: Datenverarbeitung; Korpus; XML
    Lizenz:

    rightsstatements.org/page/InC/1.0/ ; info:eu-repo/semantics/openAccess

  6. Aspekte der texttechnologischen Modellierung
    Erschienen: 2018
    Verlag:  Wiesbaden : VS Verlag für Sozialwissenschaften

  7. Dokumentgrammatiken als Grundlage von XML-Tools
    Erschienen: 2018
    Verlag:  Wiesbaden : VS Verlag für Sozialwissenschaften

  8. Textauszeichnungssprachen und Dokumentgrammatiken
    Erschienen: 2018
    Verlag:  Tübingen : Stauffenburg Verlag

  9. Komplexität und Einfachheit in der Evolution von Dokumentgrammatiken
    Erschienen: 2018
    Verlag:  Stuttgart (u.a.) : Metzler

    The paper investigates the evolution of document grammars from a linguistic point of view. Document grammars have been developed in the past decades in order to formalize knowledge on the structure of textual information. A well-known instance of a... mehr

     

    The paper investigates the evolution of document grammars from a linguistic point of view. Document grammars have been developed in the past decades in order to formalize knowledge on the structure of textual information. A well-known instance of a document grammar is the »Document Type Definition« (DTD) as part of the Extensible Markup Language (XML). DTDs allow to define so-called tree grammars that constrain the application of tag-sets in the process of annotation of a document. In an XML-based document workflow, DTDs play a crucial role for validation and transforming huge amounts of texts in standardized data formats. An interesting point in the development of XML DTDs is the fact that the restriction of the formal expressiveness paved the way to understand the formal properties of document grammars better and to develop more a powerful version like XML Schema recently. In this sense, the simplicity of the original approach, resulting from the necessary restriction of previous approaches, yielded new complexity on formally understood grounds.

     

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Deutsch
    Medientyp: Aufsatz aus einer Zeitschrift
    Format: Online
    DDC Klassifikation: Germanische Sprachen; Deutsch (430)
    Schlagworte: XML; DTD; Computerlinguistik; Formale Sprache
    Lizenz:

    rightsstatements.org/page/InC/1.0/ ; info:eu-repo/semantics/openAccess

  10. Erweiterte Dokumentgrammatiken als Grundlage innovativer XML-Tools (Extended Document Grammars as a Basis for Innovative XML Tools)
    Erschienen: 2018
    Verlag:  Berlin (u.a.) : De Gruyter Oldenbourg

    Wohlgeformte XML-Dokumente lassen sich als Bäume interpretieren und diese wiederum durch Grammatiken beschreiben. Dokumentgrammatiken weisen einige Besonderheiten auf, die sie von Grammatiken für natürliche Sprachen oder Programmiersprachen... mehr

     

    Wohlgeformte XML-Dokumente lassen sich als Bäume interpretieren und diese wiederum durch Grammatiken beschreiben. Dokumentgrammatiken weisen einige Besonderheiten auf, die sie von Grammatiken für natürliche Sprachen oder Programmiersprachen unterscheidet. Dieser Beitrag erläutert die Verarbeitungsmöglichkeiten, die aus der Nutzung von formalen Dokumentgrammatiken erwachsen. ; Well-formed XML documents can be interpreted as trees, and trees can be described by grammars. Document grammars have some special features that distinguishes them from grammars for natural or programming languages. This paper shows some of the possibilities that grow out from the use of formal document grammars for processing purposes.

     

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Deutsch
    Medientyp: Aufsatz aus einer Zeitschrift
    Format: Online
    DDC Klassifikation: Germanische Sprachen; Deutsch (430)
    Schlagworte: XML; Strukturbaum; Grammatik
    Lizenz:

    creativecommons.org/licenses/by-nc-nd/4.0/deed.de ; info:eu-repo/semantics/openAccess

  11. Vernetzungsstrukturen lexikografischer Daten und ihre XML-basierte Modellierung
    Erschienen: 2015
    Verlag:  Aarhus : Aarhus University, School of Business and Social Sciences

    Lexicographic data are normally linked with each other in a complex manner. Especially, within the electronic lexicographic context, the following issues are addressed: How to encode these cross-reference structures so that both the lexicographers‘... mehr

     

    Lexicographic data are normally linked with each other in a complex manner. Especially, within the electronic lexicographic context, the following issues are addressed: How to encode these cross-reference structures so that both the lexicographers‘ editorial work with the linking-up is easy to handle and the options of the presentation are adequately flexible. The objective of this paper is to elucidate the presentation of an XML-modelling of cross-reference structures as part of a complete modelling concept. Thereby, the modelling potential of the XML-connected standard XLink and a new lexicographic concept will be brought together with cross-project guidelines for the modelling of link-structures.

     

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Deutsch
    Medientyp: Aufsatz aus einer Zeitschrift
    Format: Online
    DDC Klassifikation: Germanische Sprachen; Deutsch (430)
    Schlagworte: Computerunterstützte Lexikographie; XML
    Lizenz:

    rightsstatements.org/page/InC/1.0/ ; info:eu-repo/semantics/openAccess

  12. Different Views on Markup
    Erschienen: 2015
    Verlag:  Dordrecht : Springer

    In this chapter, two different ways of grouping information represented in document markup are examined: annotation levels, referring to conceptual levels of description, and annotation layers, referring to the technical realisation of markup using... mehr

     

    In this chapter, two different ways of grouping information represented in document markup are examined: annotation levels, referring to conceptual levels of description, and annotation layers, referring to the technical realisation of markup using e.g. document grammars. In many current XML annotation projects, multiple levels are integrated into one layer, often leading to the problem of having to deal with overlapping hierarchies. As a solution, we propose a framework for XML-based multiple, independent XML annotation layers for one text, based on an abstract representation of XML documents with logical predicates. Two realisations of the abstract representation are presented, a Prolog fact base format together with an application architecture, and a specification for XML native databases. We conclude with a discussion of projects that have currently adopted this framework.

     

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Englisch
    Medientyp: Aufsatz aus einem Sammelband
    Format: Online
    DDC Klassifikation: Linguistik (410)
    Schlagworte: Computerlinguistik; XML; Annotation
    Lizenz:

    rightsstatements.org/page/InC/1.0/ ; info:eu-repo/semantics/openAccess

  13. XML in der Praxis: Dokument parsen, validieren und verarbeiten
  14. Igel: Comparing document grammars using XQuery

    Igel is a small XQuery-based web application for examining a collection of document grammars; in particular, for comparing related document grammars to get a better overview of their differences and similarities. In its initial form, Igel reads only... mehr

     

    Igel is a small XQuery-based web application for examining a collection of document grammars; in particular, for comparing related document grammars to get a better overview of their differences and similarities. In its initial form, Igel reads only DTDs and provides only simple lists of constructs in them (elements, attributes, notations, parameter entities). Our continuing work is aimed at making Igel provide more sophisticated and useful information about document grammars and building the application into a useful tool for the analysis (and the maintenance!) of families of related document grammars

     

    Export in Literaturverwaltung
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Englisch
    Medientyp: Konferenzveröffentlichung
    Format: Online
    DDC Klassifikation: Linguistik (410)
    Schlagworte: Korpus; XML; XQuery
    Lizenz:

    creativecommons.org/licenses/by-nc-nd/3.0/de/deed.de ; info:eu-repo/semantics/openAccess

  15. TEI Feature Structures as a Representation Format for Multiple Annotation and Generic XML Documents
    Erschienen: 2017

    Feature structures are mathematical entities (rooted labeled directed acyclic graphs) that can be represented as graph displays, attribute value matrices or as XML adhering to the constraints of a specialized TEI tag set. We demonstrate that this... mehr

     

    Feature structures are mathematical entities (rooted labeled directed acyclic graphs) that can be represented as graph displays, attribute value matrices or as XML adhering to the constraints of a specialized TEI tag set. We demonstrate that this latter ISO-standardized format can be used as an integrative storage and exchange format for sets of multiple annotation XML documents. This specific domain of application is rooted in the approach of multiple annotations, which marks a possible solution for XML-compliant markup in scenarios with conflicting annotation hierarchies. A more extreme proposal consists in the possible use as a meta-representation format for generic XML documents. For both scenarios our strategy concerning pertinent feature structure representations is grounded on the XDM (XQuery 1.0 and XPath 2.0 Data Model). The ubiquitous hierarchical and sequential relationships within XML documents are represented by specific features that take ordered list values. The mapping to the TEI feature structure format has been implemented in the form of an XSLT 2.0 stylesheet. It can be characterized as exploiting aspects of both the push and pull processing paradigm as appropriate. An indexing mechanism is provided with regard to the multiple annotation documents scenario. Hence, implicit links concerning identical primary data are made explicit in the result format. In comparison to alternative representations, the TEI-based format does well in many respects, since it is both integrative and well-formed XML. However, the result documents tend to grow very large depending on the size of the input documents and their respective markup structure. This may also be considered as a downside regarding the proposed use for generic XML documents. On the positive side, it may be possible to achieve a hookup to methods and applications that have been developed for feature structure representations in the fields of (computational) linguistics and knowledge representation.

     

    Export in Literaturverwaltung
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Englisch
    Medientyp: Konferenzveröffentlichung
    Format: Online
    DDC Klassifikation: Sprache (400)
    Schlagworte: Text Encoding Initiative; XML; Auszeichnungssprache
    Lizenz:

    rightsstatements.org/page/InC/1.0/ ; info:eu-repo/semantics/openAccess

  16. Query von Multiebenen-annotierten XML-Dokumenten mit Prolog
    Erschienen: 2017
    Verlag:  Sankt Augustin : Gardez! Verlag

  17. Generierung von Linkangeboten zur Rekonstruktion terminologiebedingter Wissensvoraussetzungen
    Erschienen: 2017
    Verlag:  Saarbrücken : DFKI GmbH

    Dieser Beitrag skizziert Strategien zur (semi-)automatischen Annotation von definitorischen Textsegmenten und Termverwendungsinstanzen auf der Grundlage grammatisch annotierter Korpora. Ziel unserer Überlegungen ist es, bei der selektiven Rezeption... mehr

     

    Dieser Beitrag skizziert Strategien zur (semi-)automatischen Annotation von definitorischen Textsegmenten und Termverwendungsinstanzen auf der Grundlage grammatisch annotierter Korpora. Ziel unserer Überlegungen ist es, bei der selektiven Rezeption von Fachtexten in einer Hypertextumgebung die je spezifischen Wissensvoraussetzungen, die der Verwendung von Fachtermini unterliegen und die für das Textverständnis eine entscheidende Rolle spielen, über automatisch generierte Linkangebote rekonstruierbar zu machen.

     

    Export in Literaturverwaltung
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Deutsch
    Medientyp: Konferenzveröffentlichung
    Format: Online
    DDC Klassifikation: Sprache (400)
    Schlagworte: Fachsprache; Hyperlink; XML; Terminologie; Wissenserwerb
    Lizenz:

    rightsstatements.org/page/InC/1.0/ ; info:eu-repo/semantics/openAccess

  18. Converting a Corpus into a Hypertext: An Approach Using XML Topic Maps and XSLT
    Erschienen: 2017
    Verlag:  Las Palmas : Universidad de Las Palmas de Gran Canaria

    In the context of the HyTex project, our goal is to convert a corpus into a hypertext, basing conversion strategies on annotations which explicitly mark up the text-grammatical structures and relations between text segments. Domain-specific knowledge... mehr

     

    In the context of the HyTex project, our goal is to convert a corpus into a hypertext, basing conversion strategies on annotations which explicitly mark up the text-grammatical structures and relations between text segments. Domain-specific knowledge is represented in the form of a knowledge net, using topic maps. We use XML as an interchange format. In this paper, we focus on a declarative rule language designed to express conversion strategies in terms of text-grammatical structures and hypertext results. The strategies can be formulated in a concise formal syntax which is independend of the markup, and which can be transformed automatically into executable program code.

     

    Export in Literaturverwaltung
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Englisch
    Medientyp: Konferenzveröffentlichung
    Format: Online
    DDC Klassifikation: Sprache (400)
    Schlagworte: XML; Korpus; Hypertext; Topic map; XSL Transformation
    Lizenz:

    rightsstatements.org/page/InC/1.0/ ; info:eu-repo/semantics/openAccess

  19. Hypertextualisierung mit Topic Maps - ein Ansatz zur Unterstützung des Textverständnisses bei der selektiven Rezeption von Fachtexten
    Erschienen: 2017
    Verlag:  Bonn : Gesellschaft für Informatik

    Der Kurzbeitrag berichtet über ein Projekt ”Hypertextualisierung auf textgrammatischer Grundlage“ (HyTex), in dem erforscht wird, wie sich linear organisierte Dokumente mit semiautomatischen Methoden auf der Grundlage von textgrammatischem Markup und... mehr

     

    Der Kurzbeitrag berichtet über ein Projekt ”Hypertextualisierung auf textgrammatischer Grundlage“ (HyTex), in dem erforscht wird, wie sich linear organisierte Dokumente mit semiautomatischen Methoden auf der Grundlage von textgrammatischem Markup und der linguistisch motivierten Modellierung terminologischen Wissens in delinearisierte Hyperdokumente überführen lassen. Ziel ist es, eine Sammlung von Fachtexten so in einen Hypertext zu überführen, dass terminologiebedingte Verständnisschwierigkeiten beim Lesen durch entsprechende Linkangebote aufgelöst werden, so dass die Fachtexte auch von Semi-Experten der Domäne selektiv gelesen werden können. Der Schwerpunkt des Beitrags liegt auf der Modellierung terminologischen Wissens mit XML Topic Maps und dessen Stellenwert für die automatische Erzeugung von Hyperlinks.

     

    Export in Literaturverwaltung
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Deutsch
    Medientyp: Konferenzveröffentlichung
    Format: Online
    DDC Klassifikation: Sprache (400)
    Schlagworte: Fachsprache; XML; Hyperlink; Terminologie; Wissenserwerb
    Lizenz:

    rightsstatements.org/page/InC/1.0/ ; info:eu-repo/semantics/openAccess

  20. Elektronische Editionen – Möglichkeiten, Grenzen, Perspektiven ; Electronic editions – possibilities, limitations, perspectives
    Erschienen: 2008

    Vorbemerkung 3 Einführung 5 1 Elektronische Editionen 9 1.1 Typen elektronischer Editionen 9 1.2 Entstehungsbedingungen elektronischer Editionen 12 1.3 Buchnahe elektronische Editionen 14 1.3.1 Datenerfassung 16 1.3.2 Datenverarbeitung 16 1.3.3... mehr

     

    Vorbemerkung 3 Einführung 5 1 Elektronische Editionen 9 1.1 Typen elektronischer Editionen 9 1.2 Entstehungsbedingungen elektronischer Editionen 12 1.3 Buchnahe elektronische Editionen 14 1.3.1 Datenerfassung 16 1.3.2 Datenverarbeitung 16 1.3.3 Datenausgabe 16 1.4 Elektronischen Medien nahe stehende elektronische Editionen 17 1.4.1 Navigation 18 1.4.2 Textdarstellung 20 1.4.3 Hypertext und Hypermedia 22 1.4.4 Retrieval 23 1.4.5 Textexport 28 1.4.6 Notizen, Lesezeichen und Exzerptdatenbanken 29 1.4.7 Retrodigitalisierung 29 1.5 Hybrideditionen 31 1.6 »Status quo« elektronischer Editionen 32 1.6.1 Verfügbarkeit elektronischer Editionen 32 1.6.2 Tabellarischer Überblick 33 2 Text in Büchern und elektronischen Medien 37 2.1 Texte in Büchern 38 2.1.1 Geschichte als Heuristik 39 2.1.2 Text nimmt materielle Gestalt an 41 2.1.3 Text und Gestaltung 43 2.1.4 Buchproduktion und Distribution 55 2.1.5 Entmaterialisierung und Virtualisierung von Texten 58 2.2 Texte in elektronischen Medien 58 2.2.1 Speicherung von Texten in elektronischen Medien 59 2.2.2 Datenformat und Darstellungsformat 59 2.2.3 Kodierung elektronischer Texte 60 2.2.4 Datenformate für formatierte Texte 60 2.2.5 Semantische Kodierung 63 2.2.6 X-Media-Publishing 64 2.3 Elektronische Editionen und Editionswissenschaft 65 2.3.1 Einrichtung vorhandener Editionen für elektronische Medien 66 2.3.2 Erarbeitung zukunftssicherer elektronischer Editionen 67 2.3.3 Produktionsseitige Dokumentation 68 3 Konzepte und Technologien für elektronische Editionen 69 3.1 Auszeichnungssprachen 71 3.1.1 Grundprinzip von Auszeichnungssprachen 71 3.1.2 Standard Generalized Markup Language 74 3.1.3 Hyper Text Markup Language 76 3.1.4 Extensible Markup Language 77 3.1.5 XML-basierte Datenformate 78 3.1.6 Auszeichnungssprachen in den Geisteswissenschaften 79 3.2 Extensible Markup Language 80 3.2.1 Einführung in XML 81 3.2.2 XML Grundbegriffe 81 3.2.3 Darstellungsweisen 86 3.2.4 XML-Inhaltsmodelle 87 3.2.5 XML-Namensräume 88 3.2.6 XML-Anwendungen 91 3.2.7 XML-Technologien 92 3.3 Die ...

     

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
  21. A pragmatic approach to XML interoperability – the Component Metadata Infrastructure (CMDI)
    Erschienen: 2022
    Verlag:  Mannheim : Leibniz-Institut für Deutsche Sprache (IDS)

    XML has been designed for creating structured documents, but the information that is encoded in these structures are, by definition, out of scope for XML. Additional sources, normally not easily interpretable by computers, such as documentation are... mehr

     

    XML has been designed for creating structured documents, but the information that is encoded in these structures are, by definition, out of scope for XML. Additional sources, normally not easily interpretable by computers, such as documentation are needed to determine the intention of specific tags in a tag-set. The Component Metadata Infrastructure (CMDI) takes a rather pragmatic approach to foster interoperability between XML instances in the domain of metadata descriptions for language resources. This paper gives an overview of this approach.

     

    Export in Literaturverwaltung
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Englisch
    Medientyp: Konferenzveröffentlichung
    Format: Online
    DDC Klassifikation: Sprache (400)
    Schlagworte: XML; Metadaten; Repository; Datenmanagement; Computerlinguistik
    Lizenz:

    rightsstatements.org/page/InC/1.0/ ; info:eu-repo/semantics/openAccess

  22. Word-level alignment of paper documents with their electronic full-text counterparts
    Erschienen: 2022
    Verlag:  Stroudsburg, Pennsylvania : Association for Computational Linguistics ; Mannheim : Leibniz-Institut für Deutsche Sprache (IDS)

    We describe a simple procedure for the automatic creation of word-level alignments between printed documents and their respective full-text versions. The procedure is unsupervised, uses standard, off-the-shelf components only, and reaches an F-score... mehr

     

    We describe a simple procedure for the automatic creation of word-level alignments between printed documents and their respective full-text versions. The procedure is unsupervised, uses standard, off-the-shelf components only, and reaches an F-score of 85.01 in the basic setup and up to 86.63 when using pre- and post-processing. Potential areas of application are manual database curation (incl. document triage) and biomedical expression OCR.

     

    Export in Literaturverwaltung
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Englisch
    Medientyp: Konferenzveröffentlichung
    Format: Online
    DDC Klassifikation: Sprache (400)
    Schlagworte: Computerlinguistik; Volltext; Optische Zeichenerkennung; XML; Ausrichten
    Lizenz:

    creativecommons.org/licenses/by/4.0/ ; info:eu-repo/semantics/openAccess

  23. pyMMAX2: Deep access to MMAX2 projects from Python
    Erschienen: 2022
    Verlag:  Stroudsburg, Pennsylvania : Association for Computational Linguistics ; Mannheim : Leibniz-Institut für Deutsche Sprache (IDS)

    pyMMAX2 is an API for processing MMAX2 stand-off annotation data in Python. It provides a lightweight basis for the development of code which opens up the Java- and XML-based ecosystem of MMAX2 for more recent, Python-based NLP and data science... mehr

     

    pyMMAX2 is an API for processing MMAX2 stand-off annotation data in Python. It provides a lightweight basis for the development of code which opens up the Java- and XML-based ecosystem of MMAX2 for more recent, Python-based NLP and data science methods. While pyMMAX2 is pure Python, and most functionality is implemented from scratch, the API re-uses the complex implementation of the essential business logic for MMAX2 annotation schemes by interfacing with the original MMAX2 Java libraries. pyMMAX2 is available for download at github.com/nlpAThits/pyMMAX2.

     

    Export in Literaturverwaltung
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Englisch
    Medientyp: Konferenzveröffentlichung
    Format: Online
    DDC Klassifikation: Sprache (400)
    Schlagworte: Computerlinguistik; Python; API; XML; Neurolinguistisches Programmieren; Data Science
    Lizenz:

    creativecommons.org/licenses/by/4.0/ ; info:eu-repo/semantics/openAccess

  24. A flexible stand-off data model with query language for multi-level annotation
    Erschienen: 2022
    Verlag:  Stroudsburg, Pennsylvania : Association for Computational Linguistics ; Mannheim : Leibniz-Institut für Deutsche Sprache (IDS)

    We present an implemented XML data model and a new, simplified query language for multi-level annotated corpora. The new query language involves automatic conversion of queries into the underlying, more complicated MMAXQL query language. It supports... mehr

     

    We present an implemented XML data model and a new, simplified query language for multi-level annotated corpora. The new query language involves automatic conversion of queries into the underlying, more complicated MMAXQL query language. It supports queries for sequential and hierarchical, but also associative (e.g. coreferential) relations. The simplified query language has been designed with non-expert users in mind.

     

    Export in Literaturverwaltung
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Englisch
    Medientyp: Konferenzveröffentlichung
    Format: Online
    DDC Klassifikation: Sprache (400)
    Schlagworte: Datenmodell; Abfragesprache; XML; Korpus; Computerlinguistik
    Lizenz:

    creativecommons.org/licenses/by-nc-sa/3.0/ ; info:eu-repo/semantics/openAccess

  25. An API for discourse-level access to XML-encoded corpora
    Erschienen: 2022
    Verlag:  Paris : European Language Resources Association (ELRA) ; Mannheim : Leibniz-Institut für Deutsche Sprache (IDS)

    We describe a simple and efficient Java object model and application programming interface (API) for (possibly multi-modal) annotated natural language corpora. Corpora are represented as elements like Sentences, Turns, Utterances, Words, Gestures and... mehr

     

    We describe a simple and efficient Java object model and application programming interface (API) for (possibly multi-modal) annotated natural language corpora. Corpora are represented as elements like Sentences, Turns, Utterances, Words, Gestures and Markables. The API allows linguists to access corpora in terms of these discourse-level elements, i.e. at a conceptual level they are familiar with, with the flexibility offered by a general purpose programming language. It is also a contribution to corpus standardization efforts because it is based on a straightforward and easily extensible data model which can serve as a target for conversion of different corpus formats.

     

    Export in Literaturverwaltung
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Englisch
    Medientyp: Konferenzveröffentlichung
    Format: Online
    DDC Klassifikation: Sprache (400)
    Schlagworte: API; XML; Korpus; Natürliche Sprache; Vereinheitlichung; Datenmodell; Softwarewiederverwendung
    Lizenz:

    creativecommons.org/licenses/by-nc-sa/3.0/ ; info:eu-repo/semantics/openAccess