Filtern nach
Letzte Suchanfragen

Ergebnisse für *

Es wurden 30 Ergebnisse gefunden.

Zeige Ergebnisse 1 bis 25 von 30.

Sortieren

  1. Standards und Methoden der Volltextdigitalisierung
    Beiträge des internationalen Kolloquiums an der Universität Trier, 8./9. Oktober 2001 ; [das am 8. und 9. Oktober 2001 an der Universität Trier durchgeführte Internationale Kolloquium "Standards und Methoden der Volltextdigitalisierung"]
    Autor*in:
    Erschienen: 2003
    Verlag:  Akad. d. Wiss. u. d. Lit., Mainz ; Steiner-Verlag-Wiesbaden-GmbH, Stuttgart

    BBF | Bibliothek für Bildungsgeschichtliche Forschung in Berlin
    uneingeschränkte Fernleihe, Kopie und Ausleihe
    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Hinweise zum Inhalt
    Inhaltsverzeichnis (Kostenfrei)
    Quelle: Verbundkataloge
    Beteiligt: Burch, Thomas (Hrsg.); Fournier, Johannes; Gärtner, Kurt; Rapp, Andrea
    Sprache: Deutsch; Englisch
    Medientyp: Buch (Monographie)
    Format: Druck
    ISBN: 3515083030
    RVK Klassifikation: AN 73000 ; ST 680 ; ES 900
    Schriftenreihe: Array ; 9
    Schlagworte: Volltext; Digitalisierung; Geisteswissenschaften; Projekt; XML; Informatik; Books; Library materials
    Umfang: 351 S., Ill., graph. Darst., 24 cm
    Bemerkung(en):

    Beitr. teilw. dt., teilw. engl

  2. An introduction to XML query processing and keyword search
    with 110 figures
    Autor*in:
    Erschienen: 2013
    Verlag:  Tsinghua Univ. Press, Beijing ; Springer, Berlin

    Technische Informationsbibliothek (TIB) / Leibniz-Informationszentrum Technik und Naturwissenschaften und Universitätsbibliothek
    T 13 B 5428
    uneingeschränkte Fernleihe, Kopie und Ausleihe
    Universitätsbibliothek Heidelberg
    LN-U10-17078
    uneingeschränkte Fernleihe, Kopie und Ausleihe
    Badische Landesbibliothek
    uneingeschränkte Fernleihe, Kopie und Ausleihe
    Universitätsbibliothek Kiel, Zentralbibliothek
    Bt 6621
    uneingeschränkte Fernleihe, Kopie und Ausleihe
    Württembergische Landesbibliothek
    63/5821
    uneingeschränkte Fernleihe, Kopie und Ausleihe
    Herzog August Bibliothek Wolfenbüttel
    64.3179
    uneingeschränkte Fernleihe, Kopie und Ausleihe
    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: Herzog August Bibliothek Wolfenbüttel
    Beteiligt: Lu, Jiaheng
    Sprache: Englisch
    Medientyp: Buch (Monographie)
    Format: Druck
    ISBN: 9787302285632; 9783642345548; 3642345549
    Weitere Identifier:
    9783642345548
    9787302285632
    RVK Klassifikation: ST 250
    Schlagworte: Datenbanksystem; XML; Abfrageverarbeitung; Abfragesprache; Baum <Mathematik>; ; Datenbanksystem; XML; Freitextsuche;
    Umfang: XII, 291 S, graph. Darst, 24 cm
    Bemerkung(en):

    Literaturangaben

  3. Linguistic Modeling of Information and Markup Languages
    Contributions to Language Technology
    Autor*in:
    Erschienen: 2010
    Verlag:  Springer Netherlands, Dordrecht ; Springer International Publishing AG, Cham

    Hessisches BibliotheksInformationsSystem HeBIS
    keine Fernleihe
    Hessisches BibliotheksInformationsSystem HeBIS
    keine Fernleihe
    Hessisches BibliotheksInformationsSystem HeBIS
    keine Fernleihe
    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: Verbundkataloge
    Beteiligt: Witt, Andreas (Herausgeber); Metzing, Dieter (Herausgeber)
    Sprache: Englisch
    Medientyp: Ebook
    Format: Online
    ISBN: 9789048133314; 9048133319
    Weitere Identifier:
    RVK Klassifikation: ES 915
    Auflage/Ausgabe: 1st ed. 2010
    Schriftenreihe: Text, Speech and Language Technology ; 40
    Schlagworte: Computerlinguistik; Auszeichnungssprache; XML; Annotation
    Umfang: 1 Online-Ressource (X, 266 Seiten)
  4. Beginning Java Databases: JDBC, SQL, J2EE, EJB, JSP, XML
    Autor*in:
    Erschienen: 2002
    Verlag:  Wrox Press, Birmingham

    Hochschul- und Landesbibliothek Fulda, Standort Campus
    AI / EDV 1000 47
    keine Fernleihe
    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: Verbundkataloge
    Beteiligt: Mukhar, Kevin
    Sprache: Englisch
    Medientyp: Buch (Monographie)
    Format: Druck
    ISBN: 1861004370
    RVK Klassifikation: ST 260
    Schlagworte: Java <Programmiersprache>; Datenbank; JDBC; SQL; Java 2 Enterprise Edition; Enterprise JavaBeans; Java Server Pages; XML
    Umfang: XVII, 973 S., graph. Darst.
  5. Standards und Methoden der Volltextdigitalisierung
    Beiträge des internationalen Kolloquiums an der Universität Trier, 8./9. Oktober 2001 ; [das am 8. und 9. Oktober 2001 an der Universität Trier durchgeführte Internationale Kolloquium "Standards und Methoden der Volltextdigitalisierung"]
    Autor*in:
    Erschienen: 2003
    Verlag:  Akad. d. Wiss. u. d. Lit., Mainz ; Steiner-Verlag-Wiesbaden-GmbH, Stuttgart

    BBF | Bibliothek für Bildungsgeschichtliche Forschung in Berlin
    uneingeschränkte Fernleihe, Kopie und Ausleihe
    Berlin-Brandenburgische Akademie der Wissenschaften, Akademiebibliothek
    uneingeschränkte Fernleihe, Kopie und Ausleihe
    Max-Planck-Institut für Bildungsforschung, Bibliothek und wissenschaftliche Information
    uneingeschränkte Fernleihe, Kopie und Ausleihe
    Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, Haus Unter den Linden
    uneingeschränkte Fernleihe, Kopie und Ausleihe
    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Hinweise zum Inhalt
    Inhaltsverzeichnis (Kostenfrei)
    Quelle: Verbundkataloge
    Beteiligt: Burch, Thomas (Hrsg.); Fournier, Johannes; Gärtner, Kurt; Rapp, Andrea
    Sprache: Deutsch; Englisch
    Medientyp: Buch (Monographie)
    Format: Druck
    ISBN: 3515083030
    RVK Klassifikation: AN 73000 ; ST 680 ; ES 900
    Schriftenreihe: Array ; 9
    Schlagworte: Volltext; Digitalisierung; Geisteswissenschaften; Projekt; XML; Informatik; Books; Library materials
    Umfang: 351 S., Ill., graph. Darst., 24 cm
    Bemerkung(en):

    Beitr. teilw. dt., teilw. engl

  6. Linguistic modeling of information and markup languages
    contributions to language technology
    Autor*in:
    Erschienen: 2009
    Verlag:  Springer, Dordrecht [u.a.]

    Universitätsbibliothek Gießen
    000 ES 915 W827
    uneingeschränkte Fernleihe, Kopie und Ausleihe
    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: Verbundkataloge
    Beteiligt: Witt, Andreas (Hrsg.)
    Sprache: Englisch
    Medientyp: Buch (Monographie)
    Format: Druck
    ISBN: 9400731124; 9789400731127
    RVK Klassifikation: ES 915
    Schriftenreihe: Text, speech and language technology ; 40
    Schlagworte: Computerlinguistik; Auszeichnungssprache; XML; Annotation
    Umfang: X, 266 S., graph. Darst., 23x16x1 cm
    Bemerkung(en):

    Literaturangaben

  7. XML
    principles, tools, and techniques
    Autor*in:
    Erschienen: 1997
    Verlag:  O'Reilly, Sebastopol, CA

    Universitätsbibliothek Augsburg
    uneingeschränkte Fernleihe, Kopie und Ausleihe
    Bayerische Staatsbibliothek
    uneingeschränkte Fernleihe, Kopie und Ausleihe
    Universität der Bundeswehr München, Universitätsbibliothek
    uneingeschränkte Fernleihe, Kopie und Ausleihe
    Universitätsbibliothek Passau
    uneingeschränkte Fernleihe, Kopie und Ausleihe
    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: Verbundkataloge
    Beteiligt: Connolly, Dan (Sonstige)
    Sprache: Englisch
    Medientyp: Buch (Monographie)
    ISBN: 1565923499
    RVK Klassifikation: ST 250 ; ST 200
    Schriftenreihe: World Wide Web journal ; 2,4
    Schlagworte: WWW; XML (Langage de balisage); XML (langage de balisage); XML; document structuré; hypertexte; édition électronique; XML
    Umfang: IX, 248 S., Ill.
    Bemerkung(en):

    Einzelaufnahme eines Zeitschr.-Heftes

  8. ›A digital edition is not visible‹ - some thoughts on the nature and persistence of digital editions
    Erschienen: 2020

    After a period of experimentation and prototyping, digital editions are considered a common standard and a serious, quite often even a better alternative to printed editions. In addition the TEI/XML provides a well introduced standard for mark-up of... mehr

    Herzog August Bibliothek Wolfenbüttel

     

    After a period of experimentation and prototyping, digital editions are considered a common standard and a serious, quite often even a better alternative to printed editions. In addition the TEI/XML provides a well introduced standard for mark-up of all relevant structural and semantic elements of an edition. In spite of this process of consolidation the digital edition is still accompanied by harsh critique, particularly by objecting that mark-up leaning on XML fosters a text model of an Ordered Hierarchy of Content Objects (OHCO) that does not fit all editorial problems and limits the flexibility of the editor. As a consequence many attempts have been undertaken to overcome these limits of XML, but up to now without much success. By narrowing down the perspective, however, to problems of the text model seemingly caused by XML it was often overlooked that a digital edition consists of more than a XML file. This contribution attempts to show that the critique can be dissolved when the edition is viewed not merely as a XML file, but as an ensemble of its components. In doing so it can also be shown that other than its critiques maintain a digital edition is not less stable or persistent than its printed predecessor. The seeming fluidity of digital edition disappears if it is no longer determined by its visible surface, but according to its algorithmic nature by the interplay of its components of text, structure, layout, interface and metadata.

     

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Hinweise zum Inhalt
    Volltext (OpenAccess Lizenz (Creative Commons License))
    Quelle: Herzog August Bibliothek Wolfenbüttel
    Sprache: Englisch
    Medientyp: Buch (Monographie)
    Format: Online
    Weitere Identifier:
    Übergeordneter Titel: Enthalten in: 2020; Artikel 5; Online-Ressource (HTML, XML, PDF)

    Schlagworte: Digital Humanities; Edition; Elektronisches Publizieren; Informationsvermittlung; XML; ; Elektronische Publikation;
    Umfang: Online-Ressource (HTML, XML, PDF)
  9. Standards und Methoden der Volltextdigitalisierung
    Beiträge des internationalen Kolloquiums an der Universität Trier, 8./9. Oktober 2001 ; [das am 8. und 9. Oktober 2001 an der Universität Trier durchgeführte Internationale Kolloquium "Standards und Methoden der Volltextdigitalisierung"]
    Autor*in:
    Erschienen: 2003
    Verlag:  Akad. d. Wiss. u. d. Lit., Mainz ; Steiner-Verlag-Wiesbaden-GmbH, Stuttgart

    BBF | Bibliothek für Bildungsgeschichtliche Forschung in Berlin
    uneingeschränkte Fernleihe, Kopie und Ausleihe
    Berlin-Brandenburgische Akademie der Wissenschaften, Akademiebibliothek
    keine Fernleihe
    Max-Planck-Institut für Bildungsforschung, Bibliothek und wissenschaftliche Information
    2012/312
    uneingeschränkte Fernleihe, Kopie und Ausleihe
    Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, Haus Potsdamer Straße
    1 A 528267
    uneingeschränkte Fernleihe, Kopie und Ausleihe
    Deutsches Schifffahrtsmuseum, Bibliothek
    03-1051
    uneingeschränkte Fernleihe, Kopie und Ausleihe
    Universitätsbibliothek Freiburg
    GE 2003/5690
    uneingeschränkte Fernleihe, Kopie und Ausleihe
    Universitätsbibliothek Greifswald
    610/AN 73000 B947
    uneingeschränkte Fernleihe, Kopie und Ausleihe
    Niedersächsische Staats- und Universitätsbibliothek Göttingen
    2004 A 18969
    uneingeschränkte Fernleihe, Kopie und Ausleihe
    Franckesche Stiftungen, Studienzentrum August Hermann Francke, Archiv und Bibliothek
    UA 300
    keine Fernleihe
    Universitäts- und Landesbibliothek Sachsen-Anhalt / Zentrale
    G I Eb 1050
    uneingeschränkte Fernleihe, Kopie und Ausleihe
    Universitäts- und Landesbibliothek Sachsen-Anhalt / Zentrale
    08 A 100
    uneingeschränkte Fernleihe, Kopie und Ausleihe
    Helmut-Schmidt-Universität, Universität der Bundeswehr Hamburg, Universitätsbibliothek
    BUB 667:YC0001
    uneingeschränkte Fernleihe, Kopie und Ausleihe
    Staats- und Universitätsbibliothek Hamburg Carl von Ossietzky
    BE 7516
    uneingeschränkte Fernleihe, Kopie und Ausleihe
    Staats- und Universitätsbibliothek Hamburg Carl von Ossietzky
    A 2004/3810
    uneingeschränkte Fernleihe, Kopie und Ausleihe
    Hochschule für Angewandte Wissenschaften Hamburg, Hochschulinformations- und Bibliotheksservice (HIBS), Fachbibliothek Technik, Wirtschaft, Informatik
    BID 137 015
    keine Fernleihe
    Gottfried Wilhelm Leibniz Bibliothek - Niedersächsische Landesbibliothek
    2003/9073
    uneingeschränkte Fernleihe, Kopie und Ausleihe
    Thüringer Universitäts- und Landesbibliothek
    2003 A 7874
    uneingeschränkte Fernleihe, Kopie und Ausleihe
    Badische Landesbibliothek
    ZB 583,1,EINZ,9
    uneingeschränkte Fernleihe, Kopie und Ausleihe
    Universitätsbibliothek Kiel, Zentralbibliothek
    Ba 5493
    uneingeschränkte Fernleihe, Kopie und Ausleihe
    Universität Konstanz, Kommunikations-, Informations-, Medienzentrum (KIM)
    lit 23.30/s91
    uneingeschränkte Fernleihe, Kopie und Ausleihe
    Leibniz-Institut für Deutsche Sprache (IDS), Bibliothek
    CID 238
    keine Ausleihe von Bänden, nur Papierkopien werden versandt
    Universitätsbibliothek Mannheim
    2003 A 7860
    uneingeschränkte Fernleihe, Kopie und Ausleihe
    Deutsches Literaturarchiv Marbach, Bibliothek
    C3
    keine Ausleihe von Bänden, nur Papierkopien werden versandt
    Universitätsbibliothek Osnabrück
    AWU 5030-785 0
    uneingeschränkte Fernleihe, Kopie und Ausleihe
    Universitätsbibliothek Rostock
    SS 2001 T826
    uneingeschränkte Fernleihe, Kopie und Ausleihe
    Hochschule der Medien, Bibliothek Standort Nobelstr.
    uneingeschränkte Fernleihe, Kopie und Ausleihe
    Württembergische Landesbibliothek
    53/5561
    uneingeschränkte Fernleihe, Kopie und Ausleihe
    Wilhelm-Schickard-Institut für Informatik, Bibliothek
    I.2.1
    keine Ausleihe von Bänden, nur Papierkopien werden versandt
    Klassik Stiftung Weimar / Herzogin Anna Amalia Bibliothek
    174062 - A
    uneingeschränkte Fernleihe, Kopie und Ausleihe
    UB Weimar
    Mag Af 5033
    uneingeschränkte Fernleihe, Kopie und Ausleihe
    Herzog August Bibliothek Wolfenbüttel
    F8° 4430:9
    uneingeschränkte Fernleihe, Kopie und Ausleihe
    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Hinweise zum Inhalt
    Quelle: Herzog August Bibliothek Wolfenbüttel; Herzogin Anna Amalia Bibliothek; Deutsches Literaturarchiv Marbach, Bibliothek; Leibniz-Institut für Deutsche Sprache, Bibliothek
    Beteiligt: Burch, Thomas (Hrsg.); Fournier, Johannes; Gärtner, Kurt; Rapp, Andrea
    Sprache: Deutsch; Englisch
    Medientyp: Buch (Monographie)
    Format: Druck
    ISBN: 3515083030
    RVK Klassifikation: AN 73000 ; ST 680 ; ES 900
    Schriftenreihe: Array ; 9
    Schlagworte: Volltext; Digitalisierung; Geisteswissenschaften; Projekt; XML; Informatik; Books; Library materials
    Umfang: 351 S., Ill., graph. Darst., 24 cm
    Bemerkung(en):

    Beitr. teilw. dt., teilw. engl

  10. XQuery for humanists
    Erschienen: [2020]
    Verlag:  Texas A&M University Press, College Station, [Texas]

    Why XQuery for humanists? -- Setting up your XQuery environment -- Reviewing XML and related standards -- Finding your way around with XPath -- XQuery basics -- Next steps with XQuery -- Advanced XQuery -- Thinking functionally -- Modifying your data... mehr

    Universitäts- und Landesbibliothek Bonn
    2020/919
    Ausleihe von Bänden möglich, keine Kopien
    Universitäts- und Landesbibliothek Münster
    3K 87844
    uneingeschränkte Fernleihe, Kopie und Ausleihe

     

    Why XQuery for humanists? -- Setting up your XQuery environment -- Reviewing XML and related standards -- Finding your way around with XPath -- XQuery basics -- Next steps with XQuery -- Advanced XQuery -- Thinking functionally -- Modifying your data with XQuery update -- Searching with XQuery full text -- Handling errors gracefully -- Using XQuery with other digital humanities tools -- Conclusion. ""XQuery for Humanists" provides an informed, opinionated overview and recommends the best implementations, libraries, and paradigms to empower those who need it most. Emphasizing practical applicability, the authors go beyond the XQuery language to include the basics of underlying standards like XPath, related standards like XQuery Full Text and XQuery Update, and explain the difference between XQuery and languages like Python and R. This book will afford readers the skills they need to build and analyze large-scale documentary corpora in XML. A ready-reference for faculty, graduate students, and librarians who seek to master XQuery for their projects"--

     

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: Verbundkataloge
    Beteiligt: Wicentowski, Joseph Charles (Verfasser)
    Sprache: Englisch
    Medientyp: Buch (Monographie)
    ISBN: 9781623498290
    Auflage/Ausgabe: First edition
    Schriftenreihe: Coding for humanists
    Schlagworte: XQuery; Digital Humanities; XML
    Weitere Schlagworte: XQuery (Computer program language); Digital humanities; XML (Document markup language)
    Umfang: xv, 331 Seiten
    Bemerkung(en):

    Includes bibliographical references and index

  11. Some Initial Reflections on XML Markup for an Image-Based Electronic Edition of the Brooklyn Museum Aramaic Papyri
    Erschienen: 2016

    A collaborative project of the Brooklyn Museum and a number of allied institutions, including Princeton Theological Seminary and West Semitic Research, the Digital Brooklyn Museum Aramaic Papyri (DBMAP) is to be both an image-based electronic... mehr

    Index theologicus der Universitätsbibliothek Tübingen
    keine Fernleihe

     

    A collaborative project of the Brooklyn Museum and a number of allied institutions, including Princeton Theological Seminary and West Semitic Research, the Digital Brooklyn Museum Aramaic Papyri (DBMAP) is to be both an image-based electronic facsimile edition of the important collection of Aramaic papyri from Elephantine housed at the Brooklyn Museum and an archival resource to support ongoing research on these papyri and the public dissemination of knowledge about them. In the process of building out a (partial) prototype of the edition, to serve as a proof of concept, we have discovered little field-specific discussion that might guide our markup decisions. Consequently, here our chief ambition is to initiate such a conversation. After a brief overview of DBMAP, we offer some initial reflection on and assessment of XML markup schemes specifically for Semitic texts from the ancient Near East that comply with TEI, CSE, and MEP guidelines. We take as our example BMAP 3 (=TAD B3.4) and we focus on markup as pertains to the editorial transcription of this documentary text and to the linguistic analysis of the text’s language

     

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Hinweise zum Inhalt
    Volltext (Kostenfrei)
    Volltext (Kostenfrei)
    Quelle: Verbundkataloge
    Beteiligt: Murray, Gregory (VerfasserIn); Hooker, Chris (VerfasserIn)
    Sprache: Englisch
    Medientyp: Aufsatz aus einer Zeitschrift
    Format: Online
    Weitere Identifier:
    Übergeordneter Titel: Enthalten in: Journal of religion, media and digital culture; Leiden : Brill, 2012; 5(2016), 1, Seite 50-72; Online-Ressource

    Schlagworte: Aramaic; Brooklyn Museum; Elephantine; TEI; XML; critical edition; markup; papyrus
  12. TEI-based XML-Applications: Transcriptions
    Autor*in: Witt, Andreas
    Erschienen: 2018

    Export in Literaturverwaltung
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Englisch
    Medientyp: Konferenzveröffentlichung
    Format: Online
    DDC Klassifikation: Germanische Sprachen; Deutsch (430)
    Schlagworte: Computerlinguistik; Text Encoding Initiative; SGML; XML
    Lizenz:

    rightsstatements.org/page/InC/1.0/ ; info:eu-repo/semantics/openAccess

  13. [tiger2] As a standardized serialisation for ISO 24615 - SynAF

    This paper presents the application of the format to various linguistic scenarios with the aim of making it the standard serialisation for the ISO 24615 [1] (SynAF) standard. After outlining the main characteristics of both the SynAF metamodel and... mehr

     

    This paper presents the application of the format to various linguistic scenarios with the aim of making it the standard serialisation for the ISO 24615 [1] (SynAF) standard. After outlining the main characteristics of both the SynAF metamodel and the format, as extended from the initial Tiger XML format [2], we show through a range of different language families how covers a variety of constituency and dependency based analyses. ; Cet article présente l'application du format pour divers scenari linguistiques dans le but de l'utiliser comme sérialisation de la norme ISO 24615 (SynAF). Après un rappel des caractéristiques principales du métamodèle de SynAF et du format, en tant qu'extension du format originel Tiger XML (König & Lezius, 2000), nous montrons au travers d'un panel de différentes familles de langues comment couvre une large gamme d'analyses syntaxiques fondées sur des constituants et sur des dépendances.

     

    Export in Literaturverwaltung
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Englisch
    Medientyp: Konferenzveröffentlichung
    Format: Online
    DDC Klassifikation: Germanische Sprachen; Deutsch (430)
    Schlagworte: Datenverarbeitung; Korpus; XML
    Lizenz:

    rightsstatements.org/page/InC/1.0/ ; info:eu-repo/semantics/openAccess

  14. Extending the possibilities for collaborative work with TEI/XML through the usage of a wiki system
    Erschienen: 2018
    Verlag:  New York : ACM

    This paper presents and discusses an integrated project-specific working environment for editing TEI/XML-files and linking entities of interest to a dedicated wiki system. This working environment has been specifically tailored to the workflow in our... mehr

     

    This paper presents and discusses an integrated project-specific working environment for editing TEI/XML-files and linking entities of interest to a dedicated wiki system. This working environment has been specifically tailored to the workflow in our interdisciplinary digital humanities project GeoBib. It addresses some challenges that arose while working with person-related data and geographical references in a growing collection of TEI/XML-files. While our current solution provides some essential benefits, we also discuss several critical issues and challenges that remain.

     

    Export in Literaturverwaltung
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Englisch
    Medientyp: Konferenzveröffentlichung
    Format: Online
    DDC Klassifikation: Sprache (400)
    Schlagworte: XML; Text Encoding Initiative; Korpus; Digital Humanities
    Lizenz:

    rightsstatements.org/page/InC/1.0/ ; info:eu-repo/semantics/openAccess

  15. A pragmatic approach to XML interoperability – the Component Metadata Infrastructure (CMDI)
    Erschienen: 2022
    Verlag:  Mannheim : Leibniz-Institut für Deutsche Sprache (IDS)

    XML has been designed for creating structured documents, but the information that is encoded in these structures are, by definition, out of scope for XML. Additional sources, normally not easily interpretable by computers, such as documentation are... mehr

     

    XML has been designed for creating structured documents, but the information that is encoded in these structures are, by definition, out of scope for XML. Additional sources, normally not easily interpretable by computers, such as documentation are needed to determine the intention of specific tags in a tag-set. The Component Metadata Infrastructure (CMDI) takes a rather pragmatic approach to foster interoperability between XML instances in the domain of metadata descriptions for language resources. This paper gives an overview of this approach.

     

    Export in Literaturverwaltung
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Englisch
    Medientyp: Konferenzveröffentlichung
    Format: Online
    DDC Klassifikation: Sprache (400)
    Schlagworte: XML; Metadaten; Repository; Datenmanagement; Computerlinguistik
    Lizenz:

    rightsstatements.org/page/InC/1.0/ ; info:eu-repo/semantics/openAccess

  16. Word-level alignment of paper documents with their electronic full-text counterparts
    Erschienen: 2022
    Verlag:  Stroudsburg, Pennsylvania : Association for Computational Linguistics ; Mannheim : Leibniz-Institut für Deutsche Sprache (IDS)

    We describe a simple procedure for the automatic creation of word-level alignments between printed documents and their respective full-text versions. The procedure is unsupervised, uses standard, off-the-shelf components only, and reaches an F-score... mehr

     

    We describe a simple procedure for the automatic creation of word-level alignments between printed documents and their respective full-text versions. The procedure is unsupervised, uses standard, off-the-shelf components only, and reaches an F-score of 85.01 in the basic setup and up to 86.63 when using pre- and post-processing. Potential areas of application are manual database curation (incl. document triage) and biomedical expression OCR.

     

    Export in Literaturverwaltung
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Englisch
    Medientyp: Konferenzveröffentlichung
    Format: Online
    DDC Klassifikation: Sprache (400)
    Schlagworte: Computerlinguistik; Volltext; Optische Zeichenerkennung; XML; Ausrichten
    Lizenz:

    creativecommons.org/licenses/by/4.0/ ; info:eu-repo/semantics/openAccess

  17. pyMMAX2: Deep access to MMAX2 projects from Python
    Erschienen: 2022
    Verlag:  Stroudsburg, Pennsylvania : Association for Computational Linguistics ; Mannheim : Leibniz-Institut für Deutsche Sprache (IDS)

    pyMMAX2 is an API for processing MMAX2 stand-off annotation data in Python. It provides a lightweight basis for the development of code which opens up the Java- and XML-based ecosystem of MMAX2 for more recent, Python-based NLP and data science... mehr

     

    pyMMAX2 is an API for processing MMAX2 stand-off annotation data in Python. It provides a lightweight basis for the development of code which opens up the Java- and XML-based ecosystem of MMAX2 for more recent, Python-based NLP and data science methods. While pyMMAX2 is pure Python, and most functionality is implemented from scratch, the API re-uses the complex implementation of the essential business logic for MMAX2 annotation schemes by interfacing with the original MMAX2 Java libraries. pyMMAX2 is available for download at github.com/nlpAThits/pyMMAX2.

     

    Export in Literaturverwaltung
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Englisch
    Medientyp: Konferenzveröffentlichung
    Format: Online
    DDC Klassifikation: Sprache (400)
    Schlagworte: Computerlinguistik; Python; API; XML; Neurolinguistisches Programmieren; Data Science
    Lizenz:

    creativecommons.org/licenses/by/4.0/ ; info:eu-repo/semantics/openAccess

  18. A flexible stand-off data model with query language for multi-level annotation
    Erschienen: 2022
    Verlag:  Stroudsburg, Pennsylvania : Association for Computational Linguistics ; Mannheim : Leibniz-Institut für Deutsche Sprache (IDS)

    We present an implemented XML data model and a new, simplified query language for multi-level annotated corpora. The new query language involves automatic conversion of queries into the underlying, more complicated MMAXQL query language. It supports... mehr

     

    We present an implemented XML data model and a new, simplified query language for multi-level annotated corpora. The new query language involves automatic conversion of queries into the underlying, more complicated MMAXQL query language. It supports queries for sequential and hierarchical, but also associative (e.g. coreferential) relations. The simplified query language has been designed with non-expert users in mind.

     

    Export in Literaturverwaltung
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Englisch
    Medientyp: Konferenzveröffentlichung
    Format: Online
    DDC Klassifikation: Sprache (400)
    Schlagworte: Datenmodell; Abfragesprache; XML; Korpus; Computerlinguistik
    Lizenz:

    creativecommons.org/licenses/by-nc-sa/3.0/ ; info:eu-repo/semantics/openAccess

  19. An API for discourse-level access to XML-encoded corpora
    Erschienen: 2022
    Verlag:  Paris : European Language Resources Association (ELRA) ; Mannheim : Leibniz-Institut für Deutsche Sprache (IDS)

    We describe a simple and efficient Java object model and application programming interface (API) for (possibly multi-modal) annotated natural language corpora. Corpora are represented as elements like Sentences, Turns, Utterances, Words, Gestures and... mehr

     

    We describe a simple and efficient Java object model and application programming interface (API) for (possibly multi-modal) annotated natural language corpora. Corpora are represented as elements like Sentences, Turns, Utterances, Words, Gestures and Markables. The API allows linguists to access corpora in terms of these discourse-level elements, i.e. at a conceptual level they are familiar with, with the flexibility offered by a general purpose programming language. It is also a contribution to corpus standardization efforts because it is based on a straightforward and easily extensible data model which can serve as a target for conversion of different corpus formats.

     

    Export in Literaturverwaltung
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Englisch
    Medientyp: Konferenzveröffentlichung
    Format: Online
    DDC Klassifikation: Sprache (400)
    Schlagworte: API; XML; Korpus; Natürliche Sprache; Vereinheitlichung; Datenmodell; Softwarewiederverwendung
    Lizenz:

    creativecommons.org/licenses/by-nc-sa/3.0/ ; info:eu-repo/semantics/openAccess

  20. Annotating anaphoric and bridging relations with MMAX
    Erschienen: 2022
    Verlag:  Stroudsburg, Pennsylvania : Association for Computational Linguistics ; Mannheim : Leibniz-Institut für Deutsche Sprache (IDS)

    We present a tool for the annotation of anaphoric and bridging relations in a corpus of written texts. Based on differences as well as similarities between these phenomena, we define an annotation scheme. We then implement the scheme within an... mehr

     

    We present a tool for the annotation of anaphoric and bridging relations in a corpus of written texts. Based on differences as well as similarities between these phenomena, we define an annotation scheme. We then implement the scheme within an annotation tool and demonstrate its use.

     

    Export in Literaturverwaltung
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Englisch
    Medientyp: Konferenzveröffentlichung
    Format: Online
    DDC Klassifikation: Sprache (400)
    Schlagworte: Annotation; Anapher <Syntax>; Korpus; Computerlinguistik; Schriftsprache; Datenmodell; XML
    Lizenz:

    creativecommons.org/licenses/by-nc-sa/3.0/ ; info:eu-repo/semantics/openAccess

  21. Charting a landscape of loans. An e-lexicographical project on German lexical borrowings in Polish dialects
    Erschienen: 2023
    Verlag:  Alexandroupolis : Democritus University of Thrace ; Mannheim : Leibniz-Institut für Deutsche Sprache (IDS)

    This paper reports on an ongoing international project of compiling a freely accessible online Dictionary of German Loans in Polish Dialects. The dictionary will be the first comprehensive lexicographic compendium of its kind, serving as a complement... mehr

     

    This paper reports on an ongoing international project of compiling a freely accessible online Dictionary of German Loans in Polish Dialects. The dictionary will be the first comprehensive lexicographic compendium of its kind, serving as a complement to existing resources on German lexical loans in the literary or standard language. The empirical results obtained in the project will shed new light on the distribution of German loanwords among different dialects, also in comparison to the well-documented situation in written Polish. The dictionary will have a strong focus on the dialectal distribution of Polish dialectal variants for a given German etymon, accessible through interactive cartographic representations and corresponding search options. The editorial process is realized with dedicated collaborative web tools. The new resource will be published as an integrated part of an online information system for German lexical borrowings in other languages, the Lehnwortportal Deutsch, and is therefore highly cross-linked with other loanword dictionaries on Polish as well as Slavic and further European languages.

     

    Export in Literaturverwaltung
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Englisch
    Medientyp: Konferenzveröffentlichung
    Format: Online
    DDC Klassifikation: Sprache (400)
    Schlagworte: Lehnwort; Lexikografie; Deutsch; Polnisch; Entlehnung; Mundart; Online-Wörterbuch; Wörterbuch; Dialektologie; XML; Datenbank
    Lizenz:

    creativecommons.org/licenses/by-sa/4.0/ ; info:eu-repo/semantics/openAccess

  22. Feature-based encoding and querying language resources with character semantics
    Erschienen: 2024
    Verlag:  Paris : European Language Resources Association (ELRA) ; Mannheim : Leibniz-Institut für Deutsche Sprache (IDS)

    In this paper we discuss the explicit representation of character features pertaining to written language resources, which we argue are critically necessary in the long term of archiving language data. Much focus on the creation of language resources... mehr

     

    In this paper we discuss the explicit representation of character features pertaining to written language resources, which we argue are critically necessary in the long term of archiving language data. Much focus on the creation of language resources and their associated preservation is at the level of the corpus itself; however it is generally accepted that long term interpretation of these language resources requires more than a best practice data format. In particular, where language resources are created in linguistic fieldwork, and especially for minority languages, the need for preservation not only of the resource itself, but of additional metadata which allows for the resource to be accurately interpreted in the future is becoming a topic of research in itself. In this paper we extend earlier work on semantically based character decomposition to include representation of character properties in a variety of models, and a mechanism for exploiting these properties through queries.

     

    Export in Literaturverwaltung
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Englisch
    Medientyp: Konferenzveröffentlichung
    Format: Online
    DDC Klassifikation: Sprache (400)
    Schlagworte: Sprachdaten; Archivierung; Metadaten; Phonetik; Ontologie <Wissensverarbeitung>; XML
    Lizenz:

    creativecommons.org/licenses/by-nc-sa/3.0/ ; info:eu-repo/semantics/openAccess

  23. Annotation driven concordancing: the PAX toolkit
    Erschienen: 2024
    Verlag:  Paris : European Language Resources Association (ELRA) ; Mannheim : Leibniz-Institut für Deutsche Sprache (IDS)

    We describe PAX, "Portable Audio Concordance System", a proof-of-concept prototype of a multipurpose, multilingual audio concordance toolkit. The primary goal is to support efficient grammar and lexicon construction in the documentation of unwritten... mehr

     

    We describe PAX, "Portable Audio Concordance System", a proof-of-concept prototype of a multipurpose, multilingual audio concordance toolkit. The primary goal is to support efficient grammar and lexicon construction in the documentation of unwritten languages; languages currently included are Ega, Anyi, and Koulango (Ivory Coast), additional samples in German and English. The approach combines methods from corpus linguistics, annotation theory and practice, phonetics and lexicography.

     

    Export in Literaturverwaltung
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Englisch
    Medientyp: Konferenzveröffentlichung
    Format: Online
    DDC Klassifikation: Sprache (400)
    Schlagworte: Annotation; Konkordanz; Korpus; Phonetik; Lexikografie; XML; Gesprochene Sprache; Multimodales System
    Lizenz:

    creativecommons.org/licenses/by-nc-sa/3.0/ ; info:eu-repo/semantics/openAccess

  24. A multi-view hyperlexicon resource for speech and language system development
    Erschienen: 2024
    Verlag:  Paris : European Language Resources Association (ELRA) ; Mannheim : Leibniz-Institut für Deutsche Sprache (IDS)

    New generations of integrated multimodal speech and language systems with dictation, readback or talking face facilities require multiple sources of lexical information for development and evaluation. Recent developments in hyperlexicon development... mehr

     

    New generations of integrated multimodal speech and language systems with dictation, readback or talking face facilities require multiple sources of lexical information for development and evaluation. Recent developments in hyperlexicon development offer new perspectives for the development of such resources which are at the same time practically useful, computationally feasible, and theoretically well-founded. We describe the specification, three-level lexical document design principles, and implementation of a MARTIF document structure and several presentation structures for a terminological lexicon, including both on demand access and full hypertext lexicon compilation. The underlying resource is a relational lexical database with SQL querying and access via a CGI internet interface. This resource is mapped on to the hypergraph structure which defines the macrostructure of the hyperlexicon.

     

    Export in Literaturverwaltung
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Englisch
    Medientyp: Konferenzveröffentlichung
    Format: Online
    DDC Klassifikation: Sprache (400)
    Schlagworte: SGML; XML; Multimodalität; Datenbank; Computerlinguistik
    Lizenz:

    creativecommons.org/licenses/by-nc-sa/3.0/ ; info:eu-repo/semantics/openAccess

  25. Unlocking the corpus: enriching metadata with state-of-the-art NLP methodology and linked data
    Erschienen: 2024
    Verlag:  Utrecht : CLARIN ; Mannheim : Leibniz-Institut für Deutsche Sprache (IDS)

    In research data management, descriptive metadata are indispensable to describing data and are a key element in preparing data according to the FAIR principles (Wilkinson et al., 2016). Extracting semantic metadata from textual research data is... mehr

     

    In research data management, descriptive metadata are indispensable to describing data and are a key element in preparing data according to the FAIR principles (Wilkinson et al., 2016). Extracting semantic metadata from textual research data is currently not part of most metadata workflows, even more so if a research data set can be subdivided into smaller parts, such as a newspaper corpus containing multiple newspaper articles. Our approach is to add semantic metadata at the text level to facilitate the search over data. We show how to enrich metadata with three NLP methods: named entity recognition, keyword extraction, and topic modeling. The goal is to make it possible to search for texts that are about certain topics or described by certain keywords, or to identify people, places, and organisations mentioned in texts without actually having to read them and at the same time facilitate the creation of task-tailored subcorpora. To enhance this usability of the data we explore options based on the German Reference Corpus DeReKo, the largest linguistically motivated collection of German language material (Kupietz & Keibel, 2009; Kupietz et al., 2010, 2018), which contains multiple newspapers, books, transcriptions, etc., and enrich its metadata on the level of subportions, i.e. newspaper articles. We received access to a number of data files in DeReKo’s native XML format, I5. To develop the methodology, we focus on a single XML file containing all issues of one newspaper of a whole year. The following sections only give an overview of our approach, we intend, however, to provide a detailed description of the experiments and the selection of data in a subsequent longer contribution.

     

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Englisch
    Medientyp: Aufsatz aus einem Sammelband
    Format: Online
    DDC Klassifikation: Sprache (400)
    Schlagworte: Korpus; Metadaten; Natürliche Sprache; Computerlinguistik; Datenmanagement; Named Entity Recognition; Deutsch; XML
    Lizenz:

    creativecommons.org/licenses/by/4.0/ ; info:eu-repo/semantics/openAccess