Filtern nach
Letzte Suchanfragen

Ergebnisse für *

Es wurden 41 Ergebnisse gefunden.

Zeige Ergebnisse 1 bis 25 von 41.

Sortieren

  1. The Syntax of “Complex Prepositions” in German: An HPSG Approach

    Export in Literaturverwaltung
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Englisch
    Medientyp: Unbestimmt
    Format: Online
    DDC Klassifikation: Germanische Sprachen; Deutsch (430)
    Schlagworte: HPSG
    Lizenz:

    kostenfrei

  2. The Syntax of “Complex Prepositions” in German: An HPSG Approach
    Erschienen: 2017
    Verlag:  Institut für Deutsche Sprache, Bibliothek, Mannheim

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: Verbundkataloge
    Beteiligt: Bański, Piotr (Herausgeber); Przepiórkowski, Adam (Herausgeber)
    Sprache: Englisch
    Medientyp: Buch (Monographie)
    Format: Online
    Weitere Identifier:
    DDC Klassifikation: Germanische Sprachen; Deutsch (430)
    Schlagworte: Head-driven phrase structure grammar; Präposition; Deutsch
    Weitere Schlagworte: HPSG
    Umfang: Online-Ressource
    Bemerkung(en):

    In: Proceedings of the GLiP-5 Conference. Generative Linguistics in Poland: Morphosyntactic Investigations. Warsaw, Poland. 30 November - 1 December 2002. - Warsaw : Instytut Podstaw Informatyki Polskiej Akademii Nauk, 2003., S. 155-166

  3. Intra-connecting an exemplary literary corpus with semantic web technologies for exploratory literary studies
    Erschienen: 2017
    Verlag:  Institut für Deutsche Sprache, Bibliothek, Mannheim

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: Verbundkataloge
    Beteiligt: Bański, Piotr (Herausgeber); Kupietz, Marc (Herausgeber); Lüngen, Harald (Herausgeber); Rayson, Paul (Herausgeber); Biber, Hanno (Herausgeber); Breiteneder, Evelyn (Herausgeber); Clematide, Simon (Herausgeber); Mariani, John (Herausgeber); Stevenson, Mark (Herausgeber); Sick, Theresa (Herausgeber)
    Sprache: Englisch
    Medientyp: Buch (Monographie)
    Format: Online
    Weitere Identifier:
    Schlagworte: Korpus <Linguistik>; Literatur; Österreich; Aichinger, Ilse; Text Encoding Initiative (TEI); Intertextualität; Semantic Web; Digital Humanities
    Weitere Schlagworte: Word associations; Corpus linguistics; Intertextuality; Literary corpus
    Umfang: Online-Ressource
    Bemerkung(en):

    In: Proceedings of the Workshop on Challenges in the Management of Large Corpora and Big Data and Natural Language Processing (CMLC-5+BigNLP) 2017 including the papers from the Web-as-Corpus (WAC-XI) guest section. Birmingham, 24 July 2017. - Mannheim : Institut für Deutsche Sprache, 2017., S. 1-6

  4. Legal canvas for a patchwork of multilingual quotations: the case of CoMParS
    Erschienen: 2017
    Verlag:  Institut für Deutsche Sprache, Bibliothek, Mannheim

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: Verbundkataloge
    Beteiligt: Kamocki, Paweł (Verfasser); Trawiński, Beata (Verfasser)
    Sprache: Englisch
    Medientyp: Buch (Monographie)
    Format: Online
    Weitere Identifier:
    DDC Klassifikation: Germanische Sprachen; Deutsch (430)
    Schlagworte: Kontrastive Grammatik; Deutsch; Sprachtypologie; Englisch; Französisch; Ungarisch; Polnisch; Korpus <Linguistik>
    Weitere Schlagworte: GDE-V; CoMParS; Eigentumsrecht
    Umfang: Online-Ressource
    Bemerkung(en):

    In: Corpus Linguistics International Conference 2017, University of Birmingham, Tuesday 25–Friday 28 July 2017. - Birmingham : University of Birmingham, 2017., S. 78-81

  5. Deutsch in Europa
    Sprachpolitisch, grammatisch, methodisch
    Autor*in:
    Erschienen: [2021]; ©2021
    Verlag:  De Gruyter, Berlin ; Walter de Gruyter GmbH

    Die deutsche Sprache hat sich innerhalb Europas als Teil einer europäischen Sprachengemeinschaft entwickelt. Von besonderem wissenschaftlichen Interesse ist die Frage, wie sich Sprachen untereinander beeinflussen, verändern und mit welchen... mehr

    Hessisches BibliotheksInformationsSystem HeBIS
    keine Fernleihe
    Hessisches BibliotheksInformationsSystem HeBIS
    keine Fernleihe
    Hessisches BibliotheksInformationsSystem HeBIS
    keine Fernleihe
    Hessisches BibliotheksInformationsSystem HeBIS
    keine Fernleihe

     

    Die deutsche Sprache hat sich innerhalb Europas als Teil einer europäischen Sprachengemeinschaft entwickelt. Von besonderem wissenschaftlichen Interesse ist die Frage, wie sich Sprachen untereinander beeinflussen, verändern und mit welchen methodischen Zugängen und Sprachressourcen das zu untersuchen ist. Der ständige Austausch zwischen diesen Sprachen und die politischen Rahmenbedingungen in der Europäischen Union werfen darüber hinaus konkrete sprach- und bildungspolitische Fragen auf. German has developed as part of a European language community. This volume asks interesting questions about how these languages influence each other and change, and which methodological approaches and linguistic resources can be used to analyse this. The constant interaction between these languages and the political framework of the EU also raise specific questions regarding language and educational policy.

     

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Hinweise zum Inhalt
  6. Proceedings of the workshop on challenges in the management of large corpora (CMLC-7) 2019
    Cardiff, 22. July 2019
    Erschienen: [2019]; © 2019
    Verlag:  Leibniz-Institut für Deutsche Sprache, Mannheim

    Leibniz-Institut für Deutsche Sprache (IDS), Bibliothek
    keine Fernleihe
    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Hinweise zum Inhalt
    Volltext (Kostenfrei)
    Volltext (Kostenfrei)
    Quelle: Leibniz-Institut für Deutsche Sprache, Bibliothek
    Beteiligt: Barbaresi, Adrien (VerfasserIn); Biber, Hanno (VerfasserIn); Breiteneder, Evelyn (VerfasserIn); Clematide, Simon (VerfasserIn); Kupietz, Marc (VerfasserIn); Lüngen, Harald (VerfasserIn); Iliadi, Caroline (VerfasserIn)
    Sprache: Englisch
    Medientyp: Buch (Monographie)
    Format: Online
    Weitere Identifier:
    Schlagworte: Datenmanagement; Information Retrieval; Natürliche Sprache; Korpus <Linguistik>
    Umfang: 1 Online-Ressource
  7. Modeling and annotating complex data structures
    Erschienen: 2019

    Leibniz-Institut für Deutsche Sprache (IDS), Bibliothek
    keine Fernleihe
    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: Leibniz-Institut für Deutsche Sprache, Bibliothek
    Beteiligt: Witt, Andreas (VerfasserIn)
    Sprache: Englisch
    Medientyp: Aufsatz aus einem Sammelband
    Format: Druck
    Übergeordneter Titel: Enthalten in: The shape of data in the digital humanities; London : Routledge, Taylor & Francis Group, 2019; (2019'), Seite [217]-235; xviii, 341 Seiten

  8. Deutsch in Europa
    Sprachpolitisch, grammatisch, methodisch
    Autor*in:
    Erschienen: [2021]; ©2021
    Verlag:  De Gruyter, Berlin ; Boston

    Die deutsche Sprache hat sich innerhalb Europas als Teil einer europäischen Sprachengemeinschaft entwickelt. Von besonderem wissenschaftlichen Interesse ist die Frage, wie sich Sprachen untereinander beeinflussen, verändern und mit welchen... mehr

    Zugang:
    Hochschulbibliothek der Fachhochschule Aachen
    Universitätsbibliothek der RWTH Aachen
    Fachhochschule Bielefeld, Hochschulbibliothek
    Hochschule Bochum, Hochschulbibliothek
    Ruhr-Universität Bochum, Universitätsbibliothek
    Universitäts- und Landesbibliothek Bonn
    Fachhochschule Dortmund, Hochschulbibliothek
    Universitätsbibliothek Duisburg-Essen, Campus Essen
    Westfälische Hochschule Gelsenkirchen Bocholt Recklinghausen, Hochschulbibliothek
    Universitätsbibliothek der Fernuniversität
    Katholische Hochschule Nordrhein-Westfalen (katho), Hochschulbibliothek
    Technische Hochschule Köln, Hochschulbibliothek
    Zentralbibliothek der Sportwissenschaften der Deutschen Sporthochschule Köln
    Hochschule Ruhr West, Hochschulbibliothek, Zweigbibliothek Bottrop
    Hochschule Ruhr West, Hochschulbibliothek
    Universitäts- und Landesbibliothek Münster

     

    Die deutsche Sprache hat sich innerhalb Europas als Teil einer europäischen Sprachengemeinschaft entwickelt. Von besonderem wissenschaftlichen Interesse ist die Frage, wie sich Sprachen untereinander beeinflussen, verändern und mit welchen methodischen Zugängen und Sprachressourcen das zu untersuchen ist. Der ständige Austausch zwischen diesen Sprachen und die politischen Rahmenbedingungen in der Europäischen Union werfen darüber hinaus konkrete sprach- und bildungspolitische Fragen auf German has developed as part of a European language community. This volume asks interesting questions about how these languages influence each other and change, and which methodological approaches and linguistic resources can be used to analyse this. The constant interaction between these languages and the political framework of the EU also raise specific questions regarding language and educational policy

     

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Hinweise zum Inhalt
    Quelle: Verbundkataloge
    Beteiligt: Albert, Marina Foschi (Sonstige); Auer, Peter (Sonstige); Barbaresi, Adrien (Sonstige); Bański, Piotr (Sonstige); Beyer, Rahel (Sonstige); Bodmer, Franck (Sonstige); Bopp, Jutta (Sonstige); Czapka, Sophia (Sonstige); Diewald, Nils (Sonstige); Dovalil, Vít (Sonstige); Ebert, Johannes (Sonstige); Falke, Stefan (Sonstige); Fischer, Patricia (Sonstige); Fuhrhop, Nanna (Sonstige); Gagarina, Natalia (Sonstige); Geyken, Alexander (Sonstige); Gunkel, Lutz (Sonstige); Harders, Peter (Sonstige); Hartmann, Jutta M. (Sonstige); Hinrichs, Erhard (Sonstige); Hirschmann, Hagen (Sonstige); Irimia, Elena (Sonstige); Krifka, Manfred (Sonstige); Kupietz, Marc (Sonstige); Káňa, Tomáš (Sonstige)
    Sprache: Deutsch
    Medientyp: Ebook
    Format: Online
    ISBN: 9783110731514
    Weitere Identifier:
    Schriftenreihe: Jahrbuch des Instituts für Deutsche Sprache ; 2020
    Weitere Schlagworte: Deutsch/Sprache; Europa/Sprache; Kontrastive Linguistik; Sprachpolitik; FOREIGN LANGUAGE STUDY / German
    Umfang: 1 online resource (XVIII, 332 p.)
  9. CoMParS: Eine Sammlung von multilingualen Parallelsequenzen des Deutschen und anderer europäischer Sprachen
    Erschienen: [2021]; © 2021

    Staats- und Universitätsbibliothek Bremen
    keine Fernleihe
    Niedersächsische Staats- und Universitätsbibliothek Göttingen
    keine Fernleihe
    Universitätsbibliothek Kiel, Zentralbibliothek
    keine Fernleihe
    Leibniz-Institut für Deutsche Sprache (IDS), Bibliothek
    keine Fernleihe
    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: Leibniz-Institut für Deutsche Sprache, Bibliothek
    Beteiligt: Schlotthauer, Susan (VerfasserIn); Bański, Piotr (VerfasserIn)
    Sprache: Deutsch
    Medientyp: Aufsatz aus einem Sammelband
    Format: Druck
    Übergeordneter Titel: Enthalten in: Jahrestagung des Instituts für Deutsche Sprache (56. : 2020 : Mannheim); Deutsch in Europa; Berlin : de Gruyter, 2021; (2021), Seite 301-309; XVII, 332 Seiten

  10. Corpus Query Lingua Franca part II: Ontology
    Erschienen: 2020
    Verlag:  Paris : European Language Resources Association

    The present paper outlines the projected second part of the Corpus Query Lingua Franca (CQLF) family of standards: CQLF Ontology, which is currently in the process of standardization at the International Standards Organization (ISO), in its Technical... mehr

     

    The present paper outlines the projected second part of the Corpus Query Lingua Franca (CQLF) family of standards: CQLF Ontology, which is currently in the process of standardization at the International Standards Organization (ISO), in its Technical Committee 37, Subcommittee 4 (TC37SC4) and its national mirrors. The first part of the family, ISO 24623-1 (henceforth CQLF Metamodel), was successfully adopted as an international standard at the beginning of 2018. The present paper reflects the state of the CQLF Ontology at the moment of submission for the Committee Draft ballot. We provide a brief overview of the CQLF Metamodel, present the assumptions and aims of the CQLF Ontology, its basic structure, and its potential extended applications. The full ontology is expected to emerge from a community process, starting from an initial version created by the authors of the present paper.

     

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Englisch
    Medientyp: Aufsatz aus einem Sammelband
    Format: Online
    DDC Klassifikation: Sprache (400)
    Schlagworte: Abfragesprache; ISO-Norm; Standardisierung; Korpus
    Lizenz:

    creativecommons.org/licenses/by-nc/4.0/ ; info:eu-repo/semantics/openAccess

  11. CoMParS: Eine Sammlung von multilingualen Parallelsequenzen des Deutschen und anderer europäischer Sprachen
    Erschienen: 2021
    Verlag:  Berlin [u.a.] : de Gruyter

    Dieser Beitrag präsentiert die neue multilinguale Ressource CoMParS (Collection of Multilingual Parallel Sequences). CoMParS versteht sich als eine funktional-semantisch orientierte Datenbank von Parallelsequenzen des Deutschen und anderer... mehr

     

    Dieser Beitrag präsentiert die neue multilinguale Ressource CoMParS (Collection of Multilingual Parallel Sequences). CoMParS versteht sich als eine funktional-semantisch orientierte Datenbank von Parallelsequenzen des Deutschen und anderer europäischer Sprachen, in der alle Daten neben den sprachspezifischen und universellen (im Sinne von Universal Dependencies) morphosyntaktischen Annotationen auch nach sprachübergreifenden funktional-semantischen Informationen auf der neudefinierten Annotationsebene Functional Domains annotiert und auf mehreren Ebenen (auch ebenenübergreifend) miteinander verlinkt sind. CoMParS wird in TEI P5 XML kodiert und sowohl als monolinguale wie auch als multilinguale Sprachressource modelliert.

     

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Deutsch
    Medientyp: Aufsatz aus einem Sammelband
    Format: Online
    DDC Klassifikation: Sprache (400)
    Schlagworte: Datenbank; Korpus; Kontrastive Grammatik
    Lizenz:

    rightsstatements.org/page/InC/1.0/ ; info:eu-repo/semantics/openAccess

  12. Proceedings of the Workshop on Challenges in the Management of Large Corpora (CMLC-9) 2021. Limerick, 12 July 2021 (Online-Event)
    Erschienen: 2021
    Verlag:  Mannheim : Leibniz-Institut für Deutsche Sprache

    Contents: 1. Julien Abadji, Pedro Javier Ortiz Suárez, Laurent Romary and Benoît Sagot: "Ungoliant: An Optimized Pipeline for the Generation of a Very Large-Scale Multilingual Web Corpus", S.1-9. 2. Markus Gärtner, Felicitas Kleinkopf, Melanie... mehr

     

    Contents: 1. Julien Abadji, Pedro Javier Ortiz Suárez, Laurent Romary and Benoît Sagot: "Ungoliant: An Optimized Pipeline for the Generation of a Very Large-Scale Multilingual Web Corpus", S.1-9. 2. Markus Gärtner, Felicitas Kleinkopf, Melanie Andresen and Sibylle Hermann: "Corpus Reusability and Copyright - Challenges and Opportunities", S.10-19. 3. Nils Diewald, Eliza Margaretha and Marc Kupietz: "Lessons learned in Quality Management for Online Research Software Tools in Linguistics", S.20-26.

     

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Englisch
    Medientyp: Buch (Monographie)
    Format: Online
    DDC Klassifikation: Sprache (400)
    Schlagworte: Korpus; Datenmanagement; Computerlinguistik; Urheberrecht; Forschungsdaten
    Lizenz:

    creativecommons.org/licenses/by/4.0/deed.de ; info:eu-repo/semantics/openAccess

  13. Proceedings of the LREC 2022 Workshop on Challenges in the Management of Large Corpora (CMLC-10 2022). Marseille, 20 June 2022
    Erschienen: 2022
    Verlag:  Paris : European Language Resources Association (ELRA) ; Mannheim : Leibniz-Institut für Deutsche Sprache (IDS)

    Contents: 1. Vasile Pais, Maria Mitrofan, Verginica Barbu Mititelu, Elena Irimia, Roxana Micu and Carol Luca Gasan: Challenges in Creating a Representative Corpus of Romanian Micro-Blogging Text. Pp. 1-7 2. Modest von Korff: Exhaustive Indexing of... mehr

     

    Contents: 1. Vasile Pais, Maria Mitrofan, Verginica Barbu Mititelu, Elena Irimia, Roxana Micu and Carol Luca Gasan: Challenges in Creating a Representative Corpus of Romanian Micro-Blogging Text. Pp. 1-7 2. Modest von Korff: Exhaustive Indexing of PubMed Records with Medical Subject Headings. Pp. 8-15 3. Luca Brigada Villa: UDeasy: a Tool for Querying Treebanks in CoNLL-U Format. Pp. 16-19 4. Nils Diewald: Matrix and Double-Array Representations for Efficient Finite State Tokenization. Pp. 20-26 5. Peter Fankhauser and Marc Kupietz: Count-Based and Predictive Language Models for Exploring DeReKo. Pp. 27-31 6. Hanno Biber: “The word expired when that world awoke.” New Challenges for Research with Large Text Corpora and Corpus-Based Discourse Studies in Totalitarian Times. Pp. 32-35

     

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Englisch
    Medientyp: Buch (Monographie)
    Format: Online
    DDC Klassifikation: Sprache (400)
    Schlagworte: Korpus; Daten; Datenmanagement; Datensammlung; Datenanalyse; Datensatz; Datenqualität
    Lizenz:

    creativecommons.org/licenses/by-nc/4.0/ ; info:eu-repo/semantics/openAccess

  14. Standards in CLARIN
    Erschienen: 2022
    Verlag:  Berlin/Boston : de Gruyter ; Mannheim : Leibniz-Institut für Deutsche Sprache (IDS)

    This chapter looks at a fragment of the ongoing work of the CLARIN Standards Committee (CSC) on producing a shared set of recommendations on standards, formats, and related best practices supported by the CLARIN infrastructure and its participating... mehr

     

    This chapter looks at a fragment of the ongoing work of the CLARIN Standards Committee (CSC) on producing a shared set of recommendations on standards, formats, and related best practices supported by the CLARIN infrastructure and its participating centres. What might at first glance seem to be a straightforward goal has over the years proven to be rather complex, reflecting the robustness and heterogeneity of the emerging distributed digital research infrastructure and the various disciplines and research traditions of the language-based humanities that it serves and represents, and therefore part of the chapter reviews the various initiatives and proposals that strove to produce helpful standards-related guidance. The focus turns next to a subtask initiated in late 2019, its scope narrowed to one of the core activities and responsibilities of CLARIN backbone centres, namely the provision of data deposition services. Centres are obligated to publish their recom-mendations concerning the repertoire of data formats that are best suited for their research profiles. We look at how this requirement has been met by the particular centres and suggest that having centres maintain their information in the Standards Information System (SIS) is the way to improve on the current state of affairs.

     

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Englisch
    Medientyp: Aufsatz aus einem Sammelband
    Format: Online
    DDC Klassifikation: Sprache (400)
    Schlagworte: Datenerfassung; Standardisierung; Forschungsinfrastruktur; Datenformat; Empfehlungssystem
    Lizenz:

    creativecommons.org/licenses/by/4.0/ ; info:eu-repo/semantics/openAccess

  15. Access control by query rewriting: the case of KorAP
    Erschienen: 2014
    Verlag:  Reykjavik : European Language Resources Association (ELRA)

    We present an approach to an aspect of managing complex access scenarios to large and heterogeneous corpora that involves handling user queries that, intentionally or due to the complexity of the queried resource, target texts or annotations outside... mehr

     

    We present an approach to an aspect of managing complex access scenarios to large and heterogeneous corpora that involves handling user queries that, intentionally or due to the complexity of the queried resource, target texts or annotations outside of the given user’s permissions. We first outline the overall architecture of the corpus analysis platform KorAP, devoting some attention to the way in which it handles multiple query languages, by implementing ISO CQLF (Corpus Query Lingua Franca), which in turn constitutes a component crucial for the functionality discussed here. Next, we look at query rewriting as it is used by KorAP and zoom in on one kind of this procedure, namely the rewriting of queries that is forced by data access restrictions.

     

    Export in Literaturverwaltung
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Englisch
    Medientyp: Konferenzveröffentlichung
    Format: Online
    DDC Klassifikation: Germanische Sprachen; Deutsch (430)
    Schlagworte: Korpus
    Lizenz:

    rightsstatements.org/page/InC/1.0/ ; info:eu-repo/semantics/openAccess

  16. Maximizing the potential of very large corpora: 50 years of big language data at IDS Mannheim
    Erschienen: 2014
    Verlag:  Reykjavik : ELRA

    Very large corpora have been built and used at the IDS since its foundation in 1964. They have been made available on the Internet since the beginning of the 90’s to currently over 30,000 researchers worldwide. The Institute provides the largest... mehr

     

    Very large corpora have been built and used at the IDS since its foundation in 1964. They have been made available on the Internet since the beginning of the 90’s to currently over 30,000 researchers worldwide. The Institute provides the largest archive of written German (Deutsches Referenzkorpus, DeReKe) which has recently been extended to 24 billion words. DeReKe has been managed and analysed by engines known as COSMAS and afterwards COSMAS II, which is currently being replaced by a new, scalable analysis platform called KorAP. KorAP makes it possible to manage and analyse texts that are accompanied by multiple, potentially conflicting, grammatical and structural annotation layers, and is able to handle resources that are distributed across different, and possibly geographically distant, storage systems. The majority of texts in DeReKe are not licensed for free redistribution, hence, the COSMAS and KorAP systems offer technical solutions to facilitate research on very large corpora that are not available (and not suitable) for download. For the new KorAP system, it is also planned to provide sandboxed environments to support non-remote-API access “near the data” through which users can run their own analysis programs.

     

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Englisch
    Medientyp: Aufsatz aus einem Sammelband
    Format: Online
    DDC Klassifikation: Germanische Sprachen; Deutsch (430)
    Schlagworte: Deutsch; Korpus; Textkorpus
    Lizenz:

    creativecommons.org/licenses/by-nc/4.0/ ; info:eu-repo/semantics/openAccess

  17. Proceedings of the LREC 2014 workshop challenges in the management of large corpora (CMLC2)
  18. KorAP: the new corpus analysis platform at IDS Mannheim
    Erschienen: 2014
    Verlag:  Poznań : Uniwersytet im. Adama Mickiewicza w Poznaniu

    The KorAP project (“Korpusanalyseplattform der nächste Generation”, “Corpus-analysis platform of the next generation”), carried out at the Institut fUr Deutsche Sprache (IDS) in Mannheim, Germany, has as its goal the development of a modem,... mehr

     

    The KorAP project (“Korpusanalyseplattform der nächste Generation”, “Corpus-analysis platform of the next generation”), carried out at the Institut fUr Deutsche Sprache (IDS) in Mannheim, Germany, has as its goal the development of a modem, state-of-the-art corpus-analysis platform, capable of handling very large corpora and opening the perspectives for innovative linguistic research. The platform will facilitate new linguistic findings by making it possible to manage and analyse extremely large amounts of primary data and annotations, while at the same time allowing an undistorted view of the primary un-annotated text, and thus fully satisfying expectations associated with a scientific tool. The project started in July 2011 and is funded till June 2014. The demo presentation in December will be the first version following a preliminary feature freeze, and will open the alpha testing phase of the project.

     

    Export in Literaturverwaltung
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Englisch
    Medientyp: Konferenzveröffentlichung
    Format: Online
    DDC Klassifikation: Germanische Sprachen; Deutsch (430)
    Schlagworte: Korpus
    Lizenz:

    rightsstatements.org/page/InC/1.0/ ; info:eu-repo/semantics/openAccess

  19. Proceedings of the 3rd Workshop on Challenges in the Management of Large Corpora (CMLC-3)
    Erschienen: 2015
    Verlag:  Mannheim : Institut für Deutsche Sprache

    Contents: 1. Michal Křen: Recent Developments in the Czech National Corpus, S. 1 2. Dan Tufiş, Verginica Barbu Mititelu, Elena Irimia, Stefan Dumitrescu, Tiberiu Boros, Horia Nicolai Teodorescu: CoRoLa Starts Blooming – An update on the Reference... mehr

     

    Contents: 1. Michal Křen: Recent Developments in the Czech National Corpus, S. 1 2. Dan Tufiş, Verginica Barbu Mititelu, Elena Irimia, Stefan Dumitrescu, Tiberiu Boros, Horia Nicolai Teodorescu: CoRoLa Starts Blooming – An update on the Reference Corpus of Contemporary Romanian Language, S. 5 3. Sebastian Buschjäger, Lukas Pfahler, Katharina Morik: Discovering Subtle Word Relations in Large German Corpora, S. 11 4. Johannes Graën, Simon Clematide: Challenges in the Alignment, Management and Exploitation of Large and Richly Annotated Multi-Parallel Corpora, S. 15 5. Stefan Evert, Andrew Hardie: Ziggurat: A new data model and indexing format for large annotated text corpora, S. 21 6. Roland Schäfer: Processing and querying large web corpora with the COW14 architecture, S. 28 7. Jochen Tiepmar: Release of the MySQL-based implementation of the CTS protocol, S. 35

     

    Export in Literaturverwaltung
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Englisch
    Medientyp: Konferenzveröffentlichung
    Format: Online
    DDC Klassifikation: Linguistik (410)
    Schlagworte: Korpus; Datenbanksystem; Annotation; Computerlinguistik; Konferenz
    Lizenz:

    creativecommons.org/licenses/by-nc-nd/3.0/de/deed.de ; info:eu-repo/semantics/openAccess

  20. Recent Initiatives towards New Standards for Language Resources
    Erschienen: 2015
    Verlag:  Gesellschaft für Sprachtechnologie and Computerlinguistik e.V.

  21. Robust corpus architecture: a new look at virtual collections and data access

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Englisch
    Medientyp: Aufsatz aus einem Sammelband
    Format: Online
    DDC Klassifikation: Linguistik (410)
    Schlagworte: Korpus
    Lizenz:

    rightsstatements.org/page/InC/1.0/ ; info:eu-repo/semantics/openAccess

  22. The New IDS Corpus Analysis Platform: Challenges and Prospects
    Erschienen: 2015
    Verlag:  Paris : European Language Resources Association (ELRA)

    The present article describes the first stage of the KorAP project, launched recently at the Institut für Deutsche Sprache (IDS) in Mannheim, Germany. The aim of this project is to develop an innovative corpus analysis platform to tackle the... mehr

     

    The present article describes the first stage of the KorAP project, launched recently at the Institut für Deutsche Sprache (IDS) in Mannheim, Germany. The aim of this project is to develop an innovative corpus analysis platform to tackle the increasing demands of modern linguistic research. The platform will facilitate new linguistic findings by making it possible to manage and analyse primary data and annotations in the petabyte range, while at the same time allowing an undistorted view of the primary linguistic data, and thus fully satisfying the demands of a scientific tool. An additional important aim of the project is to make corpus data as openly accessible as possible in light of unavoidable legal restrictions, for instance through support for distributed virtual corpora, user-defined annotations and adaptable user interfaces, as well as interfaces and sandboxes for user-supplied analysis applications. We discuss our motivation for undertaking this endeavour and the challenges that face it. Next, we outline our software implementation plan and describe development to-date.

     

    Export in Literaturverwaltung
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Englisch
    Medientyp: Konferenzveröffentlichung
    Format: Online
    DDC Klassifikation: Linguistik (410)
    Schlagworte: Korpus
    Lizenz:

    rightsstatements.org/page/InC/1.0/ ; info:eu-repo/semantics/openAccess

  23. KorAP architecture – diving in the deep sea of corpus data
    Erschienen: 2016
    Verlag:  Paris : European Language Resources Association (ELRA)

    KorAP is a corpus search and analysis platform, developed at the Institute for the German Language (IDS). It supports very large corpora with multiple annotation layers, multiple query languages, and complex licensing scenarios. KorAP’s design aims... mehr

     

    KorAP is a corpus search and analysis platform, developed at the Institute for the German Language (IDS). It supports very large corpora with multiple annotation layers, multiple query languages, and complex licensing scenarios. KorAP’s design aims to be scalable, flexible, and sustainable to serve the German Reference Corpus DEREKO for at least the next decade. To meet these requirements, we have adopted a highly modular microservice-based architecture. This paper outlines our approach: An architecture consisting of small components that are easy to extend, replace, and maintain. The components include a search backend, a user and corpus license management system, and a web-based user frontend. We also describe a general corpus query protocol used by all microservices for internal communications. KorAP is open source, licensed under BSD-2, and available on GitHub.

     

    Export in Literaturverwaltung
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Englisch
    Medientyp: Konferenzveröffentlichung
    Format: Online
    DDC Klassifikation: Germanische Sprachen; Deutsch (430)
    Schlagworte: Korpus
    Lizenz:

    creativecommons.org/licenses/by-nc/4.0/ ; info:eu-repo/semantics/openAccess

  24. Corpus Query Lingua Franca (CQLF)
    Erschienen: 2016
    Verlag:  Paris : European Language Resources Association (ELRA)

    The present paper describes Corpus Query Lingua Franca (ISO CQLF), a specification designed at ISO Technical Committee 37 Subcommittee 4 “Language resource management” for the purpose of facilitating the comparison of properties of corpus query... mehr

     

    The present paper describes Corpus Query Lingua Franca (ISO CQLF), a specification designed at ISO Technical Committee 37 Subcommittee 4 “Language resource management” for the purpose of facilitating the comparison of properties of corpus query languages. We overview the motivation for this endeavour and present its aims and its general architecture. CQLF is intended as a multi-part specification; here, we concentrate on the basic metamodel that provides a frame that the other parts fit in.

     

    Export in Literaturverwaltung
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Englisch
    Medientyp: Konferenzveröffentlichung
    Format: Online
    DDC Klassifikation: Linguistik (410)
    Schlagworte: Korpus; Abfragesprache
    Lizenz:

    creativecommons.org/licenses/by-nc/4.0/ ; info:eu-repo/semantics/openAccess

  25. 4th Workshop on Challenges in the Management of Large Corpora. (May 28th 2016, Portorož; part of the LREC-2016 workshop structure) / LREC 2016, CMLC-4.