Filtern nach
Letzte Suchanfragen

Ergebnisse für *

Es wurden 41 Ergebnisse gefunden.

Zeige Ergebnisse 1 bis 25 von 41.

Sortieren

  1. Lightweight grammatical annotation in the TEI: new perspectives
    Erschienen: 2018
    Verlag:  Institut für Deutsche Sprache, Bibliothek, Mannheim

    Export in Literaturverwaltung
    Quelle: DNB Sachgruppe Deutsche Sprache und Literatur
    Beteiligt: Haaf, Susanne (Verfasser); Mueller, Martin (Verfasser); Calzolari, Nicoletta (Herausgeber); Choukri, Khalid (Herausgeber); Cieri, Christopher (Herausgeber); Declerck, Thierry (Herausgeber); Goggi, Sara (Herausgeber); Hasida, Koiti (Herausgeber); Isahara, Hitoshi (Herausgeber); Maegaard, Bente (Herausgeber); Mariani, Joseph (Herausgeber); Mazo, Hélène (Herausgeber); Moreno, Asuncion (Herausgeber); Odijk, Jan (Herausgeber); Piperidis, Stelios (Herausgeber); Tokunaga, Takenobu (Herausgeber)
    Sprache: Englisch
    Medientyp: Unbestimmt
    Format: Online
    Weitere Identifier:
    Schlagworte: Text Encoding Initiative; Annotation
    Weitere Schlagworte: linguistic annotation; lightweight annotation; TEI; TEI LingSIG
    Umfang: Online-Ressource
    Bemerkung(en):

    In: Proceedings of the eleventh international conference on language resources and evaluation (LREC 2018), 7-12 May 2018, Miyazaki, Japan. - Paris, France : European language resources association (ELRA), 2018., S. 1795-1802, ISBN 979-10-95546-00-9

  2. Legal canvas for a patchwork of multilingual quotations: the case of CoMParS
    Erschienen: 2017
    Verlag:  Institut für Deutsche Sprache, Bibliothek, Mannheim

    Export in Literaturverwaltung
    Quelle: DNB Sachgruppe Deutsche Sprache und Literatur
    Beteiligt: Kamocki, Paweł (Verfasser); Trawiński, Beata (Verfasser)
    Sprache: Englisch
    Medientyp: Unbestimmt
    Format: Online
    Weitere Identifier:
    Schlagworte: Kontrastive Grammatik; Deutsch; Sprachtypologie; Englisch; Französisch; Ungarisch; Polnisch; Korpus <Linguistik>
    Weitere Schlagworte: GDE-V; CoMParS; Eigentumsrecht
    Umfang: Online-Ressource
    Bemerkung(en):

    In: Corpus Linguistics International Conference 2017, University of Birmingham, Tuesday 25–Friday 28 July 2017. - Birmingham : University of Birmingham, 2017., S. 78-81

  3. KorAP architecture – diving in the deep sea of corpus data
    Autor*in: Diewald, Nils
    Erschienen: 2016
    Verlag:  Institut für Deutsche Sprache, Bibliothek, Mannheim

    Export in Literaturverwaltung
    Quelle: DNB Sachgruppe Deutsche Sprache und Literatur
    Beteiligt: Hanl, Michael (Verfasser); Margaretha, Eliza (Verfasser); Bingel, Joachim (Verfasser); Kupietz, Marc (Verfasser); Bański, Piotr (Verfasser); Witt, Andreas (Verfasser); Calzolari, Nicoletta (Herausgeber); Choukri, Khalid (Herausgeber); Declerck, Thierry (Herausgeber); Goggi, Sara (Herausgeber); Grobelnik, Marko (Herausgeber); Maegaard, Bente (Herausgeber); Mariani, Joseph (Herausgeber); Mazo, Helene (Herausgeber); Moreno, Asunción (Herausgeber); Odijk, Jan (Herausgeber); Piperidis, Stelios (Herausgeber)
    Sprache: Englisch
    Medientyp: Unbestimmt
    Format: Online
    Weitere Identifier:
    Schlagworte: Korpus <Linguistik>
    Weitere Schlagworte: Korpusanalyseplattform (KorAP); Institut für Deutsche Sprache <Mannheim>; Textlinguistik; microservices; large corpus data
    Umfang: Online-Ressource
    Bemerkung(en):

    In: Proceedings of the Tenth International Conference on Language Resources and Evaluation (LREC 2016), Portorož, Slovenia. - Paris : European Language Resources Association (ELRA), 2016., S. 3586-3591, ISBN 978-2-9517408-9-1

  4. The Syntax of “Complex Prepositions” in German: An HPSG Approach
    Erschienen: 2017
    Verlag:  Institut für Deutsche Sprache, Bibliothek, Mannheim

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: Verbundkataloge
    Beteiligt: Bański, Piotr (Herausgeber); Przepiórkowski, Adam (Herausgeber)
    Sprache: Englisch
    Medientyp: Buch (Monographie)
    Format: Online
    Weitere Identifier:
    DDC Klassifikation: Germanische Sprachen; Deutsch (430)
    Schlagworte: Head-driven phrase structure grammar; Präposition; Deutsch
    Weitere Schlagworte: HPSG
    Umfang: Online-Ressource
    Bemerkung(en):

    In: Proceedings of the GLiP-5 Conference. Generative Linguistics in Poland: Morphosyntactic Investigations. Warsaw, Poland. 30 November - 1 December 2002. - Warsaw : Instytut Podstaw Informatyki Polskiej Akademii Nauk, 2003., S. 155-166

  5. Intra-connecting an exemplary literary corpus with semantic web technologies for exploratory literary studies
    Erschienen: 2017
    Verlag:  Institut für Deutsche Sprache, Bibliothek, Mannheim

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: Verbundkataloge
    Beteiligt: Bański, Piotr (Herausgeber); Kupietz, Marc (Herausgeber); Lüngen, Harald (Herausgeber); Rayson, Paul (Herausgeber); Biber, Hanno (Herausgeber); Breiteneder, Evelyn (Herausgeber); Clematide, Simon (Herausgeber); Mariani, John (Herausgeber); Stevenson, Mark (Herausgeber); Sick, Theresa (Herausgeber)
    Sprache: Englisch
    Medientyp: Buch (Monographie)
    Format: Online
    Weitere Identifier:
    Schlagworte: Korpus <Linguistik>; Literatur; Österreich; Aichinger, Ilse; Text Encoding Initiative (TEI); Intertextualität; Semantic Web; Digital Humanities
    Weitere Schlagworte: Word associations; Corpus linguistics; Intertextuality; Literary corpus
    Umfang: Online-Ressource
    Bemerkung(en):

    In: Proceedings of the Workshop on Challenges in the Management of Large Corpora and Big Data and Natural Language Processing (CMLC-5+BigNLP) 2017 including the papers from the Web-as-Corpus (WAC-XI) guest section. Birmingham, 24 July 2017. - Mannheim : Institut für Deutsche Sprache, 2017., S. 1-6

  6. Proceedings of the workshop on challenges in the management of large corpora (CMLC-7) 2019
    Cardiff, 22. July 2019
    Erschienen: [2019]; © 2019
    Verlag:  Leibniz-Institut für Deutsche Sprache, Mannheim

    Leibniz-Institut für Deutsche Sprache (IDS), Bibliothek
    keine Fernleihe
    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Hinweise zum Inhalt
    Volltext (Kostenfrei)
    Volltext (Kostenfrei)
    Quelle: Leibniz-Institut für Deutsche Sprache, Bibliothek
    Beteiligt: Barbaresi, Adrien (VerfasserIn); Biber, Hanno (VerfasserIn); Breiteneder, Evelyn (VerfasserIn); Clematide, Simon (VerfasserIn); Kupietz, Marc (VerfasserIn); Lüngen, Harald (VerfasserIn); Iliadi, Caroline (VerfasserIn)
    Sprache: Englisch
    Medientyp: Buch (Monographie)
    Format: Online
    Weitere Identifier:
    Schlagworte: Datenmanagement; Information Retrieval; Natürliche Sprache; Korpus <Linguistik>
    Umfang: 1 Online-Ressource
  7. Modeling and annotating complex data structures
    Erschienen: 2019

    Leibniz-Institut für Deutsche Sprache (IDS), Bibliothek
    keine Fernleihe
    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: Leibniz-Institut für Deutsche Sprache, Bibliothek
    Beteiligt: Witt, Andreas (VerfasserIn)
    Sprache: Englisch
    Medientyp: Aufsatz aus einem Sammelband
    Format: Druck
    Übergeordneter Titel: Enthalten in: The shape of data in the digital humanities; London : Routledge, Taylor & Francis Group, 2019; (2019'), Seite [217]-235; xviii, 341 Seiten

  8. CoMParS: Eine Sammlung von multilingualen Parallelsequenzen des Deutschen und anderer europäischer Sprachen
    Erschienen: [2021]; © 2021

    Staats- und Universitätsbibliothek Bremen
    keine Fernleihe
    Niedersächsische Staats- und Universitätsbibliothek Göttingen
    keine Fernleihe
    Universitätsbibliothek Kiel, Zentralbibliothek
    keine Fernleihe
    Leibniz-Institut für Deutsche Sprache (IDS), Bibliothek
    keine Fernleihe
    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: Leibniz-Institut für Deutsche Sprache, Bibliothek
    Beteiligt: Schlotthauer, Susan (VerfasserIn); Bański, Piotr (VerfasserIn)
    Sprache: Deutsch
    Medientyp: Aufsatz aus einem Sammelband
    Format: Druck
    Übergeordneter Titel: Enthalten in: Jahrestagung des Instituts für Deutsche Sprache (56. : 2020 : Mannheim); Deutsch in Europa; Berlin : de Gruyter, 2021; (2021), Seite 301-309; XVII, 332 Seiten

  9. The Syntax of “Complex Prepositions” in German: An HPSG Approach
    Erschienen: 2017
    Verlag:  Institut für Deutsche Sprache, Bibliothek, Mannheim

    Export in Literaturverwaltung
    Quelle: DNB Sachgruppe Deutsche Sprache und Literatur
    Beteiligt: Bański, Piotr (Herausgeber); Przepiórkowski, Adam (Herausgeber)
    Sprache: Englisch
    Medientyp: Unbestimmt
    Format: Online
    Weitere Identifier:
    Schlagworte: Head-driven phrase structure grammar; Präposition; Deutsch
    Weitere Schlagworte: HPSG
    Umfang: Online-Ressource
    Bemerkung(en):

    In: Proceedings of the GLiP-5 Conference. Generative Linguistics in Poland: Morphosyntactic Investigations. Warsaw, Poland. 30 November - 1 December 2002. - Warsaw : Instytut Podstaw Informatyki Polskiej Akademii Nauk, 2003., S. 155-166

  10. The Syntax of “Complex Prepositions” in German: An HPSG Approach

    Export in Literaturverwaltung
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Englisch
    Medientyp: Unbestimmt
    Format: Online
    DDC Klassifikation: Germanische Sprachen; Deutsch (430)
    Schlagworte: HPSG
    Lizenz:

    kostenfrei

  11. Legal canvas for a patchwork of multilingual quotations: the case of CoMParS
    Erschienen: 2017
    Verlag:  Institut für Deutsche Sprache, Bibliothek, Mannheim

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: Verbundkataloge
    Beteiligt: Kamocki, Paweł (Verfasser); Trawiński, Beata (Verfasser)
    Sprache: Englisch
    Medientyp: Buch (Monographie)
    Format: Online
    Weitere Identifier:
    DDC Klassifikation: Germanische Sprachen; Deutsch (430)
    Schlagworte: Kontrastive Grammatik; Deutsch; Sprachtypologie; Englisch; Französisch; Ungarisch; Polnisch; Korpus <Linguistik>
    Weitere Schlagworte: GDE-V; CoMParS; Eigentumsrecht
    Umfang: Online-Ressource
    Bemerkung(en):

    In: Corpus Linguistics International Conference 2017, University of Birmingham, Tuesday 25–Friday 28 July 2017. - Birmingham : University of Birmingham, 2017., S. 78-81

  12. Deutsch in Europa
    Sprachpolitisch, grammatisch, methodisch
    Autor*in:
    Erschienen: [2021]; ©2021
    Verlag:  De Gruyter, Berlin ; Walter de Gruyter GmbH

    Die deutsche Sprache hat sich innerhalb Europas als Teil einer europäischen Sprachengemeinschaft entwickelt. Von besonderem wissenschaftlichen Interesse ist die Frage, wie sich Sprachen untereinander beeinflussen, verändern und mit welchen... mehr

    Hessisches BibliotheksInformationsSystem HeBIS
    keine Fernleihe
    Hessisches BibliotheksInformationsSystem HeBIS
    keine Fernleihe
    Hessisches BibliotheksInformationsSystem HeBIS
    keine Fernleihe
    Hessisches BibliotheksInformationsSystem HeBIS
    keine Fernleihe

     

    Die deutsche Sprache hat sich innerhalb Europas als Teil einer europäischen Sprachengemeinschaft entwickelt. Von besonderem wissenschaftlichen Interesse ist die Frage, wie sich Sprachen untereinander beeinflussen, verändern und mit welchen methodischen Zugängen und Sprachressourcen das zu untersuchen ist. Der ständige Austausch zwischen diesen Sprachen und die politischen Rahmenbedingungen in der Europäischen Union werfen darüber hinaus konkrete sprach- und bildungspolitische Fragen auf. German has developed as part of a European language community. This volume asks interesting questions about how these languages influence each other and change, and which methodological approaches and linguistic resources can be used to analyse this. The constant interaction between these languages and the political framework of the EU also raise specific questions regarding language and educational policy.

     

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Hinweise zum Inhalt
  13. Deutsch in Europa
    Sprachpolitisch, grammatisch, methodisch
    Autor*in:
    Erschienen: [2021]; ©2021
    Verlag:  De Gruyter, Berlin ; Boston

    Die deutsche Sprache hat sich innerhalb Europas als Teil einer europäischen Sprachengemeinschaft entwickelt. Von besonderem wissenschaftlichen Interesse ist die Frage, wie sich Sprachen untereinander beeinflussen, verändern und mit welchen... mehr

    Zugang:
    Hochschulbibliothek der Fachhochschule Aachen
    Universitätsbibliothek der RWTH Aachen
    Fachhochschule Bielefeld, Hochschulbibliothek
    Hochschule Bochum, Hochschulbibliothek
    Ruhr-Universität Bochum, Universitätsbibliothek
    Universitäts- und Landesbibliothek Bonn
    Fachhochschule Dortmund, Hochschulbibliothek
    Universitätsbibliothek Duisburg-Essen, Campus Essen
    Westfälische Hochschule Gelsenkirchen Bocholt Recklinghausen, Hochschulbibliothek
    Universitätsbibliothek der Fernuniversität
    Katholische Hochschule Nordrhein-Westfalen (katho), Hochschulbibliothek
    Technische Hochschule Köln, Hochschulbibliothek
    Zentralbibliothek der Sportwissenschaften der Deutschen Sporthochschule Köln
    Hochschule Ruhr West, Hochschulbibliothek, Zweigbibliothek Bottrop
    Hochschule Ruhr West, Hochschulbibliothek
    Universitäts- und Landesbibliothek Münster

     

    Die deutsche Sprache hat sich innerhalb Europas als Teil einer europäischen Sprachengemeinschaft entwickelt. Von besonderem wissenschaftlichen Interesse ist die Frage, wie sich Sprachen untereinander beeinflussen, verändern und mit welchen methodischen Zugängen und Sprachressourcen das zu untersuchen ist. Der ständige Austausch zwischen diesen Sprachen und die politischen Rahmenbedingungen in der Europäischen Union werfen darüber hinaus konkrete sprach- und bildungspolitische Fragen auf German has developed as part of a European language community. This volume asks interesting questions about how these languages influence each other and change, and which methodological approaches and linguistic resources can be used to analyse this. The constant interaction between these languages and the political framework of the EU also raise specific questions regarding language and educational policy

     

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Hinweise zum Inhalt
    Quelle: Verbundkataloge
    Beteiligt: Albert, Marina Foschi (Sonstige); Auer, Peter (Sonstige); Barbaresi, Adrien (Sonstige); Bański, Piotr (Sonstige); Beyer, Rahel (Sonstige); Bodmer, Franck (Sonstige); Bopp, Jutta (Sonstige); Czapka, Sophia (Sonstige); Diewald, Nils (Sonstige); Dovalil, Vít (Sonstige); Ebert, Johannes (Sonstige); Falke, Stefan (Sonstige); Fischer, Patricia (Sonstige); Fuhrhop, Nanna (Sonstige); Gagarina, Natalia (Sonstige); Geyken, Alexander (Sonstige); Gunkel, Lutz (Sonstige); Harders, Peter (Sonstige); Hartmann, Jutta M. (Sonstige); Hinrichs, Erhard (Sonstige); Hirschmann, Hagen (Sonstige); Irimia, Elena (Sonstige); Krifka, Manfred (Sonstige); Kupietz, Marc (Sonstige); Káňa, Tomáš (Sonstige)
    Sprache: Deutsch
    Medientyp: Ebook
    Format: Online
    ISBN: 9783110731514
    Weitere Identifier:
    Schriftenreihe: Jahrbuch des Instituts für Deutsche Sprache ; 2020
    Weitere Schlagworte: Deutsch/Sprache; Europa/Sprache; Kontrastive Linguistik; Sprachpolitik; FOREIGN LANGUAGE STUDY / German
    Umfang: 1 online resource (XVIII, 332 p.)
  14. Maximizing the potential of very large corpora: 50 years of big language data at IDS Mannheim
    Erschienen: 2014
    Verlag:  Reykjavik : ELRA

    Very large corpora have been built and used at the IDS since its foundation in 1964. They have been made available on the Internet since the beginning of the 90’s to currently over 30,000 researchers worldwide. The Institute provides the largest... mehr

     

    Very large corpora have been built and used at the IDS since its foundation in 1964. They have been made available on the Internet since the beginning of the 90’s to currently over 30,000 researchers worldwide. The Institute provides the largest archive of written German (Deutsches Referenzkorpus, DeReKe) which has recently been extended to 24 billion words. DeReKe has been managed and analysed by engines known as COSMAS and afterwards COSMAS II, which is currently being replaced by a new, scalable analysis platform called KorAP. KorAP makes it possible to manage and analyse texts that are accompanied by multiple, potentially conflicting, grammatical and structural annotation layers, and is able to handle resources that are distributed across different, and possibly geographically distant, storage systems. The majority of texts in DeReKe are not licensed for free redistribution, hence, the COSMAS and KorAP systems offer technical solutions to facilitate research on very large corpora that are not available (and not suitable) for download. For the new KorAP system, it is also planned to provide sandboxed environments to support non-remote-API access “near the data” through which users can run their own analysis programs.

     

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Englisch
    Medientyp: Aufsatz aus einem Sammelband
    Format: Online
    DDC Klassifikation: Germanische Sprachen; Deutsch (430)
    Schlagworte: Deutsch; Korpus; Textkorpus
    Lizenz:

    creativecommons.org/licenses/by-nc/4.0/ ; info:eu-repo/semantics/openAccess

  15. Proceedings of the LREC 2014 workshop challenges in the management of large corpora (CMLC2)
  16. KorAP: the new corpus analysis platform at IDS Mannheim
    Erschienen: 2014
    Verlag:  Poznań : Uniwersytet im. Adama Mickiewicza w Poznaniu

    The KorAP project (“Korpusanalyseplattform der nächste Generation”, “Corpus-analysis platform of the next generation”), carried out at the Institut fUr Deutsche Sprache (IDS) in Mannheim, Germany, has as its goal the development of a modem,... mehr

     

    The KorAP project (“Korpusanalyseplattform der nächste Generation”, “Corpus-analysis platform of the next generation”), carried out at the Institut fUr Deutsche Sprache (IDS) in Mannheim, Germany, has as its goal the development of a modem, state-of-the-art corpus-analysis platform, capable of handling very large corpora and opening the perspectives for innovative linguistic research. The platform will facilitate new linguistic findings by making it possible to manage and analyse extremely large amounts of primary data and annotations, while at the same time allowing an undistorted view of the primary un-annotated text, and thus fully satisfying expectations associated with a scientific tool. The project started in July 2011 and is funded till June 2014. The demo presentation in December will be the first version following a preliminary feature freeze, and will open the alpha testing phase of the project.

     

    Export in Literaturverwaltung
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Englisch
    Medientyp: Konferenzveröffentlichung
    Format: Online
    DDC Klassifikation: Germanische Sprachen; Deutsch (430)
    Schlagworte: Korpus
    Lizenz:

    rightsstatements.org/page/InC/1.0/ ; info:eu-repo/semantics/openAccess

  17. KorAP architecture – diving in the deep sea of corpus data
    Erschienen: 2016
    Verlag:  Paris : European Language Resources Association (ELRA)

    KorAP is a corpus search and analysis platform, developed at the Institute for the German Language (IDS). It supports very large corpora with multiple annotation layers, multiple query languages, and complex licensing scenarios. KorAP’s design aims... mehr

     

    KorAP is a corpus search and analysis platform, developed at the Institute for the German Language (IDS). It supports very large corpora with multiple annotation layers, multiple query languages, and complex licensing scenarios. KorAP’s design aims to be scalable, flexible, and sustainable to serve the German Reference Corpus DEREKO for at least the next decade. To meet these requirements, we have adopted a highly modular microservice-based architecture. This paper outlines our approach: An architecture consisting of small components that are easy to extend, replace, and maintain. The components include a search backend, a user and corpus license management system, and a web-based user frontend. We also describe a general corpus query protocol used by all microservices for internal communications. KorAP is open source, licensed under BSD-2, and available on GitHub.

     

    Export in Literaturverwaltung
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Englisch
    Medientyp: Konferenzveröffentlichung
    Format: Online
    DDC Klassifikation: Germanische Sprachen; Deutsch (430)
    Schlagworte: Korpus
    Lizenz:

    creativecommons.org/licenses/by-nc/4.0/ ; info:eu-repo/semantics/openAccess

  18. Legal canvas for a patchwork of multilingual quotations: the case of CoMParS
    Erschienen: 2017
    Verlag:  Birmingham : University of Birmingham

    CoMParS is a resource under construction in the context of the long-term project German Grammar in European Comparison (GDE) at the IDS Mannheim. The principal goal of GDE is to create a novel contrastive grammar of German against the background of... mehr

     

    CoMParS is a resource under construction in the context of the long-term project German Grammar in European Comparison (GDE) at the IDS Mannheim. The principal goal of GDE is to create a novel contrastive grammar of German against the background of other European languages. Alongside German, which is the central focus, the core languages for comparison are English, French, Hungarian and Polish, representing different typological classes. Unlike traditional contrastive grammars available for German, which usually cover language pairs and are based on formal grammatical categories, the new GDE grammar is developed in the spirit of functionalist typology. This implies that, instead of formal criteria, cognitively motivated functional domains in terms of Givón (1984) are used as tertia comparationis. The purpose of CoMParS is to document the empirical basis of the theoretical assumptions of GDE-V and to illustrate the otherwise rather abstract content of grammar books by as many as possible naturally occurring and adequately presented multilingual examples, including information on their use in specific contexts and registers. These examples come from existing parallel corpora, and our presentation will focus on the legal aspects and consequences of this choice of language data.

     

    Export in Literaturverwaltung
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Englisch
    Medientyp: Konferenzveröffentlichung
    Format: Online
    DDC Klassifikation: Germanische Sprachen; Deutsch (430)
    Schlagworte: Kontrastive Grammatik; Deutsch; Sprachtypologie; Englisch; Französisch; Ungarisch; Polnisch; Korpus
    Lizenz:

    rightsstatements.org/page/InC/1.0/ ; info:eu-repo/semantics/openAccess

  19. Applying the newly extended European reference corpus EuReCo. Pilot studies of light-verb constructions in German, Romanian, Hungarian and Polish
    Erschienen: 2023
    Verlag:  Mannheim : IDS-Verlag

    It is well known that the distribution of lexical and grammatical patterns is size- and register-sensitive (Biber 1986, and later publications). This fact alone presents a challenge to many corpus-oriented linguistic studies focusing on a single... mehr

     

    It is well known that the distribution of lexical and grammatical patterns is size- and register-sensitive (Biber 1986, and later publications). This fact alone presents a challenge to many corpus-oriented linguistic studies focusing on a single language. When it comes to cross-linguistic studies using corpora, the challenge becomes even greater due to the lack of high-quality multilingual corpora (Kupietz et al. 2020; Kupietz/Trawiński 2022), which are comparable with respect to the size and the register. That was the motivation for the creation of the European Reference Corpus EuReCo, an initiative started in 2013 at the Leibniz Institute for the German Language (IDS) together with several European partners (Kupietz et al. 2020). EuReCo is an emerging federated corpus, with large virtual comparable corpora across various languages and with an infrastructure supporting contrastive research. The core of the infrastructure is KorAP (Diewald et al. 2016), a scalable open-source platform supporting the analysis and visualisation of properties of texts annotated by multiple and potentially conflicting information layers, and supporting several corpus query languages. Until recently, EuReCo consisted of three monolingual subparts: the German Reference Corpus DeReKo (Kupietz et al. 2018), the Reference Corpus of Contemporary Romanian Language (Barbu Mititelu/Tufiş/Irimia 2018), and the Hungarian National Corpus (Váradi 2002). The goal of the present submission is twofold. On the one hand, it reports about the new component of EuReCo: a sample of the National Corpus of Polish (Przepiórkowski et al. 2010). On the other hand, it presents the results of a new pilot study using the newly extended EuReCo. This pilot study investigates selected Polish collocations involving light verbs and their prepositional / nominal complements (Fig. 1) and extends the collocation analyses of German, Romanian and Hungarian (Fig. 2) discussed in Kupietz/Trawiński (2022).

     

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Englisch
    Medientyp: Aufsatz aus einem Sammelband
    Format: Online
    DDC Klassifikation: Sprache (400)
    Schlagworte: Korpus; Kontrastive Linguistik
    Lizenz:

    creativecommons.org/licenses/by-sa/3.0/de/deed.de ; info:eu-repo/semantics/openAccess

  20. Proceedings of the 3rd Workshop on Challenges in the Management of Large Corpora (CMLC-3)
    Erschienen: 2015
    Verlag:  Mannheim : Institut für Deutsche Sprache

    Contents: 1. Michal Křen: Recent Developments in the Czech National Corpus, S. 1 2. Dan Tufiş, Verginica Barbu Mititelu, Elena Irimia, Stefan Dumitrescu, Tiberiu Boros, Horia Nicolai Teodorescu: CoRoLa Starts Blooming – An update on the Reference... mehr

     

    Contents: 1. Michal Křen: Recent Developments in the Czech National Corpus, S. 1 2. Dan Tufiş, Verginica Barbu Mititelu, Elena Irimia, Stefan Dumitrescu, Tiberiu Boros, Horia Nicolai Teodorescu: CoRoLa Starts Blooming – An update on the Reference Corpus of Contemporary Romanian Language, S. 5 3. Sebastian Buschjäger, Lukas Pfahler, Katharina Morik: Discovering Subtle Word Relations in Large German Corpora, S. 11 4. Johannes Graën, Simon Clematide: Challenges in the Alignment, Management and Exploitation of Large and Richly Annotated Multi-Parallel Corpora, S. 15 5. Stefan Evert, Andrew Hardie: Ziggurat: A new data model and indexing format for large annotated text corpora, S. 21 6. Roland Schäfer: Processing and querying large web corpora with the COW14 architecture, S. 28 7. Jochen Tiepmar: Release of the MySQL-based implementation of the CTS protocol, S. 35

     

    Export in Literaturverwaltung
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Englisch
    Medientyp: Konferenzveröffentlichung
    Format: Online
    DDC Klassifikation: Linguistik (410)
    Schlagworte: Korpus; Datenbanksystem; Annotation; Computerlinguistik; Konferenz
    Lizenz:

    creativecommons.org/licenses/by-nc-nd/3.0/de/deed.de ; info:eu-repo/semantics/openAccess

  21. Recent Initiatives towards New Standards for Language Resources
    Erschienen: 2015
    Verlag:  Gesellschaft für Sprachtechnologie and Computerlinguistik e.V.

  22. Robust corpus architecture: a new look at virtual collections and data access

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Englisch
    Medientyp: Aufsatz aus einem Sammelband
    Format: Online
    DDC Klassifikation: Linguistik (410)
    Schlagworte: Korpus
    Lizenz:

    rightsstatements.org/page/InC/1.0/ ; info:eu-repo/semantics/openAccess

  23. The New IDS Corpus Analysis Platform: Challenges and Prospects
    Erschienen: 2015
    Verlag:  Paris : European Language Resources Association (ELRA)

    The present article describes the first stage of the KorAP project, launched recently at the Institut für Deutsche Sprache (IDS) in Mannheim, Germany. The aim of this project is to develop an innovative corpus analysis platform to tackle the... mehr

     

    The present article describes the first stage of the KorAP project, launched recently at the Institut für Deutsche Sprache (IDS) in Mannheim, Germany. The aim of this project is to develop an innovative corpus analysis platform to tackle the increasing demands of modern linguistic research. The platform will facilitate new linguistic findings by making it possible to manage and analyse primary data and annotations in the petabyte range, while at the same time allowing an undistorted view of the primary linguistic data, and thus fully satisfying the demands of a scientific tool. An additional important aim of the project is to make corpus data as openly accessible as possible in light of unavoidable legal restrictions, for instance through support for distributed virtual corpora, user-defined annotations and adaptable user interfaces, as well as interfaces and sandboxes for user-supplied analysis applications. We discuss our motivation for undertaking this endeavour and the challenges that face it. Next, we outline our software implementation plan and describe development to-date.

     

    Export in Literaturverwaltung
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Englisch
    Medientyp: Konferenzveröffentlichung
    Format: Online
    DDC Klassifikation: Linguistik (410)
    Schlagworte: Korpus
    Lizenz:

    rightsstatements.org/page/InC/1.0/ ; info:eu-repo/semantics/openAccess

  24. Bridging standards development and infrastructure usage by means of concept graphs: the liaison of CLARIN and ISO TC37SC4 in practice
    Erschienen: 2018
    Verlag:  Paris, France : European language resources association (ELRA)

    The present submission reports on a pilot project conducted at the Institute for the German Language (IDS), aiming at strengthening the connection between ISO TC37SC4 “Language Resource Management” and the CLARIN infrastructure. In terminology... mehr

     

    The present submission reports on a pilot project conducted at the Institute for the German Language (IDS), aiming at strengthening the connection between ISO TC37SC4 “Language Resource Management” and the CLARIN infrastructure. In terminology management, attempts have recently been made to use graph-theoretical analyses to get a better understanding of the structure of terminology resources. The project described here aims at applying some of these methods to potentially incomplete concept fields produced over years by numerous researchers serving as experts and editors of ISO standards. The main results of the project are twofold. On the one hand, they comprise concept networks dynamically generated from a relational database and browsable by the user. On the other, the project has yielded significant qualitative feedback that will be offered to ISO. We provide the institutional context of this endeavour, its theoretical background, and an overview of data preparation and tools used. Finally, we discuss the results and illustrate some of them.

     

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Englisch
    Medientyp: Aufsatz aus einem Sammelband
    Format: Online
    DDC Klassifikation: Sprache (400)
    Schlagworte: Terminologie; Linguistik; Visualisierung; Standardisierung; Informationsmanagement
    Lizenz:

    creativecommons.org/licenses/by-nc/4.0/ ; info:eu-repo/semantics/openAccess

  25. Proceedings of the LREC 2018 Workshop “Challenges in the Management of Large Corpora (CMLC-6)” 07 May 2018 – Miyazaki, Japan
    Erschienen: 2018
    Verlag:  Paris : European language resources association (ELRA)

    Contents: 1. Christoph Kuras, Thomas Eckart, Uwe Quasthoff and Dirk Goldhahn: Automation, management and improvement of text corpus production, S. 1 2. Thomas Krause, Ulf Leser, Anke Lüdeling and Stephan Druskat: Designing a re-usable and embeddable... mehr

     

    Contents: 1. Christoph Kuras, Thomas Eckart, Uwe Quasthoff and Dirk Goldhahn: Automation, management and improvement of text corpus production, S. 1 2. Thomas Krause, Ulf Leser, Anke Lüdeling and Stephan Druskat: Designing a re-usable and embeddable corpus search library, S. 6 3. Radoslav Rábara, Pavel Rychlý and Ondřej Herman: Distributed corpus search, S. 10 4. Adrien Barbaresi and Antonio Ruiz Tinoco: Using elasticsearch for linguistic analysis of tweets in time and space, S. 14 5. Marc Kupietz, Nils Diewald and Peter Fankhauser: How to Get the Computation Near the Data: Improving data accessibility to, and reusability of analysis functions in corpus query platforms, S. 20 6. Roman Schneider: Example-based querying for specialist corpora, S. 26 7. Paul Rayson: Increasing interoperability for embedding corpus annotation pipelines in Wmatrix and other corpus retrieval tools, S. 33

     

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Englisch
    Medientyp: Buch (Monographie)
    Format: Online
    DDC Klassifikation: Sprache (400)
    Schlagworte: Korpus; Automatische Sprachanalyse; Technologie
    Lizenz:

    creativecommons.org/licenses/by-nc/4.0/ ; info:eu-repo/semantics/openAccess