Ergebnisse für *

Es wurden 10 Ergebnisse gefunden.

Zeige Ergebnisse 1 bis 10 von 10.

Sortieren

  1. Datenübernahmerichtlinien des Leibniz-Instituts für Deutsche Sprache
    Autor*in: Arnold, Denis
    Erschienen: 2019
    Verlag:  Institut für Deutsche Sprache, Bibliothek, Mannheim

    Export in Literaturverwaltung
    Quelle: DNB Sachgruppe Deutsche Sprache und Literatur
    Beteiligt: Fankhauser, Peter (Verfasser); Fisseni, Bernhard (Verfasser); Kupietz, Marc (Verfasser); Lüngen, Harald (Verfasser); Schmidt, Thomas (Verfasser); Witt, Andreas (Verfasser)
    Sprache: Deutsch
    Medientyp: Unbestimmt
    Format: Online
    Weitere Identifier:
    Schlagworte: Korpus <Linguistik>; Deutsch; Daten; Datenschutz; Forschungsdaten; Korpus <Linguistik>
    Weitere Schlagworte: Datenschutzrichtlinie
    Umfang: Online-Ressource
  2. Das Gesamtkonzept des Deutschen Referenzkorpus DeReKo. Vom Design bis zur Verwendung und darüber hinaus
    Autor*in: Kupietz, Marc
    Erschienen: 2023
    Verlag:  de Gruyter, Berlin/Boston ; Leibniz-Institut für Deutsche Sprache (IDS) [Zweitveröffentlichung], Mannheim

    Export in Literaturverwaltung
    Quelle: DNB Sachgruppe Deutsche Sprache und Literatur
    Beteiligt: Lüngen, Harald (Verfasser); Diewald, Nils (Verfasser); Deppermann, Arnulf (Herausgeber); Fandrych, Christian (Herausgeber); Kupietz, Marc (Herausgeber); Schmidt, Thomas (Herausgeber)
    Sprache: Deutsch
    Medientyp: Unbestimmt
    Format: Online
    Weitere Identifier:
    Schlagworte: Korpus <Linguistik>; Deutsch; Kontrastive Linguistik; Korpus <Linguistik>; Empirische Linguistik; Germanistik; Datenaufbereitung; Sprachdaten; Heuristik; Forschungsdaten; Kontrastive Linguistik
    Weitere Schlagworte: Deutsches Referenzkorpus (DeReKo); Korpusdesign; Korpusaufbereitung
    Umfang: Online-Ressource
    Bemerkung(en):

    In: Korpora in der germanistischen Sprachwissenschaft. Mündlich, schriftlich, multimedial. - Berlin/Boston : de Gruyter, 2023, S. 1-28.-(Jahrbuch / Leibniz-Institut für Deutsche Sprache (IDS) ; 2022). - ISBN 978-3-11-108570-8

  3. Multimodale und agile Korpora. Perspektiven für Digital Herrnhut (N-ARC1)
    Erschienen: 2023
    Verlag:  de Gruyter, Berlin/Boston ; Leibniz-Institut für Deutsche Sprache (IDS) [Zweitveröffentlichung], Mannheim

    Export in Literaturverwaltung
    Quelle: DNB Sachgruppe Deutsche Sprache und Literatur
    Beteiligt: Deppermann, Arnulf (Herausgeber); Fandrych, Christian (Herausgeber); Kupietz, Marc (Herausgeber); Schmidt, Thomas (Herausgeber)
    Sprache: Deutsch
    Medientyp: Unbestimmt
    Format: Online
    Weitere Identifier:
    Schlagworte: Brüdergemeine; Korpus <Linguistik>; Korpus <Linguistik>; Multimodalität; Forschungsdaten; Brüdergemeine; Wissensbasis
    Weitere Schlagworte: Multimodale Korpora; Digital Herrnhut; Referenzkorpus; Nex-Gen Agile Reference Corpus (NARC); Datenerschließung; Datenstrukturierung; Datenerweiterung; Datenvernetzung
    Umfang: Online-Ressource
    Bemerkung(en):

    In: Korpora in der germanistischen Sprachwissenschaft. Mündlich, schriftlich, multimedial. - Berlin/Boston : de Gruyter, 2023, S. 225-249.-(Jahrbuch / Leibniz-Institut für Deutsche Sprache (IDS) ; 2022). - ISBN 978-3-11-108570-8

  4. Datenübernahmerichtlinien des Leibniz-Instituts für Deutsche Sprache
    Erschienen: 2019
    Verlag:  Mannheim : Leibniz-Institut für Deutsche Sprache (IDS)

    Export in Literaturverwaltung
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Deutsch
    Medientyp: Unbestimmt
    Format: Online
    DDC Klassifikation: Sprache (400)
    Schlagworte: Datenschutz; Forschungsdaten; Korpus
    Lizenz:

    creativecommons.org/licenses/by-sa/4.0/deed.de ; info:eu-repo/semantics/openAccess

  5. Proceedings of the LREC 2020 Workshop, Language Resources and Evaluation Conference, 11–16 May 2020, 8th Workshop on Challenges in the Management of Large Corpora (CMLC-8)
    Erschienen: 2020
    Verlag:  Paris : European Language Resources Association (ELRA)

    In order to satisfy the information needs of a wide range of researchers across a number of disciplines, large textual datasets require careful design, collection, cleaning, encoding, annotation, storage, retrieval, and curation. This daunting set of... mehr

     

    In order to satisfy the information needs of a wide range of researchers across a number of disciplines, large textual datasets require careful design, collection, cleaning, encoding, annotation, storage, retrieval, and curation. This daunting set of tasks has coalesced into a number of key themes and questions that are of interest to the contributing research communities: (a) what sampling techniques can we apply? (b) what quality issues should we be aware of? (c) what infrastructures and frameworks are being developed for the efficient storage, annotation, analysis and retrieval of large datasets? (d) what affordances do visualisation techniques offer for the exploratory analysis approaches of corpora? (e) what legal paths can be followed in dealing with IPR and data protection issues governing both the data sources and the query results? (f) how to guarantee that corpus data remain available and usable in a sustainable way?

     

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Englisch
    Medientyp: Buch (Monographie)
    Format: Online
    DDC Klassifikation: Sprache (400)
    Schlagworte: Korpus; Computerlinguistik; Forschungsdaten; Datenmanagement
    Lizenz:

    creativecommons.org/licenses/by-nc/4.0/ ; info:eu-repo/semantics/openAccess

  6. RKorAPClient: An R Package for Accessing the German Reference Corpus DeReKo via KorAP
    Erschienen: 2020
    Verlag:  Paris : European Language Resources Association

    Making corpora accessible and usable for linguistic research is a huge challenge in view of (too) big data, legal issues and a rapidly evolving methodology. This does not only affect the design of user-friendly graphical interfaces to corpus analysis... mehr

     

    Making corpora accessible and usable for linguistic research is a huge challenge in view of (too) big data, legal issues and a rapidly evolving methodology. This does not only affect the design of user-friendly graphical interfaces to corpus analysis tools, but also the availability of programming interfaces supporting access to the functionality of these tools from various analysis and development environments. RKorAPClient is a new research tool in the form of an R package that interacts with the Web API of the corpus analysis platform KorAP, which provides access to large annotated corpora, including the German reference corpus DeReKo with 45 billion tokens. In addition to optionally authenticated KorAP API access, RKorAPClient provides further processing and visualization features to simplify common corpus analysis tasks. This paper introduces the basic functionality of RKorAPClient and exemplifies various analysis tasks based on DeReKo, that are bundled within the R package and can serve as a basic framework for advanced analysis and visualization approaches.

     

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Englisch
    Medientyp: Aufsatz aus einem Sammelband
    Format: Online
    DDC Klassifikation: Sprache (400)
    Schlagworte: Korpus; Visualisierung; Forschungsdaten; R; Web Services
    Lizenz:

    creativecommons.org/licenses/by-nc/4.0/ ; info:eu-repo/semantics/openAccess

  7. Das Gesamtkonzept des Deutschen Referenzkorpus DeReKo. Vom Design bis zur Verwendung und darüber hinaus
    Erschienen: 2023
    Verlag:  Berlin/Boston : de Gruyter ; Mannheim : Leibniz-Institut für Deutsche Sprache (IDS) [Zweitveröffentlichung]

    Das Deutsche Referenzkorpus DeReKo dient als eine empirische Grundlage für die germanistische Linguistik. In diesem Beitrag geben wir einen Überblick über Grundlagen und Neuigkeiten zu DeReKo und seine Verwendungsmöglichkeiten sowie einen Einblick in... mehr

     

    Das Deutsche Referenzkorpus DeReKo dient als eine empirische Grundlage für die germanistische Linguistik. In diesem Beitrag geben wir einen Überblick über Grundlagen und Neuigkeiten zu DeReKo und seine Verwendungsmöglichkeiten sowie einen Einblick in seine strategische Gesamtkonzeption, die zum Ziel hat, DeReKo trotz begrenzter Ressourcen für einerseits möglichst viele und andererseits auch für innovative und anspruchsvolle Anwendungen nutzbar zu machen. Insbesondere erläutern wir dabei Strategien zur Aufbereitung sehr großer Korpora mit notwendigerweise heuristischen Verfahren und Herausforderungen, die sich auf dem Weg zur linguistischen Erschließung solcher Korpora stellen.

     

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Deutsch
    Medientyp: Aufsatz aus einem Sammelband
    Format: Online
    DDC Klassifikation: Germanische Sprachen; Deutsch (430)
    Schlagworte: Korpus; Empirische Linguistik; Germanistik; Datenaufbereitung; Sprachdaten; Heuristik; Forschungsdaten; Kontrastive Linguistik
    Lizenz:

    rightsstatements.org/page/InC/1.0/ ; info:eu-repo/semantics/openAccess

  8. Proceedings of the Workshop on Challenges in the Management of Large Corpora (CMLC-9) 2021. Limerick, 12 July 2021 (Online-Event)
    Erschienen: 2021
    Verlag:  Mannheim : Leibniz-Institut für Deutsche Sprache

    Contents: 1. Julien Abadji, Pedro Javier Ortiz Suárez, Laurent Romary and Benoît Sagot: "Ungoliant: An Optimized Pipeline for the Generation of a Very Large-Scale Multilingual Web Corpus", S.1-9. 2. Markus Gärtner, Felicitas Kleinkopf, Melanie... mehr

     

    Contents: 1. Julien Abadji, Pedro Javier Ortiz Suárez, Laurent Romary and Benoît Sagot: "Ungoliant: An Optimized Pipeline for the Generation of a Very Large-Scale Multilingual Web Corpus", S.1-9. 2. Markus Gärtner, Felicitas Kleinkopf, Melanie Andresen and Sibylle Hermann: "Corpus Reusability and Copyright - Challenges and Opportunities", S.10-19. 3. Nils Diewald, Eliza Margaretha and Marc Kupietz: "Lessons learned in Quality Management for Online Research Software Tools in Linguistics", S.20-26.

     

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Englisch
    Medientyp: Buch (Monographie)
    Format: Online
    DDC Klassifikation: Sprache (400)
    Schlagworte: Korpus; Datenmanagement; Computerlinguistik; Urheberrecht; Forschungsdaten
    Lizenz:

    creativecommons.org/licenses/by/4.0/deed.de ; info:eu-repo/semantics/openAccess

  9. Legal issues related to the use of twitter data in language research
    Erschienen: 2021
    Verlag:  Utrecht : CLARIN ; Mannheim : Leibniz-Institut für Deutsche Sprache (IDS)

    Twitter data is used in a wide variety of research disciplines in Social Sciences and Humanities. Although most Twitter data is publicly available, its re-use and sharing raise many legal questions related to intellectual property and personal data... mehr

     

    Twitter data is used in a wide variety of research disciplines in Social Sciences and Humanities. Although most Twitter data is publicly available, its re-use and sharing raise many legal questions related to intellectual property and personal data protection. Moreover, the use of Twitter and its content is subject to the Terms of Service, which also regulate re-use and sharing. This extended abstract provides a brief analysis of these issues and introduces the new Academic Research product track, which enables authorized researchers to access Twitter API on a preferential basis.

     

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Englisch
    Medientyp: Aufsatz aus einem Sammelband
    Format: Online
    DDC Klassifikation: Recht (340); Sprache (400)
    Schlagworte: Recht; Twitter <Softwareplattform>; Forschungsdaten; Social Media; Sozialwissenschaften; Digital Humanities; Geistiges Eigentum; Datenschutz
    Lizenz:

    creativecommons.org/licenses/by/4.0/ ; info:eu-repo/semantics/openAccess

  10. Recent developments in the European Reference Corpus EuReCo
    Erschienen: 2023
    Verlag:  Louvain-la-Neuve : Presses universitaires de Louvain ; Mannheim : Leibniz-Institut für Deutsche Sprache (IDS)

    This paper reports on recent developments within the European Reference Corpus EuReCo, an open initiative that aims at providing and using virtual and dynamically definable comparable corpora based on existing national, reference or other large... mehr

     

    This paper reports on recent developments within the European Reference Corpus EuReCo, an open initiative that aims at providing and using virtual and dynamically definable comparable corpora based on existing national, reference or other large corpora. Given the well-known shortcomings of other types of multilingual corpora such as parallel/translation corpora (shining-through effects, over-normalization, simplification, etc.) or web-based comparable corpora (covering only web material), EuReCo provides a unique linguistic resource offering new perspectives for fine-grained contrastive research on authentic cross-linguistic data, applications in translation studies and foreign language teaching and learning.

     

    Export in Literaturverwaltung
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Englisch
    Medientyp: Konferenzveröffentlichung
    Format: Online
    DDC Klassifikation: Sprache (400)
    Schlagworte: Korpus; Forschungsdaten; Sprachdaten; Kontrastive Linguistik; Übersetzungswissenschaft; Fremdsprachenunterricht; Fremdsprachenlernen
    Lizenz:

    rightsstatements.org/page/InC/1.0/ ; info:eu-repo/semantics/openAccess