Ergebnisse für *

Es wurden 22 Ergebnisse gefunden.

Zeige Ergebnisse 1 bis 22 von 22.

Sortieren

  1. Gesprochenes und geschriebenes Deutsch : vergleichende Untersuchungen von Bundestagsreden und deren schriftlich aufgezeichneter Version
    Autor*in: Henne, Helmut
    Erschienen: 2014
    Verlag:  Institut für Deutsche Sprache, Bibliothek, Mannheim

    Export in Literaturverwaltung
    Quelle: DNB Sachgruppe Deutsche Sprache und Literatur
    Sprache: Deutsch
    Medientyp: Unbestimmt
    Format: Online
    Weitere Identifier:
    Schriftenreihe: Sprache der Gegenwart ; 47
    Schlagworte: Deutsch; Textkorpus
    Weitere Schlagworte: gesprochenes Deutsch; geschriebenes Deutsch
    Umfang: Online-Ressource
  2. Helen Christen. 2006. Comutter, Papi und Lebensabschnittsgefährte. Untersuchungen zum Sprachgebrauch im Kontext heutiger Formen des Zusammenlebens (Germanistische Linguistik Monographien 20). Mit einem Beitrag von Ingrid Hove. Hildesheim, Zürich, New York: Georg Olms Verlag. xii, 330 S
    Erschienen: 2010
    Verlag:  Institut für Deutsche Sprache, Bibliothek, Mannheim

    Export in Literaturverwaltung
    Quelle: DNB Sachgruppe Deutsche Sprache und Literatur
    Sprache: Deutsch
    Medientyp: Unbestimmt
    Format: Online
    Weitere Identifier:
    Übergeordneter Titel: In: Zeitschrift für Rezensionen zur germanistischen Sprachwissenschaft. 2, 2010., 1., S. 31-35
    Schlagworte: Wörterbuch; Deutsch; Internet; Textkorpus; Rezension
    Weitere Schlagworte: Verwandtschaftsbezeichnung; Personenbezeichnung
    Umfang: Online-Ressource
  3. Neues von KorAP
    Autor*in: Kupietz, Marc
    Erschienen: 2019
    Verlag:  Leibniz-Institut für Deutsche Sprache (IDS), Mannheim ; de Gruyter, Berlin [u.a.]

    Export in Literaturverwaltung
    Quelle: DNB Sachgruppe Deutsche Sprache und Literatur
    Beteiligt: Diewald, Nils (Verfasser); Margaretha, Eliza (Verfasser); Bodmer Mory, Franck (Verfasser); Krause, Helge (Verfasser); Harders, Peter (Verfasser); Eichinger, Ludwig M. (Herausgeber); Plewnia, Albrecht (Herausgeber)
    Sprache: Deutsch
    Medientyp: Unbestimmt
    Format: Online
    Weitere Identifier:
    Schlagworte: Korpus <Linguistik>; Korafe; Computerlinguistik; Deutsch; Korpus <Linguistik>; Textkorpus; Institut für Deutsche Sprache
    Umfang: Online-Ressource
    Bemerkung(en):

    In: Neues vom heutigen Deutsch. Empirisch - methodisch - theoretisch. - Berlin [u.a.] : de Gruyter, 2019, S. 345-349.-(Jahrbuch / Institut für Deutsche Sprache ; | 2018 |). - ISBN 978-3-11-062259-1

  4. Korpora und Belegsammlungen

    Export in Literaturverwaltung
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Deutsch
    Medientyp: Unbestimmt
    Format: Online
    DDC Klassifikation: Germanische Sprachen; Deutsch (430)
    Schlagworte: Textkorpus
    Lizenz:

    kostenfrei

  5. Eine Dokumentation maschinenlesbarer Textcorpora der deutschen Gegenwartssprache

    Export in Literaturverwaltung
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Deutsch
    Medientyp: Unbestimmt
    Format: Online
    DDC Klassifikation: Germanische Sprachen; Deutsch (430)
    Schlagworte: Textkorpus; maschinenlesbare Textkorpora
    Lizenz:

    kostenfrei

  6. Recent developments in DeReKo
    Autor*in: Kupietz, Marc
    Erschienen: 2014
    Verlag:  Institut für Deutsche Sprache, Bibliothek, Mannheim

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: Verbundkataloge
    Beteiligt: Lüngen, Harald (Verfasser)
    Sprache: Englisch
    Medientyp: Buch (Monographie)
    Format: Online
    Weitere Identifier:
    DDC Klassifikation: Datenverarbeitung; Informatik (004)
    Schlagworte: Deutsch; Korpus <Linguistik>; Textkorpus
    Weitere Schlagworte: Deutsches Referenzkorpus (DeReKo); Institut für Deutsche Sprache <Mannheim>
    Umfang: Online-Ressource
    Bemerkung(en):

    In: Proceedings of the ninth conference on international language resources and evaluation (LREC’14) . - Reykjavik : European Language Resources Association (ELRA), 2014.

  7. DeReKo durchbricht Drei-Milliarden-Grenze
    Autor*in: Kupietz, Marc

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: Verbundkataloge
    Sprache: Deutsch
    Medientyp: Buch (Monographie)
    Format: Online
    Weitere Identifier:
    Übergeordneter Titel:
    In:: Sprachreport; Mannheim : Institut für Deutsche Sprache, [1985]-; Online-Ressource
    Schlagworte: Deutsch; Korpus <Linguistik>; Textkorpus
    Weitere Schlagworte: Deutsches Referenzkorpus (DeReKo); Institut für Deutsche Sprache <Mannheim>
    Umfang: Online-Ressource
  8. DeReKo-Archiv jetzt mit fünf Milliarden Textwörtern

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: Verbundkataloge
    Sprache: Deutsch
    Medientyp: Buch (Monographie)
    Format: Online
    Weitere Identifier:
    Übergeordneter Titel:
    In:: Sprachreport; Mannheim : Institut für Deutsche Sprache, [1985]-; Online-Ressource
    Schlagworte: Deutsch; Korpus <Linguistik>; Textkorpus
    Weitere Schlagworte: Deutsches Referenzkorpus (DeReKo); Institut für Deutsche Sprache <Mannheim>
    Umfang: Online-Ressource
  9. Gesprochenes und geschriebenes Deutsch : vergleichende Untersuchungen von Bundestagsreden und deren schriftlich aufgezeichneter Version
    Autor*in: Henne, Helmut
    Erschienen: 2014
    Verlag:  Institut für Deutsche Sprache, Bibliothek, Mannheim

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: Verbundkataloge
    Sprache: Deutsch
    Medientyp: Buch (Monographie)
    Format: Online
    Weitere Identifier:
    DDC Klassifikation: Germanische Sprachen; Deutsch (430)
    Schriftenreihe: Sprache der Gegenwart ; 47
    Schlagworte: Deutsch; Textkorpus
    Weitere Schlagworte: gesprochenes Deutsch; geschriebenes Deutsch
    Umfang: Online-Ressource
  10. Helen Christen. 2006. Comutter, Papi und Lebensabschnittsgefährte. Untersuchungen zum Sprachgebrauch im Kontext heutiger Formen des Zusammenlebens (Germanistische Linguistik Monographien 20). Mit einem Beitrag von Ingrid Hove. Hildesheim, Zürich, New York: Georg Olms Verlag. xii, 330 S
    Erschienen: 2010
    Verlag:  Institut für Deutsche Sprache, Bibliothek, Mannheim

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: Verbundkataloge
    Sprache: Deutsch
    Medientyp: Buch (Monographie)
    Format: Online
    Weitere Identifier:
    DDC Klassifikation: Germanische Sprachen; Deutsch (430)
    Schlagworte: Wörterbuch; Deutsch; Internet; Textkorpus; Rezension
    Weitere Schlagworte: Verwandtschaftsbezeichnung; Personenbezeichnung
    Umfang: Online-Ressource
    Bemerkung(en):

    In: Zeitschrift für Rezensionen zur germanistischen Sprachwissenschaft. 2, 2010., 1., S. 31-35

  11. The german reference corpus DeReKo : a primordial sample for linguistic research
    Autor*in: Kupietz, Marc
    Erschienen: 2014
    Verlag:  Institut für Deutsche Sprache, Bibliothek, Mannheim

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: Verbundkataloge
    Beteiligt: Belica, Cyril (Verfasser); Keibel, Holger (Verfasser); Witt, Andreas (Verfasser)
    Sprache: Englisch
    Medientyp: Buch (Monographie)
    Format: Online
    Weitere Identifier:
    DDC Klassifikation: Sprache (400)
    Schlagworte: Deutsch; Textkorpus; Korpus <Linguistik>
    Weitere Schlagworte: Deutsches Referenzkorpus (DeReKo); Institut für Deutsche Sprache <Mannheim>
    Umfang: Online-Ressource
    Bemerkung(en):

    In: Proceedings of the 7th International Conference on Language Resources and Evaluation : Workshops & Tutorials May 17-18, May 22-23, Main Conference May 19-21, Valletta . - Paris : ELRA, 2010., S. 1848-1854, ISBN 2-9517408-6-7

  12. Neues von KorAP
  13. Helen Christen. 2006. Comutter, Papi und Lebensabschnittsgefährte. Untersuchungen zum Sprachgebrauch im Kontext heutiger Formen des Zusammenlebens (Germanistische Linguistik Monographien 20). Mit einem Beitrag von Ingrid Hove. Hildesheim, Zürich, New York: Georg Olms Verlag. xii, 330 S
  14. The german reference corpus DeReKo : a primordial sample for linguistic research
    Erschienen: 2014
    Verlag:  Paris : ELRA

    ^This paper describes DeReKo (Deutsches Referenzkorpus), the Archive of General Reference Corpora of Contemporary Written German at the Institut für Deutsche Sprache (IDS) in Mannheim, and the rationale behind its development. We discuss its design,... mehr

     

    ^This paper describes DeReKo (Deutsches Referenzkorpus), the Archive of General Reference Corpora of Contemporary Written German at the Institut für Deutsche Sprache (IDS) in Mannheim, and the rationale behind its development. We discuss its design, its legal background, how to access it, available metadata, linguistic annotation layers, underlying standards, ongoing developments, and aspects of using the archive for empirical linguistic research. The focus of the paper is on the advantages of DEREKO’s design as a primordial sample from which virtual corpora can be drawn for the specific purposes of individual studies. Both concepts, primordial sample and virtual corpus are explained and illustrated in detail. Furthermore, we describe in more detail how DEREKO deals with the fact that all its texts are subject to third parties’ intellectual property rights, and how it deals with the issue of replicability, which is particularly challenging given DEREKO’s dynamic growth and the possibility to construct from it an open number of virtual corpora.

     

    Export in Literaturverwaltung
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Englisch
    Medientyp: Konferenzveröffentlichung
    Format: Online
    DDC Klassifikation: Germanische Sprachen; Deutsch (430)
    Schlagworte: Deutsch; Textkorpus; Korpus
    Lizenz:

    rightsstatements.org/page/InC/1.0/ ; info:eu-repo/semantics/openAccess

  15. Named entity tagging a very large unbalanced corpus: training and evaluating NE classifiers
    Erschienen: 2014
    Verlag:  Reykjavik : European Language Resources Association (ELRA)

    We describe a systematic and application-oriented approach to training and evaluating named entity recognition and classification (NERC) systems, the purpose of which is to identify an optimal system and to train an optimal model for named entity... mehr

     

    We describe a systematic and application-oriented approach to training and evaluating named entity recognition and classification (NERC) systems, the purpose of which is to identify an optimal system and to train an optimal model for named entity tagging DeReKo, a very large general-purpose corpus of contemporary German (Kupietz et al., 2010). DeReKo 's strong dispersion wrt. genre, register and time forces us to base our decision for a specific NERC system on an evaluation performed on a representative sample of DeReKo instead of performance figures that have been reported for the individual NERC systems when evaluated on more uniform and less diverse data. We create and manually annotate such a representative sample as evaluation data for three different NERC systems, for each of which various models are learnt on multiple training data. The proposed sampling method can be viewed as a generally applicable method for sampling evaluation data from an unbalanced target corpus for any sort of natural language processing.

     

    Export in Literaturverwaltung
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Deutsch
    Medientyp: Konferenzveröffentlichung
    Format: Online
    DDC Klassifikation: Germanische Sprachen; Deutsch (430)
    Schlagworte: Deutsches Referenzkorpus (DeReKo); Korpus; Textkorpus; Identitätsverwaltung
    Lizenz:

    rightsstatements.org/page/InC/1.0/ ; info:eu-repo/semantics/openAccess

  16. Maximizing the potential of very large corpora: 50 years of big language data at IDS Mannheim
    Erschienen: 2014
    Verlag:  Reykjavik : ELRA

    Very large corpora have been built and used at the IDS since its foundation in 1964. They have been made available on the Internet since the beginning of the 90’s to currently over 30,000 researchers worldwide. The Institute provides the largest... mehr

     

    Very large corpora have been built and used at the IDS since its foundation in 1964. They have been made available on the Internet since the beginning of the 90’s to currently over 30,000 researchers worldwide. The Institute provides the largest archive of written German (Deutsches Referenzkorpus, DeReKe) which has recently been extended to 24 billion words. DeReKe has been managed and analysed by engines known as COSMAS and afterwards COSMAS II, which is currently being replaced by a new, scalable analysis platform called KorAP. KorAP makes it possible to manage and analyse texts that are accompanied by multiple, potentially conflicting, grammatical and structural annotation layers, and is able to handle resources that are distributed across different, and possibly geographically distant, storage systems. The majority of texts in DeReKe are not licensed for free redistribution, hence, the COSMAS and KorAP systems offer technical solutions to facilitate research on very large corpora that are not available (and not suitable) for download. For the new KorAP system, it is also planned to provide sandboxed environments to support non-remote-API access “near the data” through which users can run their own analysis programs.

     

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Englisch
    Medientyp: Aufsatz aus einem Sammelband
    Format: Online
    DDC Klassifikation: Germanische Sprachen; Deutsch (430)
    Schlagworte: Deutsch; Korpus; Textkorpus
    Lizenz:

    creativecommons.org/licenses/by-nc/4.0/ ; info:eu-repo/semantics/openAccess

  17. Proceedings of the LREC 2014 workshop challenges in the management of large corpora (CMLC2)
  18. Mining corpora of computer-mediated communication: analysis of linguistic features in Wikipedia talk pages using machine learning methods
    Erschienen: 2014
    Verlag:  Hildesheim : Universität Hildesheim

    Machine learning methods offer a great potential to automatically investigate large amounts of data in the humanities. Our contribution to the workshop reports about ongoing work in the BMBF project KobRA (http://www.kobra.tu-dortmund.de) where we... mehr

     

    Machine learning methods offer a great potential to automatically investigate large amounts of data in the humanities. Our contribution to the workshop reports about ongoing work in the BMBF project KobRA (http://www.kobra.tu-dortmund.de) where we apply machine learning methods to the analysis of big corpora in language-focused research of computer-mediated communication (CMC). At the workshop, we will discuss first results from training a Support Vector Machine (SVM) for the classification of selected linguistic features in talk pages of the German Wikipedia corpus in DeReKo provided by the IDS Mannheim. We will investigate different representations of the data to integrate complex syntactic and semantic information for the SVM. The results shall foster both corpus-based research of CMC and the annotation of linguistic features in CMC corpora.

     

    Export in Literaturverwaltung
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Englisch
    Medientyp: Konferenzveröffentlichung
    Format: Online
    DDC Klassifikation: Germanische Sprachen; Deutsch (430)
    Schlagworte: Korpus; Textkorpus; Computerlinguistik
    Lizenz:

    creativecommons.org/licenses/by-sa/3.0/de/deed.de ; info:eu-repo/semantics/openAccess

  19. DeReKo-Archiv jetzt mit fünf Milliarden Textwörtern
    Erschienen: 2015

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Deutsch
    Medientyp: Aufsatz aus einer Zeitschrift
    Format: Online
    DDC Klassifikation: Germanische Sprachen; Deutsch (430)
    Schlagworte: Deutsch; Korpus; Textkorpus
    Lizenz:

    rightsstatements.org/page/InC/1.0/ ; info:eu-repo/semantics/openAccess

  20. Recent developments in DeReKo
    Erschienen: 2014
    Verlag:  Reykjavik : European Language Resources Association (ELRA)

    This paper gives an overview of recent developments in the German Reference Corpus DeReKo in terms of growth, maximising relevant corpus strata, metadata, legal issues, and its current and future research interface. Due to the recent acquisition of... mehr

     

    This paper gives an overview of recent developments in the German Reference Corpus DeReKo in terms of growth, maximising relevant corpus strata, metadata, legal issues, and its current and future research interface. Due to the recent acquisition of new licenses, DeReKo has grown by a factor of four in the first half of 2014, mostly in the area of newspaper text, and presently contains over 24 billion word tokens. Other strata, like fictional texts, web corpora, in particular CMC texts, and spoken but conceptually written texts have also increased significantly. We report on the newly acquired corpora that led to the major increase, on the principles and strategies behind our corpus acquisition activities, and on our solutions for the emerging legal, organisational, and technical challenges.

     

    Export in Literaturverwaltung
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Englisch
    Medientyp: Konferenzveröffentlichung
    Format: Online
    Schlagworte: Deutsch; Korpus; Textkorpus
    Lizenz:

    rightsstatements.org/page/InC/1.0/ ; info:eu-repo/semantics/openAccess

  21. Gesprochenes und geschriebenes Deutsch : vergleichende Untersuchungen von Bundestagsreden und deren schriftlich aufgezeichneter Version
    Autor*in: Henne, Helmut
    Erschienen: 2014
    Verlag:  Düsseldorf : Schwann

    Die vorliegende Arbeit stellt das Problem der Abgrenzung von gesprochener und geschriebener Sprache in den Mittelpunkt ihrer Betrachtung und soll einen Beitrag leisten zu der erst seit einigen Jahren in der germanistischen Forschung aktuellen... mehr

     

    Die vorliegende Arbeit stellt das Problem der Abgrenzung von gesprochener und geschriebener Sprache in den Mittelpunkt ihrer Betrachtung und soll einen Beitrag leisten zu der erst seit einigen Jahren in der germanistischen Forschung aktuellen Diskussion über eine Zweigliederung der deutschen Gegenwartssprache in einen gesprochenen und geschriebenen Bereich.

     

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Deutsch
    Medientyp: Buch (Monographie)
    Format: Online
    DDC Klassifikation: Germanische Sprachen; Deutsch (430)
    Schlagworte: Deutsch; Textkorpus
    Lizenz:

    creativecommons.org/licenses/by-nc-nd/3.0/de/deed.de ; info:eu-repo/semantics/openAccess

  22. DeReKo durchbricht Drei-Milliarden-Grenze
    Autor*in: Kupietz, Marc
    Erschienen: 2014

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Deutsch
    Medientyp: Aufsatz aus einer Zeitschrift
    Format: Online
    DDC Klassifikation: Deutsche Wörterbücher (433)
    Schlagworte: Deutsch; Korpus; Textkorpus
    Lizenz:

    rightsstatements.org/page/InC/1.0/ ; info:eu-repo/semantics/openAccess