Filtern nach
Letzte Suchanfragen

Ergebnisse für *

Es wurden 56 Ergebnisse gefunden.

Zeige Ergebnisse 1 bis 25 von 56.

Sortieren

  1. Datenübernahmerichtlinien des Leibniz-Instituts für Deutsche Sprache
    Erschienen: 2019
    Verlag:  Mannheim : Leibniz-Institut für Deutsche Sprache (IDS)

    Export in Literaturverwaltung
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Deutsch
    Medientyp: Unbestimmt
    Format: Online
    DDC Klassifikation: Sprache (400)
    Schlagworte: Datenschutz; Forschungsdaten; Korpus
    Lizenz:

    creativecommons.org/licenses/by-sa/4.0/deed.de ; info:eu-repo/semantics/openAccess

  2. Korpuslinguistik
    Erschienen: 2012
    Verlag:  Fink, Paderborn

    Zugang:
    Verlag (lizenzpflichtig)
    Alice Salomon Hochschule Berlin, Bibliothek
    uneingeschränkte Fernleihe, Kopie und Ausleihe
    Humboldt-Universität zu Berlin, Universitätsbibliothek, Jacob-und-Wilhelm-Grimm-Zentrum
    uneingeschränkte Fernleihe, Kopie und Ausleihe
    Europa-Universität Viadrina, Universitätsbibliothek
    uneingeschränkte Fernleihe, Kopie und Ausleihe
    Universität Potsdam, Universitätsbibliothek
    uneingeschränkte Fernleihe, Kopie und Ausleihe
    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Hinweise zum Inhalt
    Quelle: Verbundkataloge
    Beteiligt: Keibel, Holger (Verfasser); Kupietz, Marc (Verfasser)
    Sprache: Deutsch
    Medientyp: Ebook
    Format: Online
    ISBN: 9783825234331; 9783838534336
    RVK Klassifikation: ET 760 ; ES 900
    DDC Klassifikation: Sprache (400)
    Schriftenreihe: UTB ; 3433 : Sprachwissenschaft
    LIBAC : Linguistik für Bachelor
    Schlagworte: Korpus <Linguistik>; Deutsch
    Umfang: 1 Online-Ressource (144 S.), graph. Darst.
    Bemerkung(en):

    Literaturverz. S. [139] - 142

  3. Korpuslinguistik
    Erschienen: 2012
    Verlag:  Fink, Paderborn

    Freie Universität Berlin, Universitätsbibliothek
    uneingeschränkte Fernleihe, Kopie und Ausleihe
    Humboldt-Universität zu Berlin, Universitätsbibliothek, Jacob-und-Wilhelm-Grimm-Zentrum
    uneingeschränkte Fernleihe, Kopie und Ausleihe
    Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, Haus Unter den Linden
    uneingeschränkte Fernleihe, Kopie und Ausleihe
    TU Berlin, Universitätsbibliothek
    uneingeschränkte Fernleihe, Kopie und Ausleihe
    Verbund der Öffentlichen Bibliotheken Berlins - VÖBB
    uneingeschränkte Fernleihe, Kopie und Ausleihe
    Universität Potsdam, Universitätsbibliothek
    uneingeschränkte Fernleihe, Kopie und Ausleihe
    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: Verbundkataloge
    Beteiligt: Keibel, Holger (Verfasser); Kupietz, Marc (Verfasser)
    Sprache: Deutsch
    Medientyp: Buch (Monographie)
    ISBN: 9783825234331
    RVK Klassifikation: ET 760 ; ES 900
    DDC Klassifikation: Sprache (400)
    Schriftenreihe: UTB ; 3433 : Sprachwissenschaft
    LIBAC : Linguistik für Bachelor
    Schlagworte: Korpus <Linguistik>; Deutsch
    Umfang: 144 S., graph. Darst.
    Bemerkung(en):

    Literaturverz. S. [139] - 142

  4. The german reference corpus DeReKo : a primordial sample for linguistic research
    Autor*in: Kupietz, Marc
    Erschienen: 2014
    Verlag:  Institut für Deutsche Sprache, Bibliothek, Mannheim

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: Verbundkataloge
    Beteiligt: Belica, Cyril (Verfasser); Keibel, Holger (Verfasser); Witt, Andreas (Verfasser)
    Sprache: Englisch
    Medientyp: Buch (Monographie)
    Format: Online
    Weitere Identifier:
    DDC Klassifikation: Sprache (400)
    Schlagworte: Deutsch; Textkorpus; Korpus <Linguistik>
    Weitere Schlagworte: Deutsches Referenzkorpus (DeReKo); Institut für Deutsche Sprache <Mannheim>
    Umfang: Online-Ressource
    Bemerkung(en):

    In: Proceedings of the 7th International Conference on Language Resources and Evaluation : Workshops & Tutorials May 17-18, May 22-23, Main Conference May 19-21, Valletta . - Paris : ELRA, 2010., S. 1848-1854, ISBN 2-9517408-6-7

  5. Deutsch in Europa
    Sprachpolitisch, grammatisch, methodisch
    Autor*in:
    Erschienen: [2021]; ©2021
    Verlag:  De Gruyter, Berlin ; Walter de Gruyter GmbH

    Die deutsche Sprache hat sich innerhalb Europas als Teil einer europäischen Sprachengemeinschaft entwickelt. Von besonderem wissenschaftlichen Interesse ist die Frage, wie sich Sprachen untereinander beeinflussen, verändern und mit welchen... mehr

    Hessisches BibliotheksInformationsSystem HeBIS
    keine Fernleihe
    Hessisches BibliotheksInformationsSystem HeBIS
    keine Fernleihe
    Hessisches BibliotheksInformationsSystem HeBIS
    keine Fernleihe
    Hessisches BibliotheksInformationsSystem HeBIS
    keine Fernleihe

     

    Die deutsche Sprache hat sich innerhalb Europas als Teil einer europäischen Sprachengemeinschaft entwickelt. Von besonderem wissenschaftlichen Interesse ist die Frage, wie sich Sprachen untereinander beeinflussen, verändern und mit welchen methodischen Zugängen und Sprachressourcen das zu untersuchen ist. Der ständige Austausch zwischen diesen Sprachen und die politischen Rahmenbedingungen in der Europäischen Union werfen darüber hinaus konkrete sprach- und bildungspolitische Fragen auf. German has developed as part of a European language community. This volume asks interesting questions about how these languages influence each other and change, and which methodological approaches and linguistic resources can be used to analyse this. The constant interaction between these languages and the political framework of the EU also raise specific questions regarding language and educational policy.

     

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Hinweise zum Inhalt
  6. Korpuslinguistik
    Erschienen: 2012
    Verlag:  W. Fink, Paderborn ; UTB GmbH, Stuttgart

    Das Buch vermittelt Grundlagen und Möglichkeiten der Korpuslinguistik als sprachwissenschaftliche Methode. Dabei werden alle relevanten Aspekte von der Korpusaufbereitung über verschiedene Formen der Recherche bis hin zu innovativen... mehr

    Zugang:
    Hessisches BibliotheksInformationsSystem HeBIS
    keine Fernleihe
    Hessisches BibliotheksInformationsSystem HeBIS
    keine Fernleihe
    Hessisches BibliotheksInformationsSystem HeBIS
    keine Fernleihe
    Hessisches BibliotheksInformationsSystem HeBIS
    keine Fernleihe
    Hessisches BibliotheksInformationsSystem HeBIS
    keine Fernleihe
    Hessisches BibliotheksInformationsSystem HeBIS
    keine Fernleihe
    Hessisches BibliotheksInformationsSystem HeBIS
    keine Fernleihe

     

    Das Buch vermittelt Grundlagen und Möglichkeiten der Korpuslinguistik als sprachwissenschaftliche Methode. Dabei werden alle relevanten Aspekte von der Korpusaufbereitung über verschiedene Formen der Recherche bis hin zu innovativen strukturentdeckenden Ansätzen der Analyse abgedeckt.

     

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: Verbundkataloge
    Beteiligt: Keibel, Holger; Kupietz, Marc
    Sprache: Deutsch
    Medientyp: Ebook
    Format: Online
    ISBN: 9783838534336
    RVK Klassifikation: ES 900 ; ER 765
    DDC Klassifikation: Sprache (400)
    Auflage/Ausgabe: 1. Aufl.
    Schriftenreihe: UTB ; 3433
    Schlagworte: Korpus <Linguistik>; Korpus <Linguistik>
    Umfang: 1 Online-Ressource (144 Seiten), div. Schaubilder u. Graphiken
  7. Korpuslinguistik
    Erschienen: 2012
    Verlag:  Fink, Paderborn

    TU Darmstadt, Universitäts- und Landesbibliothek - Stadtmitte
    /ER 765 P451
    uneingeschränkte Fernleihe, Kopie und Ausleihe
    Hessisches BibliotheksInformationsSystem HeBIS
    keine Fernleihe
    Universitätsbibliothek J. C. Senckenberg, Zentralbibliothek (ZB)
    89.884.14
    uneingeschränkte Fernleihe, Kopie und Ausleihe
    Hochschul- und Landesbibliothek Fulda, Standort Campus, Magazin, Bestand Heinrich-von-Bibra-Platz
    Z 1642 (3433)
    uneingeschränkte Fernleihe, Kopie und Ausleihe
    Universitätsbibliothek Gießen
    000 ES 900 K27
    uneingeschränkte Fernleihe, Kopie und Ausleihe
    Universitätsbibliothek Kassel, Campusbibliothek Holländischer Platz
    Institutionenausleihe 05
    keine Fernleihe
    Universitätsbibliothek Kassel, Standort Holländischer Platz
    25 Spr AF 0067
    uneingeschränkte Fernleihe, Kopie und Ausleihe
    Universitätsbibliothek Kassel, Standort Holländischer Platz
    25 Spr AF 0067
    uneingeschränkte Fernleihe, Kopie und Ausleihe
    Universität Mainz, Zentralbibliothek
    LING B 523
    keine Ausleihe von Bänden, nur Papierkopien werden versandt
    Universität Mainz, Zentralbibliothek
    13B 226
    keine Fernleihe
    Universität Mainz, Zentralbibliothek
    13B 226
    keine Fernleihe
    Universität Marburg, Universitätsbibliothek
    070 8 2012/11297
    uneingeschränkte Fernleihe, Kopie und Ausleihe
    Universität Marburg, Universitätsbibliothek
    001 ER 765 P451
    uneingeschränkte Fernleihe, Kopie und Ausleihe
    Universität Marburg, Universitätsbibliothek
    001 ER 765 P451 +2
    uneingeschränkte Fernleihe, Kopie und Ausleihe
    Universität Marburg, Universitätsbibliothek
    003 ER 765 P451
    keine Ausleihe von Bänden, nur Papierkopien werden versandt
    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Hinweise zum Inhalt
    Quelle: Verbundkataloge
    Beteiligt: Keibel, Holger; Kupietz, Marc
    Sprache: Deutsch
    Medientyp: Buch (Monographie)
    Format: Druck
    ISBN: 9783825234331; 3825234339
    Weitere Identifier:
    9783825234331
    RVK Klassifikation: ER 765 ; ES 900 ; ER 765 ; ES 900
    DDC Klassifikation: Sprache (400)
    Schriftenreihe: LIBAC
    UTB ; 3433 : Sprachwissenschaft
    Schlagworte: Korpus <Linguistik>
    Umfang: 144 S., graph. Darst.
    Bemerkung(en):

    Literaturverz. S. [139] - 142

  8. Korpuslinguistik
    Erschienen: 2012
    Verlag:  Fink, Paderborn

    Ostbayerische Technische Hochschule Amberg-Weiden, Hochschulbibliothek Amberg
    uneingeschränkte Fernleihe, Kopie und Ausleihe
    TH-AB - Technische Hochschule Aschaffenburg, Hochschulbibliothek
    uneingeschränkte Fernleihe, Kopie und Ausleihe
    Hochschule Augsburg, Bibliothek
    uneingeschränkte Fernleihe, Kopie und Ausleihe
    Universitätsbibliothek Augsburg
    uneingeschränkte Fernleihe, Kopie und Ausleihe
    Katholische Stiftungshochschule München, Bibliothek Benediktbeuern
    uneingeschränkte Fernleihe, Kopie und Ausleihe
    Universitätsbibliothek Eichstätt-Ingolstadt
    uneingeschränkte Fernleihe, Kopie und Ausleihe
    Universitätsbibliothek Erlangen-Nürnberg, Hauptbibliothek
    uneingeschränkte Fernleihe, Kopie und Ausleihe
    Hochschule Landshut, Hochschule für Angewandte Wissenschaften, Bibliothek
    uneingeschränkte Fernleihe, Kopie und Ausleihe
    Bayerische Staatsbibliothek
    uneingeschränkte Fernleihe, Kopie und Ausleihe
    Katholische Stiftungshochschule München, Bibliothek München
    keine Fernleihe
    Universitätsbibliothek der LMU München
    uneingeschränkte Fernleihe, Kopie und Ausleihe
    Universität der Bundeswehr München, Universitätsbibliothek
    uneingeschränkte Fernleihe, Kopie und Ausleihe
    Staatliche Bibliothek Neuburg/Donau
    uneingeschränkte Fernleihe, Kopie und Ausleihe
    Evangelische Hochschule Nürnberg, Bibliothek
    uneingeschränkte Fernleihe, Kopie und Ausleihe
    Technische Hochschule Nürnberg Georg Simon Ohm, Bibliothek
    keine Ausleihe von Bänden, nur Papierkopien werden versandt
    Universitätsbibliothek Passau
    uneingeschränkte Fernleihe, Kopie und Ausleihe
    Universitätsbibliothek Regensburg
    uneingeschränkte Fernleihe, Kopie und Ausleihe
    Ostbayerische Technische Hochschule Amberg-Weiden, Hochschulbibliothek, Standort Weiden
    uneingeschränkte Fernleihe, Kopie und Ausleihe
    Universitätsbibliothek Würzburg
    uneingeschränkte Fernleihe, Kopie und Ausleihe
    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Hinweise zum Inhalt
    Quelle: Verbundkataloge
    Beteiligt: Keibel, Holger (Verfasser); Kupietz, Marc (Verfasser)
    Sprache: Deutsch
    Medientyp: Ebook
    Format: Online
    ISBN: 9783825234331; 9783838534336
    RVK Klassifikation: ET 760 ; ES 900
    DDC Klassifikation: Sprache (400)
    Schriftenreihe: UTB ; 3433 : Sprachwissenschaft
    LIBAC : Linguistik für Bachelor
    Schlagworte: Korpus <Linguistik>; Deutsch
    Umfang: 1 Online-Ressource (144 S.), graph. Darst.
    Bemerkung(en):

    Literaturverz. S. [139] - 142

  9. Korpuslinguistik
    Erschienen: 2012
    Verlag:  Fink, Paderborn

    Universitätsbibliothek Augsburg
    uneingeschränkte Fernleihe, Kopie und Ausleihe
    Universitätsbibliothek Bamberg
    uneingeschränkte Fernleihe, Kopie und Ausleihe
    Universitätsbibliothek Eichstätt-Ingolstadt
    uneingeschränkte Fernleihe, Kopie und Ausleihe
    Bayerische Staatsbibliothek
    uneingeschränkte Fernleihe, Kopie und Ausleihe
    Universitätsbibliothek der LMU München
    uneingeschränkte Fernleihe, Kopie und Ausleihe
    Universitätsbibliothek Passau
    uneingeschränkte Fernleihe, Kopie und Ausleihe
    Universitätsbibliothek Regensburg
    uneingeschränkte Fernleihe, Kopie und Ausleihe
    Hochschule für angewandte Wissenschaften Würzburg-Schweinfurt, Bibliotheksleitung und Zentralbibliothek
    uneingeschränkte Fernleihe, Kopie und Ausleihe
    Universitätsbibliothek Würzburg
    uneingeschränkte Fernleihe, Kopie und Ausleihe
    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: Verbundkataloge
    Beteiligt: Keibel, Holger (Verfasser); Kupietz, Marc (Verfasser)
    Sprache: Deutsch
    Medientyp: Buch (Monographie)
    ISBN: 9783825234331
    RVK Klassifikation: ET 760 ; ES 900
    DDC Klassifikation: Sprache (400)
    Schriftenreihe: UTB ; 3433 : Sprachwissenschaft
    LIBAC : Linguistik für Bachelor
    Schlagworte: Korpus <Linguistik>; Deutsch
    Umfang: 144 S., graph. Darst.
    Bemerkung(en):

    Literaturverz. S. [139] - 142

  10. Das Orthografische Kernkorpus (OKK) in DeReKo. Zusammensetzung, Analyse- und Zugriffsmöglichkeiten über KorAP
    Erschienen: 2024
    Verlag:  Berlin/Boston : de Gruyter ; Mannheim : Leibniz-Institut für Deutsche Sprache (IDS) [Zweitveröffentlichung]

    Für die spezifischen Bedürfnisse der Schreibbeobachtung wurde das Orthografische Kernkorpus (OKK) als virtuelles Korpus in DeReKo entwickelt. Mit derzeit rund 14 Mrd. Token deckt es den Schriftsprachgebrauch in den deutschsprachigen Ländern im... mehr

     

    Für die spezifischen Bedürfnisse der Schreibbeobachtung wurde das Orthografische Kernkorpus (OKK) als virtuelles Korpus in DeReKo entwickelt. Mit derzeit rund 14 Mrd. Token deckt es den Schriftsprachgebrauch in den deutschsprachigen Ländern im Zeitraum von 1995 bis in die Gegenwart ab. Der Zugriff über die Korpusanalyseplattform KorAP erlaubt nicht nur die Nutzung verschiedener Annotationen, sondern über die API-Schnittstellen auch die Einbindung in diverse Auswertungsumgebungen wie RStudio über den RKorAPClient und macht es so für zahlreiche Analyse- und Visualisierungsmöglichkeiten zugänglich.

     

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Deutsch
    Medientyp: Aufsatz aus einem Sammelband
    Format: Online
    DDC Klassifikation: Sprache (400)
    Schlagworte: Rechtschreibung; Korpus; Schriftsprache; Sprachgebrauch; Deutsch
    Lizenz:

    rightsstatements.org/page/InC/1.0/ ; info:eu-repo/semantics/openAccess

  11. Korpusanalyseplattform der nächsten Generation
    Erschienen: 2024
    Verlag:  Tübingen : Narr Francke Attempto ; Mannheim : Leibniz-Institut für Deutsche Sprache (IDS) [Zweitveröffentlichung]

    Für den Zugriff auf die IDS-Korpora wurde Anfang der 1990er Jahre am IDS das Korpusrecherche- und -analysesystem COSMAS (Corpus Search, Management and Analysis System) (al-Wadi 1994) entwickelt, welches sich bereits in seiner ersten seit 1991 bis... mehr

     

    Für den Zugriff auf die IDS-Korpora wurde Anfang der 1990er Jahre am IDS das Korpusrecherche- und -analysesystem COSMAS (Corpus Search, Management and Analysis System) (al-Wadi 1994) entwickelt, welches sich bereits in seiner ersten seit 1991 bis 2003 im Betrieb befindlichen Version – COSMAS I – in der Praxis bewährt hatte. Unter den zahlreichen Funktionalitäten waren u.a. ‘virtuelle’ Korpuskomposition, statistische Kookkurrenzanalyse und morphologischer Suchassistent besonders innovativ. 2003 wurde COSMAS I durch die neuere Version COSMAS II (Bodmer 2005) ersetzt, welche vor allem für den Umgang mit Mehrfachannotationen entworfen wurde. Die Datenbasis von COSMAS II speist sich heute aus verschiedenen Quellen: Neben DeReKo sind ebenso historische und einige Projektkorpora mittels COSMAS II für die öffentliche Recherche und Analyse zugänglich gemacht worden. Derzeit hat COSMAS II weltweit ca. 19.000 registrierte Nutzer, die auf die angebotenen Ressourcen zugreifen können. Da COSMAS II jedoch bereits Anfang der 1990er Jahre konzipiert wurde und der Arbeitsaufwand, derartige Software zu erweitern, mit steigender Lebensdauer und Komplexität überproportional steigt, wird es zunehmend schwieriger, die Software an die sich rasch wandelnden Bedarfe anzupassen. Indes haben sich sowohl die technischen als auch die wissenschaftlichen Rahmenbedingungen derart stark verändert, dass es sinnvoll erschien, ein neuartiges Analyse-Tool zu entwickeln, welches neuen Anforderungen und Herausforderungen gerecht wird.

     

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Deutsch
    Medientyp: Aufsatz aus einem Sammelband
    Format: Online
    DDC Klassifikation: Sprache (400)
    Schlagworte: Korpus; Analyse; Projekt; Software; Datenmodell
    Lizenz:

    rightsstatements.org/page/InC/1.0/ ; info:eu-repo/semantics/openAccess

  12. Proceedings of the Workshop on Challenges in the Management of Large Corpora and Big Data and Natural Language Processing (CMLC-5+BigNLP) 2017 including the papers from the Web-as-Corpus (WAC-XI) guest section. Birmingham, 24 July 2017

    Contents: 1. Andreas Dittrich: Intra-connecting a small exemplary literary corpus with semantic web technologies for exploratory literary studies, S. 1 2. John Kirk, Anna Čermáková: From ICE to ICC: The new International Comparable Corpus, S. 7 3.... mehr

     

    Contents: 1. Andreas Dittrich: Intra-connecting a small exemplary literary corpus with semantic web technologies for exploratory literary studies, S. 1 2. John Kirk, Anna Čermáková: From ICE to ICC: The new International Comparable Corpus, S. 7 3. Dawn Knight, Tess Fitzpatrick, Steve Morris, Jeremy Evas, Paul Rayson, Irena Spasic, Mark Stonelake, Enlli Môn Thomas, Steven Neale, Jennifer Needs, Scott Piao, Mair Rees, Gareth Watkins, Laurence Anthony, Thomas Michael Cobb, Margaret Deuchar, Kevin Donnelly, Michael McCarthy, Kevin Scannell: Creating CorCenCC (Corpws Cenedlaethol Cymraeg Cyfoes – The National Corpus of Contemporary Welsh), S. 13 4. Marc Kupietz, Andreas Witt, Piotr Bański, Dan Tufiş, Dan Cristea, Tamás Váradi: EuReCo - Joining Forces for a European Reference Corpus as a sustainable base for cross-linguistic research, S. 15 5. Harald Lüngen, Marc Kupietz: CMC Corpora in DeReKo, S. 20 6. David McClure, Mark Algee-Hewitt, Douris Steele, Erik Fredner, Hannah Walser: Organizing corpora at the Stanford Literary Lab, S. 25 7. Radoslav Rábara, Pavel Rychlý ,Ondřej Herman: Accelerating corpus search using multiple cores, S. 30 8. John Vidler, Stephen Wattam: Keeping Properties with the Data: CL-MetaHeaders – An Open Specification, S. 35 9. Vladimir Benko: Are Web Corpora Inferior? The Case of Czech and Slovak, S. 43 10. Edyta Jurkiewicz-Rohrbacher, Zrinka Kolaković, Björn Hansen: Web Corpora – the best possible solution for tracking phenomena in underresourced languages: clitics in Bosnian, Croatian and Serbian, S. 49 11. Vít Suchomel: Removing Spam from Web Corpora Through Supervised Learning Using FastText, S. 56

     

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Englisch
    Medientyp: Buch (Monographie)
    Format: Online
    DDC Klassifikation: Sprache (400)
    Schlagworte: Korpus; Texttechnologie; Automatische Textanalyse; Datenmanagement
    Lizenz:

    creativecommons.org/licenses/by-nc-nd/3.0/de/deed.de ; info:eu-repo/semantics/openAccess

  13. EuReCo - Joining Forces for a European Reference Corpus as a sustainable base for cross-linguistic research
    Erschienen: 2017
    Verlag:  Mannheim : Institut für Deutsche Sprache

    In this paper we discuss the opportunities, prerequisites, possible applications and implications of a virtually joint corpus based on existing national, reference or other large corpora and their host institutions. mehr

     

    In this paper we discuss the opportunities, prerequisites, possible applications and implications of a virtually joint corpus based on existing national, reference or other large corpora and their host institutions.

     

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Englisch
    Medientyp: Aufsatz aus einem Sammelband
    Format: Online
    DDC Klassifikation: Sprache (400)
    Schlagworte: Korpus; Kontrastive Linguistik; Europa
    Lizenz:

    creativecommons.org/licenses/by-nc-nd/3.0/de/deed.de ; info:eu-repo/semantics/openAccess

  14. CMC Corpora in DeReKo
    Erschienen: 2017
    Verlag:  Mannheim : Institut für Deutsche Sprache

    We introduce three types of corpora of computer-mediated communication that have recently been compiled at the Institute for the German Language or curated from an external project and included in DeReKo, the German Reference Corpus, namely Wikipedia... mehr

     

    We introduce three types of corpora of computer-mediated communication that have recently been compiled at the Institute for the German Language or curated from an external project and included in DeReKo, the German Reference Corpus, namely Wikipedia (discussion) corpora, the Usenet news corpus, and the Dortmund Chat Corpus. The data and corpora have been converted to I5, the TEI customization to represent texts in DeReKo, and are researchable via the web-based IDS corpus research interfaces and in the case of Wikipedia and chat also downloadable from the IDS repository and download server, respectively.

     

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Englisch
    Medientyp: Aufsatz aus einem Sammelband
    Format: Online
    DDC Klassifikation: Sprache (400)
    Schlagworte: Korpus; Deutsch; Internet; Wikipedia; UseNet
    Lizenz:

    creativecommons.org/licenses/by-nc-nd/3.0/de/deed.de ; info:eu-repo/semantics/openAccess

  15. Visualizing Language Change in a Corpus of Contemporary German
    Erschienen: 2017
    Verlag:  Birmingham : University of Birmingham

    Export in Literaturverwaltung
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Englisch
    Medientyp: Konferenzveröffentlichung
    Format: Online
    DDC Klassifikation: Sprache (400)
    Schlagworte: Sprachwandel; Semasiologie; Korpus; Visualisierung
    Lizenz:

    rightsstatements.org/page/InC/1.0/ ; info:eu-repo/semantics/openAccess

  16. Visual Correlation for Detecting Patterns in Language Change
    Erschienen: 2017
    Verlag:  Zürich : Universität Zürich

    Export in Literaturverwaltung
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Englisch
    Medientyp: Konferenzveröffentlichung
    Format: Online
    DDC Klassifikation: Sprache (400)
    Schlagworte: Sprachwandel; Semasiologie; Korpus; Zeitung; Visualisierung
    Lizenz:

    rightsstatements.org/page/InC/1.0/ ; info:eu-repo/semantics/openAccess

  17. Proceedings of the LREC 2018 Workshop “Challenges in the Management of Large Corpora (CMLC-6)” 07 May 2018 – Miyazaki, Japan
    Erschienen: 2018
    Verlag:  Paris : European language resources association (ELRA)

    Contents: 1. Christoph Kuras, Thomas Eckart, Uwe Quasthoff and Dirk Goldhahn: Automation, management and improvement of text corpus production, S. 1 2. Thomas Krause, Ulf Leser, Anke Lüdeling and Stephan Druskat: Designing a re-usable and embeddable... mehr

     

    Contents: 1. Christoph Kuras, Thomas Eckart, Uwe Quasthoff and Dirk Goldhahn: Automation, management and improvement of text corpus production, S. 1 2. Thomas Krause, Ulf Leser, Anke Lüdeling and Stephan Druskat: Designing a re-usable and embeddable corpus search library, S. 6 3. Radoslav Rábara, Pavel Rychlý and Ondřej Herman: Distributed corpus search, S. 10 4. Adrien Barbaresi and Antonio Ruiz Tinoco: Using elasticsearch for linguistic analysis of tweets in time and space, S. 14 5. Marc Kupietz, Nils Diewald and Peter Fankhauser: How to Get the Computation Near the Data: Improving data accessibility to, and reusability of analysis functions in corpus query platforms, S. 20 6. Roman Schneider: Example-based querying for specialist corpora, S. 26 7. Paul Rayson: Increasing interoperability for embedding corpus annotation pipelines in Wmatrix and other corpus retrieval tools, S. 33

     

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Englisch
    Medientyp: Buch (Monographie)
    Format: Online
    DDC Klassifikation: Sprache (400)
    Schlagworte: Korpus; Automatische Sprachanalyse; Technologie
    Lizenz:

    creativecommons.org/licenses/by-nc/4.0/ ; info:eu-repo/semantics/openAccess

  18. How to get the computation near the data: improving data accessibility to, and reusability of analysis functions in corpus query platforms
    Erschienen: 2018
    Verlag:  Paris : European language resources association (ELRA)

    The paper discusses use cases and proposals to increase the flexibility and reusability of components for analysis and further processing of analysis results in corpus query platforms by providing standardized interfaces to access data at multiple... mehr

     

    The paper discusses use cases and proposals to increase the flexibility and reusability of components for analysis and further processing of analysis results in corpus query platforms by providing standardized interfaces to access data at multiple levels.

     

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Englisch
    Medientyp: Aufsatz aus einem Sammelband
    Format: Online
    DDC Klassifikation: Sprache (400)
    Schlagworte: Korpus; Technologie; Interoperabilität
    Lizenz:

    creativecommons.org/licenses/by-nc/4.0/ ; info:eu-repo/semantics/openAccess

  19. Von Schienen, Zügen und linguistischen Fragestellungen
    Erschienen: 2018
    Verlag:  Berlin [u.a.] : de Gruyter

    Das hier vorgeführte Schienenbild ist das in Anlehnung an Wittenburg (2009) als Erweiterungsinstrument gewählte Mittel in dem Versuch, Computertechnologie, linguistische Forschung und Vernetzung am Institut für Deutsche Sprache in deren rasch... mehr

     

    Das hier vorgeführte Schienenbild ist das in Anlehnung an Wittenburg (2009) als Erweiterungsinstrument gewählte Mittel in dem Versuch, Computertechnologie, linguistische Forschung und Vernetzung am Institut für Deutsche Sprache in deren rasch wachsenden Vielschichtigkeit zu beschreiben. Hier werden u. a. drei Blickwinkel, der des Technologie entwickelnden Wissenschaftlers, des entwickelnden Nutzers und des Nutzers von Informationstechnologie in der linguistischen Forschung vereint und um eine für den Sprachvergleich neue Dimension, die sprachspezifische Parameter von Analyseinstrumenten miteinander harmonisiert, erweitert.

     

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Deutsch
    Medientyp: Aufsatz aus einem Sammelband
    Format: Online
    DDC Klassifikation: Sprache (400)
    Schlagworte: Empirie; Korpus; Vernetzung; Linguistik; Methodologie
    Lizenz:

    creativecommons.org/licenses/by/4.0/ ; info:eu-repo/semantics/openAccess

  20. Introducing the International Comparable Corpus

    This presentation introduces a new collaborative project: the International Comparable Corpus (ICC) (https://korpus.cz/icc), to be compiled from European national, standard(ised) languages, using the protocols for text categories and their quantities... mehr

     

    This presentation introduces a new collaborative project: the International Comparable Corpus (ICC) (https://korpus.cz/icc), to be compiled from European national, standard(ised) languages, using the protocols for text categories and their quantities of texts in the International Corpus of English (ICE).

     

    Export in Literaturverwaltung
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Englisch
    Medientyp: Konferenzveröffentlichung
    Format: Online
    DDC Klassifikation: Sprache (400)
    Schlagworte: Korpus; Kontrastive Linguistik; Europa
    Lizenz:

    rightsstatements.org/page/InC/1.0/ ; info:eu-repo/semantics/openAccess

  21. Proceedings of the Workshop on Challenges in the Management of Large Corpora (CMLC-7) 2019. Cardiff, 22 July 2019
    Erschienen: 2019
    Verlag:  Mannheim : Leibniz-Institut für Deutsche Sprache

    Contents: 1. Johannes Graën, Tannon Kew, Anastassia Shaitarova and Martin Volk, "Modelling Large Parallel Corpora", S. 1-8 2. Pedro Javier Ortiz Suárez, Benoît Sagot and Laurent Romary, "Asynchronous Pipelines for Processing Huge Corpora on Medium to... mehr

     

    Contents: 1. Johannes Graën, Tannon Kew, Anastassia Shaitarova and Martin Volk, "Modelling Large Parallel Corpora", S. 1-8 2. Pedro Javier Ortiz Suárez, Benoît Sagot and Laurent Romary, "Asynchronous Pipelines for Processing Huge Corpora on Medium to Low Resource Infrastructures", S. 9-16 3. Vladimír Benko, "Deduplication in Large Web Corpora", S. 17-22 4. Mark Davies, "The best of both worlds: Multi-billion word “dynamic” corpora", S. 23-28 5. Adrien Barbaresi, "On the need for domain-focused web corpora", S. 29-32 6. Marc Kupietz, Eliza Margaretha, Nils Diewald, Harald Lüngen and Peter Fankhauser, "What's New in EuReCo? Interoperability, Comparable Corpora, Licensing", S. 33-39

     

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Englisch
    Medientyp: Buch (Monographie)
    Format: Online
    DDC Klassifikation: Sprache (400)
    Schlagworte: Korpus; Datenmanagement; Information Retrieval; Natürliche Sprache
    Lizenz:

    creativecommons.org/licenses/by/4.0/deed.de ; info:eu-repo/semantics/openAccess

  22. What's New in EuReCo? Interoperability, Comparable Corpora, Licensing
    Erschienen: 2019
    Verlag:  Mannheim : Leibniz-Institut für Deutsche Sprache

    This paper reports on the latest developments of the European Reference Corpus EuReCo and the German Reference Corpus in relation to three of the most important CMLC topics: interoperability, collaboration on corpus infrastructure building, and legal... mehr

     

    This paper reports on the latest developments of the European Reference Corpus EuReCo and the German Reference Corpus in relation to three of the most important CMLC topics: interoperability, collaboration on corpus infrastructure building, and legal issues. Concerning interoperability, we present new ways to access DeReKo via KorAP on the API and on the plugin level. In addition we report about advancements in the EuReCo- and ICC-initiatives with the provision of comparable corpora, and about recent problems with license acquisitions and our solution approaches using an indemnification clause and model licenses that include scientific exploitation.

     

    Export in Literaturverwaltung
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Englisch
    Medientyp: Konferenzveröffentlichung
    Format: Online
    DDC Klassifikation: Sprache (400)
    Schlagworte: Korpus
    Lizenz:

    creativecommons.org/licenses/by/4.0/deed.de ; info:eu-repo/semantics/openAccess

  23. Analyzing domain specific word embeddings for a large corpus of contemporary German. International Corpus Linguistics Conference, Cardiff, Wales, UK, July 22-26, 2019
    Erschienen: 2019
    Verlag:  Mannheim : Leibniz-Institut für Deutsche Sprache (IDS)

    Distributional models of word use constitute an indispensable tool in corpus based lexicological research for discovering paradigmatic relations and syntagmatic patterns (Belica et al. 2010). Recently, word embeddings (Mikolov et al. 2013) have... mehr

     

    Distributional models of word use constitute an indispensable tool in corpus based lexicological research for discovering paradigmatic relations and syntagmatic patterns (Belica et al. 2010). Recently, word embeddings (Mikolov et al. 2013) have revived the field by allowing to construct and analyze distributional models on very large corpora. This is accomplished by reducing the very high dimensionality of word cooccurrence contexts, the size of the vocabulary, to few dimensions, such as 100-200. However, word use and meaning can vary widely along dimensions such as domain, register, and time, and word embeddings tend to represent only the most prevalent meaning. In this paper we thus construct domain specific word embeddings to allow for systematically analyzing variations in word use. Moreover, we also demonstrate how to reconstruct domain specific co-occurrence contexts from the dense word embeddings.

     

    Export in Literaturverwaltung
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Englisch
    Medientyp: Konferenzveröffentlichung
    Format: Online
    DDC Klassifikation: Sprache (400)
    Schlagworte: Korpus; Phrase <Syntagma>; Automatische Sprachanalyse; Deutsch
    Lizenz:

    creativecommons.org/licenses/by/4.0/deed.de ; info:eu-repo/semantics/openAccess

  24. The KorAP user interface. Accessing CoRoLa via KorAP
    Erschienen: 2019
    Verlag:  Bucureşti : Editura Academiei Române

    The user interfaces for corpus analysis platforms must provide a high degree of accessibility for ordinary users and at the same time provide the possibility to answer complex research questions. In this paper, we present the design concepts behind... mehr

     

    The user interfaces for corpus analysis platforms must provide a high degree of accessibility for ordinary users and at the same time provide the possibility to answer complex research questions. In this paper, we present the design concepts behind the user interface of KorAP, a corpus analysis platform that has evolved into the main gateway to CoRoLa, the Reference Corpus of Contemporary Romanian Language. Based on established principles of user interface design, we show how KorAP addresses the challenge of providing a user-friendly interface for heterogeneous corpus data to a wide range of users with different research questions.

     

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Englisch
    Medientyp: Aufsatz aus einer Zeitschrift
    Format: Online
    DDC Klassifikation: Sprache (400)
    Schlagworte: Korpus; Softwareergonomie; Rumänisch; Benutzeroberfläche
    Lizenz:

    rightsstatements.org/page/InC/1.0/ ; info:eu-repo/semantics/openAccess

  25. The DRuKoLA project
    Erschienen: 2019
    Verlag:  Bucureşti : Editura Academiei Române

    DRuKoLA, the accompanying project in the making of the Corpus of Romanian Language, is a cooperation between German and Romanian computer scientists, corpus linguists and linguists, aiming at linking reference corpora of European languages under one... mehr

     

    DRuKoLA, the accompanying project in the making of the Corpus of Romanian Language, is a cooperation between German and Romanian computer scientists, corpus linguists and linguists, aiming at linking reference corpora of European languages under one corpus analysis tool able to manage big data. KorAP, the analysis tool developed at the Leibniz Institute for the German Language (Mannheim), is being tailored for the Romanian language in a first attempt to reunite reference corpora under the EuReCo initiative, detailed in this paper. The paper describes the necessary steps of harmonization within KorAP and the corpus of Romanian language and discusses, as one important goal of this project, criteria and ways to build virtual comparable corpora to be used for contrastive linguistic analyses.

     

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Englisch
    Medientyp: Aufsatz aus einer Zeitschrift
    Format: Online
    DDC Klassifikation: Sprache (400)
    Schlagworte: Korpus; Rumänisch; Wissenschaftliche Kooperation; Kontrastive Linguistik
    Lizenz:

    rightsstatements.org/page/InC/1.0/ ; info:eu-repo/semantics/openAccess