Ergebnisse für *

Es wurden 4 Ergebnisse gefunden.

Zeige Ergebnisse 1 bis 4 von 4.

Sortieren

  1. Language periphery
    monocollocable words in English, Italian, German and Czech
    Erschienen: [2016]; © 2016
    Verlag:  John Benjamins Publishing Company, Amsterdam

    Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, Haus Potsdamer Straße
    10 A 35729
    uneingeschränkte Fernleihe, Kopie und Ausleihe
    Technische Informationsbibliothek (TIB) / Leibniz-Informationszentrum Technik und Naturwissenschaften und Universitätsbibliothek
    CG/540/880
    uneingeschränkte Fernleihe, Kopie und Ausleihe
    Universitätsbibliothek Leipzig
    uneingeschränkte Fernleihe, Kopie und Ausleihe
    Leibniz-Institut für Deutsche Sprache (IDS), Bibliothek
    keine Fernleihe
    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: Leibniz-Institut für Deutsche Sprache, Bibliothek
    Beteiligt: Čermák, Jan (VerfasserIn); Obstová, Zora (VerfasserIn); Vachková, Marie (VerfasserIn)
    Sprache: Englisch; Italienisch; Deutsch; Tschechisch
    Medientyp: Buch (Monographie)
    Format: Druck
    ISBN: 9789027210715
    RVK Klassifikation: GC 8213 ; ET 550
    Schriftenreihe: Studies in corpus linguistics ; volume 74
    Schlagworte: Sublanguage; Lexicology; Italian language; German language; Czech language; English language; Italian language; German language; Czech language; Lexicology; Dictionaries, Polyglot
    Umfang: VI, 108 Seiten
    Bemerkung(en):

    Includes bibliographical references and index

  2. Web 1T 5-gram, 10 European Languages Version 1
    Autor*in:
    Erschienen: [2009]
    Verlag:  Linguistic Data Consortium, [Philadelphia, Pennsylvania]

    Web 1T 5-gram, 10 European Languages Version 1 was created by Google, Inc. It consists of word n-grams and their observed frequency counts for ten European languages: Czech, Dutch, French, German, Italian, Polish, Portuguese, Romanian, Spanish and... mehr

    Leibniz-Institut für Deutsche Sprache (IDS), Bibliothek
    bestellt
    keine Fernleihe

     

    Web 1T 5-gram, 10 European Languages Version 1 was created by Google, Inc. It consists of word n-grams and their observed frequency counts for ten European languages: Czech, Dutch, French, German, Italian, Polish, Portuguese, Romanian, Spanish and Swedish. The length of the n-grams ranges from unigrams (single words) to five-grams. The n-gram counts were generated from approximately one hundred billion word tokens of text for each language, or approximately one trillion total tokens. The n-grams were extracted from publicly-accessible web pages from October 2008 to December 2008. This data set contains only n-grams that appeared at least 40 times in the processed sentences. Less frequent n-grams were discarded. While the aim was to identify and collect pages from the specific target languages only, it is likely that some text from other languages may be in the final data. This dataset will be useful for statistical language modeling, including machine translation, speech recognition and other uses. *Data* The input encoding of documents was automatically detected, and all text was converted to UTF8. The following table contains statistics for the entire release. File sizes (entire corpus): approximately 27.9 GB compressed (bzip2) text files Total number of tokens: 1,306,807,412,486 Total number of sentences: 150,727,365,731 Total number of unigrams: 95,998,281 Total number of bigrams: 646,439,858 Total number of trigrams: 1,312,972,925 Total number of fourgrams: 1,396,154,236 Total number of fivegrams: 1,149,361,413 Total number of n-grams: 4,600,926,713

     

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Hinweise zum Inhalt
    Verlag (Request Form)
  3. Language periphery
    monocollocable words in English, Italian, German and Czech
    Erschienen: [2016]; © 2016
    Verlag:  John Benjamins Publishing Company, Amsterdam

    Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, Haus Unter den Linden
    uneingeschränkte Fernleihe, Kopie und Ausleihe
    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: Verbundkataloge
    Beteiligt: Čermák, Jan (VerfasserIn); Obstová, Zora (VerfasserIn); Vachková, Marie (VerfasserIn)
    Sprache: Englisch; Italienisch; Deutsch; Tschechisch
    Medientyp: Buch (Monographie)
    Format: Druck
    ISBN: 9789027210715
    RVK Klassifikation: GC 8213 ; ET 550
    Schriftenreihe: Studies in corpus linguistics ; volume 74
    Schlagworte: Sublanguage; Lexicology; Italian language; German language; Czech language; English language; Italian language; German language; Czech language; Lexicology; Dictionaries, Polyglot
    Umfang: VI, 108 Seiten
    Bemerkung(en):

    Includes bibliographical references and index

  4. Language periphery
    monocollocable words in English, Italian, German and Czech
    Autor*in:
    Erschienen: [2016]
    Verlag:  John Benjamins Publishing Company, Amsterdam

    Bayerische Staatsbibliothek
    uneingeschränkte Fernleihe, Kopie und Ausleihe
    Universitätsbibliothek Passau
    uneingeschränkte Fernleihe, Kopie und Ausleihe
    Universitätsbibliothek Regensburg
    uneingeschränkte Fernleihe, Kopie und Ausleihe
    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Hinweise zum Inhalt
    Quelle: Verbundkataloge
    Beteiligt: Čermák, František (Herausgeber); Čermák, Jan (Herausgeber); Obstová, Zora (Herausgeber); Vachková, Marie (Herausgeber)
    Sprache: Englisch; Italienisch; Deutsch; Tschechisch
    Medientyp: Buch (Monographie)
    ISBN: 9789027210715; 9789027267627
    RVK Klassifikation: ET 550 ; GC 8213
    Schriftenreihe: Studies in corpus linguistics ; 74
    Schlagworte: Deutsch; Englisch; Sublanguage; Lexicology; Italian language; German language; Czech language; English language; Italian language; German language; Czech language; Dictionaries, Polyglot; Kontrastive Lexikologie; Deutsch; Kollokation; Englisch; Tschechisch; Italienisch
    Umfang: VI, 108 Seiten
    Bemerkung(en):

    Beiträge teilweise englisch, teilweise italienisch, teilweise deutsch, teilweise tschechisch