Suchergebnisse

Language periphery

monocollocable words in English, Italian, German and Czech

Autor*in: Čermák, František

Verlag: John Benjamins Publishing Company, Amsterdam

Berlin: Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, Haus Potsdamer Straße

Standort:

Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, Haus Potsdamer Straße

Signatur:

10 A 35729

Fernleihe:

uneingeschränkte Fernleihe, Kopie und Ausleihe

Link zum Verbundkatalog:

Gemeinsamer Bibliotheksverbund (GBV)

Hannover: Technische Informationsbibliothek (TIB) / Leibniz-Informationszentrum Technik und Naturwissenschaften und Universitätsbibliothek

Standort:

Technische Informationsbibliothek (TIB) / Leibniz-Informationszentrum Technik und Naturwissenschaften und Universitätsbibliothek

Signatur:

CG/540/880

Fernleihe:

uneingeschränkte Fernleihe, Kopie und Ausleihe

Link zum Verbundkatalog:

Gemeinsamer Bibliotheksverbund (GBV)

Leipzig: Universitätsbibliothek Leipzig

Standort:

Universitätsbibliothek Leipzig

Fernleihe:

uneingeschränkte Fernleihe, Kopie und Ausleihe

Link zum Verbundkatalog:

Südwestdeutscher Bibliotheksverbund (SWB)

Mannheim: Leibniz-Institut für Deutsche Sprache (IDS), Bibliothek

Standort:

Leibniz-Institut für Deutsche Sprache (IDS), Bibliothek

Fernleihe:

keine Fernleihe

Link zum Verbundkatalog:

Südwestdeutscher Bibliotheksverbund (SWB)

Export in Literaturverwaltung

RIS-Format
BibTeX-Format

Quelle:	Leibniz-Institut für Deutsche Sprache, Bibliothek
Beteiligt:	Čermák, Jan (VerfasserIn); Obstová, Zora (VerfasserIn); Vachková, Marie (VerfasserIn)
Sprache:	Englisch; Italienisch; Deutsch; Tschechisch
Medientyp:	Buch (Monographie)
Format:	Druck
ISBN:	9789027210715
RVK Klassifikation:	GC 8213 ; ET 550
Schriftenreihe:	Studies in corpus linguistics ; volume 74
Schlagworte:	Sublanguage; Lexicology; Italian language; German language; Czech language; English language; Italian language; German language; Czech language; Lexicology; Dictionaries, Polyglot
Umfang:	VI, 108 Seiten
Bemerkung(en):	Includes bibliographical references and index

Web 1T 5-gram, 10 European Languages Version 1

Autor*in:

Erschienen: [2009]

Verlag: Linguistic Data Consortium, [Philadelphia, Pennsylvania]

Web 1T 5-gram, 10 European Languages Version 1 was created by Google, Inc. It consists of word n-grams and their observed frequency counts for ten European languages: Czech, Dutch, French, German, Italian, Polish, Portuguese, Romanian, Spanish and... mehr

Mannheim: Leibniz-Institut für Deutsche Sprache (IDS), Bibliothek

Standort:

Leibniz-Institut für Deutsche Sprache (IDS), Bibliothek

Signatur:

bestellt

Fernleihe:

keine Fernleihe

Link zum Verbundkatalog:

Südwestdeutscher Bibliotheksverbund (SWB)

Web 1T 5-gram, 10 European Languages Version 1 was created by Google, Inc. It consists of word n-grams and their observed frequency counts for ten European languages: Czech, Dutch, French, German, Italian, Polish, Portuguese, Romanian, Spanish and Swedish. The length of the n-grams ranges from unigrams (single words) to five-grams. The n-gram counts were generated from approximately one hundred billion word tokens of text for each language, or approximately one trillion total tokens. The n-grams were extracted from publicly-accessible web pages from October 2008 to December 2008. This data set contains only n-grams that appeared at least 40 times in the processed sentences. Less frequent n-grams were discarded. While the aim was to identify and collect pages from the specific target languages only, it is likely that some text from other languages may be in the final data. This dataset will be useful for statistical language modeling, including machine translation, speech recognition and other uses. *Data* The input encoding of documents was automatically detected, and all text was converted to UTF8. The following table contains statistics for the entire release. File sizes (entire corpus): approximately 27.9 GB compressed (bzip2) text files Total number of tokens: 1,306,807,412,486 Total number of sentences: 150,727,365,731 Total number of unigrams: 95,998,281 Total number of bigrams: 646,439,858 Total number of trigrams: 1,312,972,925 Total number of fourgrams: 1,396,154,236 Total number of fivegrams: 1,149,361,413 Total number of n-grams: 4,600,926,713

Export in Literaturverwaltung

RIS-Format
BibTeX-Format

Hinweise zum Inhalt

Verlag (Request Form)

Dataset documentation

Quelle:	Leibniz-Institut für Deutsche Sprache, Bibliothek
Beteiligt:	Brants, Thorsten; Franz, Alex
Sprache:	Schwedisch; Spanisch; Rumänisch; Portugiesisch; Polnisch; Niederländisch; Italienisch; Französisch; Deutsch; Tschechisch
Medientyp:	Buch (Monographie); Datenträger
ISBN:	1585635251; 9781585635252
Schlagworte:	Swedish language; Spanish language; Romanian language; Portuguese language; Polish language; Dutch language; Italian language; French language; German language; Czech language; Linguistics; Computational linguistics; Machine translating; Automatic speech recognition; Automatic speech recognition; Computational linguistics; Czech language ; Data processing; Dutch language ; Data processing; French language ; Data processing; German language ; Data processing; Linguistics ; Statistical methods; Machine translating; Polish language ; Data processing; Portuguese language ; Data processing; Spanish language ; Data processing; Swedish language ; Data processing; Databases; Excerpts; Excerpts
Umfang:	1 Online-Ressource (1 online resource)
Bemerkung(en):	LDC number: LDC2009T25 Data samples are available on the LDC website

Language periphery

monocollocable words in English, Italian, German and Czech

Autor*in: Čermák, František

Verlag: John Benjamins Publishing Company, Amsterdam

Berlin: Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, Haus Unter den Linden

Standort:

Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, Haus Unter den Linden

Fernleihe:

uneingeschränkte Fernleihe, Kopie und Ausleihe

Link zum Verbundkatalog:

Gemeinsamer Bibliotheksverbund (GBV)

Export in Literaturverwaltung

RIS-Format
BibTeX-Format

Quelle:	Verbundkataloge
Beteiligt:	Čermák, Jan (VerfasserIn); Obstová, Zora (VerfasserIn); Vachková, Marie (VerfasserIn)
Sprache:	Englisch; Italienisch; Deutsch; Tschechisch
Medientyp:	Buch (Monographie)
Format:	Druck
ISBN:	9789027210715
RVK Klassifikation:	GC 8213 ; ET 550
Schriftenreihe:	Studies in corpus linguistics ; volume 74
Schlagworte:	Sublanguage; Lexicology; Italian language; German language; Czech language; English language; Italian language; German language; Czech language; Lexicology; Dictionaries, Polyglot
Umfang:	VI, 108 Seiten
Bemerkung(en):	Includes bibliographical references and index

Language periphery

monocollocable words in English, Italian, German and Czech

Autor*in:

Erschienen: [2016]

Verlag: John Benjamins Publishing Company, Amsterdam

München: Bayerische Staatsbibliothek

Standort:

Bayerische Staatsbibliothek

Fernleihe:

uneingeschränkte Fernleihe, Kopie und Ausleihe

Link zum Verbundkatalog:

Bibliotheksverbund Bayern (BVB)

Passau: Universitätsbibliothek Passau

Standort:

Universitätsbibliothek Passau

Fernleihe:

uneingeschränkte Fernleihe, Kopie und Ausleihe

Link zum Verbundkatalog:

Bibliotheksverbund Bayern (BVB)

Regensburg: Universitätsbibliothek Regensburg

Standort:

Universitätsbibliothek Regensburg

Fernleihe:

uneingeschränkte Fernleihe, Kopie und Ausleihe

Link zum Verbundkatalog:

Bibliotheksverbund Bayern (BVB)

Export in Literaturverwaltung

RIS-Format
BibTeX-Format

Hinweise zum Inhalt

Inhaltsverzeichnis

Quelle:	Verbundkataloge
Beteiligt:	Čermák, František (Herausgeber); Čermák, Jan (Herausgeber); Obstová, Zora (Herausgeber); Vachková, Marie (Herausgeber)
Sprache:	Englisch; Italienisch; Deutsch; Tschechisch
Medientyp:	Buch (Monographie)
ISBN:	9789027210715; 9789027267627
RVK Klassifikation:	ET 550 ; GC 8213
Schriftenreihe:	Studies in corpus linguistics ; 74
Schlagworte:	Deutsch; Englisch; Sublanguage; Lexicology; Italian language; German language; Czech language; English language; Italian language; German language; Czech language; Dictionaries, Polyglot; Kontrastive Lexikologie; Deutsch; Kollokation; Englisch; Tschechisch; Italienisch
Umfang:	VI, 108 Seiten
Bemerkung(en):	Beiträge teilweise englisch, teilweise italienisch, teilweise deutsch, teilweise tschechisch

Filtern nach

Aktive Filter

Kategorien:

Bereich

Quelle

Format

Beteiligt

Medientyp

Sprache

Jahr

Letzte Suchanfragen

Ergebnisse für *

Language periphery

Berlin: Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, Haus Potsdamer Straße

Hannover: Technische Informationsbibliothek (TIB) / Leibniz-Informationszentrum Technik und Naturwissenschaften und Universitätsbibliothek

Leipzig: Universitätsbibliothek Leipzig

Mannheim: Leibniz-Institut für Deutsche Sprache (IDS), Bibliothek

Web 1T 5-gram, 10 European Languages Version 1

Mannheim: Leibniz-Institut für Deutsche Sprache (IDS), Bibliothek

Language periphery

Berlin: Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, Haus Unter den Linden

Language periphery

München: Bayerische Staatsbibliothek

Passau: Universitätsbibliothek Passau

Regensburg: Universitätsbibliothek Regensburg

Kontakt

Partner