Filtern nach
Letzte Suchanfragen

Ergebnisse für *

Es wurden 30 Ergebnisse gefunden.

Zeige Ergebnisse 1 bis 25 von 30.

Sortieren

  1. Forschungsinfrastrukturen am IDS: Gegenwart und Zukunft
    Erschienen: 2014
    Verlag:  Institut für Deutsche Sprache, Bibliothek, Mannheim

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: Verbundkataloge
    Beteiligt: Witt, Andreas (Verfasser)
    Sprache: Deutsch
    Medientyp: Buch (Monographie)
    Format: Online
    Weitere Identifier:
    DDC Klassifikation: Bibliotheks- und Informationswissenschaften (020)
    Schlagworte: Forschung; Infrastruktur; Digital Humanities; Sprachverarbeitung; Computerlinguistik; Germanistik; Digital Humanities
    Weitere Schlagworte: Forschungsdaten; Forschungsinfrastruktur; Institut für Deutsche Sprache <Mannheim>
    Umfang: Online-Ressource
    Bemerkung(en):

    In: Ansichten und Einsichten. 50 Jahre Institut für Deutsche Sprache . - Mannheim : Institut für Deutsche Sprache, 2014., S. 329-336, ISBN 978-3-937241-44-9

  2. Digital research infrastructure
    Erschienen: 2021
    Verlag:  Leibniz-Institut für Deutsche Sprache (IDS), Bibliothek, Mannheim

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: Verbundkataloge
    Beteiligt: Schonefeld, Oliver (Verfasser); Witt, Andreas (Verfasser); Koschtial, Claudia (Herausgeber); Köhler, Thomas (Herausgeber); Felden, Carsten (Herausgeber)
    Sprache: Englisch
    Medientyp: Buch (Monographie)
    Format: Online
    Weitere Identifier:
    Schlagworte: Digital Humanities; Forschungsdaten; Infrastruktur; Datenbank; Forschungseinrichtung
    Weitere Schlagworte: digital research infrastructure; IT infrastructure; information infrastructure
    Umfang: Online-Ressource
    Bemerkung(en):

    In: e-Science: Open, social and virtual technology for research collaboration. - Cham : Springer, 2021., S. 67-76, ISBN 978-3-030-66262-2, Progress in IS ; -

  3. Informationsinfrastrukturen am Institut für Deutsche Sprache
    Autor*in: Witt, Andreas
    Erschienen: 2015
    Verlag:  Institut für Deutsche Sprache, Bibliothek, Mannheim

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: Verbundkataloge
    Beteiligt: Schonefeld, Oliver (Verfasser); Stickel, Gerhard (Herausgeber); Váradi, Tamás (Herausgeber)
    Sprache: Deutsch
    Medientyp: Buch (Monographie)
    Format: Online
    Weitere Identifier:
    DDC Klassifikation: Sprache (400)
    Schlagworte: Infrastruktur; Institut; Deutsch; Korpus <Linguistik>; Informationsversorgung; Außeruniversitäre staatliche Forschungseinrichtung; Entwicklung; Infrastrukturplanung; Informationsversorgung
    Weitere Schlagworte: Institut für Deutsche Sprache <Mannheim>
    Umfang: Online-Ressource
    Bemerkung(en):

    In: Language, Languages and New Technologies. ICT in the Service of Languages. Contributions to the Annual Conference 2010 of EFNIL in Thessaloniki. - Frankfurt am Main/Berlin/Bern/Bruxelles/New York/Oxford/Wien : Lang, 2011., S. 197-211, ISBN 978-3-631-63536-0, Duisburger Arbeiten zur Sprach- und Kulturwissenschaft ; 87

  4. Sustainability of annotated resources in linguistics: A web-platform for exploring, querying, and distributing linguistic corpora and other resources
    Autor*in: Rehm, Georg
    Erschienen: 2015
    Verlag:  Institut für Deutsche Sprache, Bibliothek, Mannheim

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: Verbundkataloge
    Beteiligt: Schonefeld, Oliver (Verfasser); Witt, Andreas (Verfasser); Hinrichs, Erhard (Verfasser); Reis, Marga (Verfasser)
    Sprache: Englisch
    Medientyp: Buch (Monographie)
    Format: Online
    Weitere Identifier:
    DDC Klassifikation: Sprache (400)
    Schlagworte: Korpus <Linguistik>; Sprachdaten; Langzeitarchivierung; Digital Humanities
    Umfang: Online-Ressource
    Bemerkung(en):

    In: Literary and Linguistic Computing. 24, 2009., 2., S. 193-210

  5. Forschungsinfrastrukturen in außeruniversitären Forschungseinrichtungen
    Forschungsbericht
    Autor*in:
    Erschienen: 2014
    Verlag:  Inst. für Dt. Sprache, Mannheim

    Leibniz-Institut für Deutsche Sprache (IDS), Bibliothek
    keine Fernleihe
    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Hinweise zum Inhalt
    Volltext (Kostenfrei)
    Quelle: Leibniz-Institut für Deutsche Sprache, Bibliothek
    Beteiligt: Fiedler, Norman; Werthmann, Antonina; Stührenberg, Maik; Schonefeld, Oliver; Bingel, Joachim; Witt, Andreas
    Sprache: Deutsch
    Medientyp: Buch (Monographie)
    Format: Online
    Weitere Identifier:
    Schlagworte: Forschungsprozess; Infrastruktur; Computerlinguistik; Geisteswissenschaften; Sozialwissenschaften
    Umfang: Online-Ressource
  6. Informationsinfrastrukturen am Institut für Deutsche Sprache
    Autor*in: Witt, Andreas
    Erschienen: 2011

    Leibniz-Institut für Deutsche Sprache (IDS), Bibliothek
    keine Fernleihe
    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: Leibniz-Institut für Deutsche Sprache, Bibliothek
    Beteiligt: Schonefeld, Oliver
    Sprache: Deutsch
    Medientyp: Aufsatz aus einem Sammelband
    Format: Druck
    Übergeordneter Titel: In: Language, languages and new technologies; Frankfurt am Main : Lang, 2011; (2011), Seite [197]-211; 231 S.

  7. Forschungsinfrastrukturen am IDS: Gegenwart und Zukunft
    Erschienen: 2014

    Leibniz-Institut für Deutsche Sprache (IDS), Bibliothek
    keine Fernleihe
    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: Leibniz-Institut für Deutsche Sprache, Bibliothek
    Beteiligt: Witt, Andreas
    Sprache: Deutsch
    Medientyp: Aufsatz aus einem Sammelband
    Format: Druck
    Übergeordneter Titel: In: Institut für Deutsche Sprache; Ansichten und Einsichten; Mannheim : Inst. für Deutsche Sprache, 2014; (2014), Seite [329]-336; 558 S.

  8. Forschungsinfrastrukturen am IDS: Gegenwart und Zukunft
    Erschienen: 2014
    Verlag:  Institut für Deutsche Sprache, Bibliothek, Mannheim

    Export in Literaturverwaltung
    Quelle: DNB Sachgruppe Deutsche Sprache und Literatur
    Beteiligt: Witt, Andreas (Verfasser)
    Sprache: Deutsch
    Medientyp: Unbestimmt
    Format: Online
    Weitere Identifier:
    Schlagworte: Forschung; Infrastruktur; Digital Humanities; Sprachverarbeitung; Computerlinguistik; Germanistik; Digital Humanities
    Weitere Schlagworte: Forschungsdaten; Forschungsinfrastruktur; Institut für Deutsche Sprache <Mannheim>
    Umfang: Online-Ressource
    Bemerkung(en):

    In: Ansichten und Einsichten. 50 Jahre Institut für Deutsche Sprache . - Mannheim : Institut für Deutsche Sprache, 2014., S. 329-336, ISBN 978-3-937241-44-9

  9. Musterverträge (AP 3.2) und technische Umsetzung (R 3.2.1). Arbeitspaket 3. TextGrid - Vernetzte Forschungsumgebung in den eHumanities. Laufzeit: Juni 2009 bis Mai 2012
    Autor*in: Witt, Andreas
    Erschienen: 2018
    Verlag:  Institut für Deutsche Sprache, Bibliothek, Mannheim

    Export in Literaturverwaltung
    Quelle: DNB Sachgruppe Deutsche Sprache und Literatur
    Beteiligt: Gietz, Peter (Verfasser); Widmer, Markus (Verfasser); Funk, Stefan (Verfasser); Schonefeld, Oliver (Verfasser); Fiedler, Norman (Verfasser)
    Sprache: Deutsch
    Medientyp: Unbestimmt
    Format: Online
    Weitere Identifier:
    Schlagworte: Lizenz; Vertrag; Benutzungsordnung; Digital Humanities; Virtuelle Forschungsumgebung; Nutzungsrecht
    Weitere Schlagworte: TextGrid
    Umfang: Online-Ressource
    Bemerkung(en):

    In: TextGrid - Vernetzte Forschungsumgebung in den eHumanities

  10. Musterverträge (AP 3.2) und technische Umsetzung (R 3.2.1). Arbeitspaket 3. TextGrid - Vernetzte Forschungsumgebung in den eHumanities. Laufzeit: Juni 2009 bis Mai 2012

    In TextGrid gibt es verschiedene Content-Provider, deren Ressourcen nicht ohne weiteres in der TextGrid-Infrastruktur zur Verfügung gestellt werden können. Die Ursache hierfür ist, dass die erforderlichen Zugriffsbeschränkungen bislang nicht von der... mehr

     

    In TextGrid gibt es verschiedene Content-Provider, deren Ressourcen nicht ohne weiteres in der TextGrid-Infrastruktur zur Verfügung gestellt werden können. Die Ursache hierfür ist, dass die erforderlichen Zugriffsbeschränkungen bislang nicht von der existierenden Autorisierungsinfrastruktur abgebildet werden können. Beispielsweise ist es für den Zugriff auf einige Ressourcen am Institut für Deutsche Sprache notwendig, dass Benutzer einen Lizenzvertrag akzeptieren. Um diesen Content-Providern die Bereitstellung ihrer Ressourcen in TextGrid zu ermöglichen, muss die bestehende Autorisierungsinfrastruktur erweitert werden, um feinere Zugriffsbeschränkungen zu ermöglichen. Für die Lizenzierung der in TextGrid bereitgestellten Software und Daten wird künftig eine Lizenzierung benötigt, welche der offenen Struktur der angestrebten Forschungsplattform gerecht wird. Hierfür entwickelt AP 3.2 Musterlizenzvereinbarungen mit unterschiedlichen Content-Providern. Im Folgenden soll ein Überblick über unterschiedliche Möglichkeiten der Lizenzierung gegeben werden, um sowohl potenziell für TextGrid heranzuziehende Fremd-Software zu evaluieren als auch eine Orientierung für die Lizenzierung eigener Produkte und Daten zu geben. Letztendlich soll eine Empfehlung für ein möglicherweise in TextGrid angewandtes Modell gegeben werden. Im zweiten Teil dieses Textes wird ein Konzept für die neue TextGrid-Middleware-Komponente TG-license vorgestellt, durch die auch lizensierter Content im Rahmen von TextGridRep zur Verfügung gestellt werden kann.

     

    Export in Literaturverwaltung
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Deutsch
    Medientyp: Bericht
    Format: Online
    DDC Klassifikation: Germanische Sprachen; Deutsch (430)
    Schlagworte: Digital Humanities; Virtuelle Forschungsumgebung; Nutzungsrecht
    Lizenz:

    rightsstatements.org/page/InC/1.0/ ; info:eu-repo/semantics/openAccess

  11. Addressing Cha(lle)nges in Long-Term Archiving of Large Corpora
    Erschienen: 2020
    Verlag:  Paris : European Language Resources Association

    This paper addresses long-term archival for large corpora. Three aspects specific to language resources are focused, namely (1) the removal of resources for legal reasons, (2) versioning of (unchanged) objects in constantly growing resources,... mehr

     

    This paper addresses long-term archival for large corpora. Three aspects specific to language resources are focused, namely (1) the removal of resources for legal reasons, (2) versioning of (unchanged) objects in constantly growing resources, especially where objects can be part of multiple releases but also part of different collections, and (3) the conversion of data to new formats for digital preservation. It is motivated why language resources may have to be changed, and why formats may need to be converted. As a solution, the use of an intermediate proxy object called a signpost is suggested. The approach will be exemplified with respect to the corpora of the Leibniz Institute for the German Language in Mannheim, namely the German Reference Corpus (DeReKo) and the Archive for Spoken German (AGD).

     

    Export in Literaturverwaltung
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Englisch
    Medientyp: Konferenzveröffentlichung
    Format: Online
    DDC Klassifikation: Sprache (400)
    Schlagworte: Korpus; Langzeitarchivierung; Nutzungsrecht; Dateiformat
    Lizenz:

    creativecommons.org/licenses/by-nc/4.0/ ; info:eu-repo/semantics/openAccess

  12. Forschungsinfrastrukturen in außeruniversitären Forschungseinrichtungen. Forschungsbericht
  13. Improvements in the CLARIN Component Metadata Infrastructure
    Erschienen: 2015
    Verlag:  Linköping : Linköping University Electronic Press, Linköpings universitet

    This article reports about the on-going work on a new version of the metadata framework Component Metadata Infrastructure (CMDI), central to the CLARIN infrastructure. Version 1.2 introduces a number of important changes based on the experience... mehr

     

    This article reports about the on-going work on a new version of the metadata framework Component Metadata Infrastructure (CMDI), central to the CLARIN infrastructure. Version 1.2 introduces a number of important changes based on the experience gathered in the last five years of intensive use of CMDI by the digital humanities community, addressing problems encountered, but also introducing new functionality. Next to the consolidation of the structure of the model and schema sanity, new means for lifecycle management have been introduced aimed at combatting the observed proliferation of components, new mechanism for use of external vocabularies will contribute to more consistent use of controlled values and cues for tools will allow improved presentation of the metadata records to the human users. The feature set has been frozen and approved, and the infrastructure is now entering a transition phase, in which all the tools and data need to be migrated to the new version.

     

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Englisch
    Medientyp: Aufsatz aus einem Sammelband
    Format: Online
    DDC Klassifikation: Linguistik (410)
    Lizenz:

    creativecommons.org/licenses/by-nc/4.0/ ; info:eu-repo/semantics/openAccess

  14. Informationsinfrastrukturen am Institut für Deutsche Sprache
    Erschienen: 2015
    Verlag:  Frankfurt am Main/Berlin/Bern/Bruxelles/New York/Oxford/Wien : Lang

    This paper describes the effort of the Institut für Deutsche Sprache (IDS), the central research institution for the German language, connected with Information and Communications Technology (ICT). Use of ICT in a language research institute is... mehr

     

    This paper describes the effort of the Institut für Deutsche Sprache (IDS), the central research institution for the German language, connected with Information and Communications Technology (ICT). Use of ICT in a language research institute is twofold. On the one hand, ICT provides basic services for researches to accomplish their daily work. On the other hand, several national and international institutions have a strong interest in ICT. Therefore, ICT can also be seen as an amplifier for language research. The first part of this paper reports on the activates of the IDS in internal and external ICT-related projects and initiatives. The second part describes a general strategy towards an ICT strategy that could be useful both for the IDS and other national language institutes. We think such a general strategy is necessary to create a strong foundation not only for the ICT-related projects, but as a basis for a modem research institute.

     

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Deutsch
    Medientyp: Aufsatz aus einem Sammelband
    Format: Online
    DDC Klassifikation: Linguistik (410)
    Schlagworte: Außeruniversitäre staatliche Forschungseinrichtung; Entwicklung; Infrastrukturplanung; Informationsversorgung
    Lizenz:

    rightsstatements.org/page/InC/1.0/ ; info:eu-repo/semantics/openAccess

  15. The New IDS Corpus Analysis Platform: Challenges and Prospects
    Erschienen: 2015
    Verlag:  Paris : European Language Resources Association (ELRA)

    The present article describes the first stage of the KorAP project, launched recently at the Institut für Deutsche Sprache (IDS) in Mannheim, Germany. The aim of this project is to develop an innovative corpus analysis platform to tackle the... mehr

     

    The present article describes the first stage of the KorAP project, launched recently at the Institut für Deutsche Sprache (IDS) in Mannheim, Germany. The aim of this project is to develop an innovative corpus analysis platform to tackle the increasing demands of modern linguistic research. The platform will facilitate new linguistic findings by making it possible to manage and analyse primary data and annotations in the petabyte range, while at the same time allowing an undistorted view of the primary linguistic data, and thus fully satisfying the demands of a scientific tool. An additional important aim of the project is to make corpus data as openly accessible as possible in light of unavoidable legal restrictions, for instance through support for distributed virtual corpora, user-defined annotations and adaptable user interfaces, as well as interfaces and sandboxes for user-supplied analysis applications. We discuss our motivation for undertaking this endeavour and the challenges that face it. Next, we outline our software implementation plan and describe development to-date.

     

    Export in Literaturverwaltung
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Englisch
    Medientyp: Konferenzveröffentlichung
    Format: Online
    DDC Klassifikation: Linguistik (410)
    Schlagworte: Korpus
    Lizenz:

    rightsstatements.org/page/InC/1.0/ ; info:eu-repo/semantics/openAccess

  16. The German Reference Corpus: New developments building on almost 50 years of experience
    Erschienen: 2015
    Verlag:  Paris : European Language Resources Association (ELRA)

    This paper describes the efforts in the field of sustainability of the Institut für Deutsche Sprache (IDS) in Mannheim with respect to DEREKO (Deutsches Referenzkorpus) the Archive of General Reference Corpora of Contemporary Written German. With... mehr

     

    This paper describes the efforts in the field of sustainability of the Institut für Deutsche Sprache (IDS) in Mannheim with respect to DEREKO (Deutsches Referenzkorpus) the Archive of General Reference Corpora of Contemporary Written German. With focus on re-usability and sustainability, we discuss its history and our future plans. We describe legal challenges related to the creation of a large and sustainable resource; sketch out the pipeline used to convert raw texts to the final corpus format and outline migration plans to TEI P5. Due to the fact, that the current version of the corpus management and query system is pushed towards its limits, we discuss the requirements for a new version which will be able to handle current and future DEREKO releases. Furthermore, we outline the institute’s plans in the field of digital preservation.

     

    Export in Literaturverwaltung
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Englisch
    Medientyp: Konferenzveröffentlichung
    Format: Online
    DDC Klassifikation: Linguistik (410)
    Schlagworte: Korpus; Langzeitarchivierung
    Lizenz:

    rightsstatements.org/page/InC/1.0/ ; info:eu-repo/semantics/openAccess

  17. Sustainability of annotated resources in linguistics: A web-platform for exploring, querying, and distributing linguistic corpora and other resources
    Erschienen: 2015
    Verlag:  Oxford : Oxford University Press

    We report on finished work in a project that is concerned with providing methods, tools, best practice guidelines, and solutions for sustainable linguistic resources. The article discusses several general aspects of sustainability and introduces an... mehr

     

    We report on finished work in a project that is concerned with providing methods, tools, best practice guidelines, and solutions for sustainable linguistic resources. The article discusses several general aspects of sustainability and introduces an approach to normalizing corpus data and metadata records. Moreover, the architecture of the sustainability platform implemented by the authors is described.

     

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Englisch
    Medientyp: Aufsatz aus einer Zeitschrift
    Format: Online
    DDC Klassifikation: Linguistik (410)
    Schlagworte: Korpus; Sprachdaten; Langzeitarchivierung; Digital Humanities
    Lizenz:

    rightsstatements.org/page/InC/1.0/ ; info:eu-repo/semantics/openAccess

  18. The Meta-data-Database of a Next Generation Sustainability Web-Platform for Language Resources

    Our goal is to provide a web-based platform for the long-term preservation and distribution of a heterogeneous collection of linguistic resources. We discuss the corpus preprocessing and normalisation phase that results in sets of multi-rooted trees.... mehr

     

    Our goal is to provide a web-based platform for the long-term preservation and distribution of a heterogeneous collection of linguistic resources. We discuss the corpus preprocessing and normalisation phase that results in sets of multi-rooted trees. At the same time we transform the original metadata records, just like the corpora annotated using different annotation approaches and exhibiting different levels of granularity, into the all-encompassing and highly flexible format eTEI for which we present editing and parsing tools. We also discuss the architecture of the sustainability platform. Its primary components are an XML database that contains corpus and metadata files and an SQL database that contains user accounts and access control lists. A staging area, whose structure, contents, and consistency can be checked using tools, is used to make sure that new resources about to be imported into the platform have the correct structure.

     

    Export in Literaturverwaltung
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Englisch
    Medientyp: Konferenzveröffentlichung
    Format: Online
    DDC Klassifikation: Linguistik (410)
    Schlagworte: Sprachdaten; Metadaten; Korpus
    Lizenz:

    rightsstatements.org/page/InC/1.0/ ; info:eu-repo/semantics/openAccess

  19. On the Lossless Transformation of Single-File, Multi-Layer Annotations into Multi-Rooted Trees
    Erschienen: 2015
    Verlag:  Montreal : Extreme Markup Languages Conference

    The Generalised Architecture for Sustainability (GENAU) provides a framework for the transformation of single-file, multi-layer annotations into multi-rooted trees. By employing constraints expressed in XCONCUR-CL, this procedure can be performed... mehr

     

    The Generalised Architecture for Sustainability (GENAU) provides a framework for the transformation of single-file, multi-layer annotations into multi-rooted trees. By employing constraints expressed in XCONCUR-CL, this procedure can be performed lossless, i.e., without losing information, especially with regard to the nesting of elements that belong to multiple annotation layers. This article describes how different types of linguistic corpora can be transformed using specialised tools, and how constraint rules can be applied to the resulting multi-rooted trees to add an additional level of validation.

     

    Export in Literaturverwaltung
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Englisch
    Medientyp: Konferenzveröffentlichung
    Format: Online
    DDC Klassifikation: Linguistik (410)
    Lizenz:

    rightsstatements.org/page/InC/1.0/ ; info:eu-repo/semantics/openAccess

  20. Multidimensional markup and heterogeneous linguistic resources

    The paper discusses two topics: firstly an approach of using multiple layers of annotation is sketched out. Regarding the XML representation this approach is similar to standoff annotation. A second topic is the use of heterogeneous linguistic... mehr

     

    The paper discusses two topics: firstly an approach of using multiple layers of annotation is sketched out. Regarding the XML representation this approach is similar to standoff annotation. A second topic is the use of heterogeneous linguistic resources (e.g., XML annotated documents, taggers, lexical nets) as a source for semiautomatic multi-dimensional markup to resolve typical linguistic issues, dealing with anaphora resolution as a case study.

     

    Export in Literaturverwaltung
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Englisch
    Medientyp: Konferenzveröffentlichung
    Format: Online
    DDC Klassifikation: Linguistik (410)
    Schlagworte: Korpus; Multimodalität; Annotation
    Lizenz:

    creativecommons.org/licenses/by-nc-nd/2.5/nl/ ; info:eu-repo/semantics/openAccess

  21. Towards validation of concurrent markup
    Erschienen: 2016
    Verlag:  Montreal : Extreme Markup Languages Conference

    XCONCUR allows for the annotations of multiple concurrent hierarchies, but lacks cross-layer validation. This paper explores the requirements for a constraint-based approach for such a validation process. mehr

     

    XCONCUR allows for the annotations of multiple concurrent hierarchies, but lacks cross-layer validation. This paper explores the requirements for a constraint-based approach for such a validation process.

     

    Export in Literaturverwaltung
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Englisch
    Medientyp: Konferenzveröffentlichung
    Format: Online
    DDC Klassifikation: Linguistik (410)
    Lizenz:

    rightsstatements.org/page/InC/1.0/ ; info:eu-repo/semantics/openAccess

  22. Making CONCUR work
    Erschienen: 2016
    Verlag:  Montreal : Extreme Markup Languages Conference

    The SGML feature CONCUR allowed for a document to be simultaneously marked up in multiple conflicting hierarchical tagsets but validated and interpreted in one tagset at a time. Alas, CONCUR was rarely implemented, and XML does not address the... mehr

     

    The SGML feature CONCUR allowed for a document to be simultaneously marked up in multiple conflicting hierarchical tagsets but validated and interpreted in one tagset at a time. Alas, CONCUR was rarely implemented, and XML does not address the problem of conflicting hierarchies at all. The MuLaX document syntax is a non-XML syntax that enables multiply-encoded hierarchies by distinguishing different “layers” in the hierarchy by adding a layer ID as a prefix to the element names. The IDs tie all the elements in a single hierarchy together in an “annotation layer”. Extraction of a single annotation layer results in a well-formed XML document, and each annotation layer may be associated with an XML schema. The MuLaX processing model works on the nodes of one annotation layer at a time through Xpath-like navigation. CONCUR lives!

     

    Export in Literaturverwaltung
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Englisch
    Medientyp: Konferenzveröffentlichung
    Format: Online
    DDC Klassifikation: Linguistik (410)
    Schlagworte: Computerlinguistik; Auszeichnungssprache; Annotation
    Lizenz:

    rightsstatements.org/page/InC/1.0/ ; info:eu-repo/semantics/openAccess

  23. Igel: Comparing document grammars using XQuery

    Igel is a small XQuery-based web application for examining a collection of document grammars; in particular, for comparing related document grammars to get a better overview of their differences and similarities. In its initial form, Igel reads only... mehr

     

    Igel is a small XQuery-based web application for examining a collection of document grammars; in particular, for comparing related document grammars to get a better overview of their differences and similarities. In its initial form, Igel reads only DTDs and provides only simple lists of constructs in them (elements, attributes, notations, parameter entities). Our continuing work is aimed at making Igel provide more sophisticated and useful information about document grammars and building the application into a useful tool for the analysis (and the maintenance!) of families of related document grammars

     

    Export in Literaturverwaltung
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Englisch
    Medientyp: Konferenzveröffentlichung
    Format: Online
    DDC Klassifikation: Linguistik (410)
    Schlagworte: Korpus; XML; XQuery
    Lizenz:

    creativecommons.org/licenses/by-nc-nd/3.0/de/deed.de ; info:eu-repo/semantics/openAccess

  24. A Web-Platform for Preserving, Exploring, Visualising, and Querying Linguistic Corpora and other Resources ; Plataforma web para el mantenimiento, exploraci ́on, visulizaci ́on y b ́usqueda en corpus ling ̈u ́ısticos y en otros recursos
    Erschienen: 2016
    Verlag:  Madrid : Sociedad Española para el procesamiento del Lenguaje Natural

    We present SPLICR, the Web-based Sustainability Platform for Linguistic Corpora and Resources. The system is aimed at people who work in Linguistics or Computational Linguistics: a comprehensive database of metadata records can be explored in order... mehr

     

    We present SPLICR, the Web-based Sustainability Platform for Linguistic Corpora and Resources. The system is aimed at people who work in Linguistics or Computational Linguistics: a comprehensive database of metadata records can be explored in order to find language resources that could be appropriate for one’s spe cific research needs. SPLICR also provides a graphical interface that enables users to query and to visualise corpora. The project in which the system is developed aims at sustainably archiving the ca. 60 language resources that have been constructed in three collaborative research centres. Our project has two primary goals: (a) To process and to archive sustainably the resources so that they are still available to the research community in five, ten, or even 20 years time. (b) To enable researchers to query the resources both on the level of their metadata as well as on the level of linguistic annotations. In more general terms, our goal is to enable solutions that leverage the interoperability, reusability, and sustainability of heterogeneous collec- tions of language resources. ; Presentamos SPLICR, una plataforma de sostenibilidad para corpus y recursos ling ̈u ́ısticos basada en web. El sistema est ́a destinado a personas que trabajan en el campo de la ling ̈u ́ıstica o de la ling ̈u ́ıstica computacional. Consiste en una base de datos extensa para metadatos que puede ser explorada para buscar recursos ling ̈u ́ısticos, que pudieran ser apropiados para las necesidades espec ́ıficas de una investigaci ́on. SPLICR tambi ́en ofrece una interfaz gr ́afica, que permite a los usuarios buscar y visualizar los corpus. El proyecto, en el que se ha desarollado el sistema, aspira a archivar de modo sostenible aproximadamente sesenta recursos ling ̈u ́ısticos, que han sido construidos mediante la colaboraci ́on de tres centros de investigaci ́on. Nuestro proyecto tiene dos metas principales: (a) Procesar y archivar recursos de forma sostenible, de manera que los recursos sigan siendo accesibles para la ...

     

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Englisch
    Medientyp: Aufsatz aus einer Zeitschrift
    Format: Online
    DDC Klassifikation: Linguistik (410)
    Lizenz:

    rightsstatements.org/page/InC/1.0/ ; info:eu-repo/semantics/openAccess

  25. Sustainability of Linguistic Resources Revisited

    This paper discusses work on the sustainability of linguistic resources as it was conducted in various projects, including the work of a three year project Sustainability of Linguistic Resources which finished in December 2008, a follow-up project,... mehr

     

    This paper discusses work on the sustainability of linguistic resources as it was conducted in various projects, including the work of a three year project Sustainability of Linguistic Resources which finished in December 2008, a follow-up project, Sustainable linguistic data, and initiatives related to the work of the International Organization of Standardization (ISO) on developing standards for linguistic resources. The individual projects have been conducted at German collaborative research centres at the Universities of Potsdam, Hamburg and Tübingen, where the sustainability work was coordinated.

     

    Export in Literaturverwaltung
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Englisch
    Medientyp: Konferenzveröffentlichung
    Format: Online
    DDC Klassifikation: Sprache (400)
    Schlagworte: Langzeitarchierung; Nachhaltigkeit; Annotation; Forschungsdaten; Linguistik
    Lizenz:

    rightsstatements.org/page/InC/1.0/ ; info:eu-repo/semantics/openAccess