Ergebnisse für *

Es wurden 3 Ergebnisse gefunden.

Zeige Ergebnisse 1 bis 3 von 3.

Sortieren

  1. Evaluating Workflows for Creating Orthographic Transcripts for Oral Corpora by Transcribing from Scratch or Correcting ASR-Output
    Erschienen: 2024
    Verlag:  Paris : ELRA Language Resource Association ; Mannheim : Leibniz-Institut für Deutsche Sprache (IDS)

    Research projects incorporating spoken data require either a selection of existing speech corpora, or they plan to record new data. In both cases, recordings need to be transcribed to make them accessible to analysis. Underestimating the effort of... mehr

     

    Research projects incorporating spoken data require either a selection of existing speech corpora, or they plan to record new data. In both cases, recordings need to be transcribed to make them accessible to analysis. Underestimating the effort of transcribing can be risky. Automatic Speech Recognition (ASR) holds the promise to considerably reduce transcription effort. However, few studies have so far attempted to evaluate this potential. The present paper compares efforts for manual transcription vs. correction of ASR-output. We took recordings from corpora of varying settings (interview, colloquial talk, dialectal, historic) and (i) compared two methods for creating orthographic transcripts: transcribing from scratch vs. correcting automatically created transcripts. And (ii) we evaluated the influence of the corpus characteristics on the correcting efficiency. Results suggest that for the selected data and transcription conventions, transcribing and correcting still take equally long with 7 times real-time on average. The more complex the primary data, the more time has to be spent on corrections. Despite the impressive latest developments in speech technology, to be a real help for conversation analysts or dialectologists, ASR systems seem to require even more improvement, or we need sufficient and appropriate data for training such systems.

     

    Export in Literaturverwaltung
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Englisch
    Medientyp: Konferenzveröffentlichung
    Format: Online
    DDC Klassifikation: Sprache (400)
    Schlagworte: Deutsch; Korpus; Gesprochene Sprache; Automatische Spracherkennung
    Lizenz:

    creativecommons.org/licenses/by-nc/4.0/deed.de ; info:eu-repo/semantics/openAccess

  2. Linking and access structures
    Erschienen: 2024
    Verlag:  Berlin/Boston : de Gruyter ; Mannheim : Leibniz-Institut für Deutsche Sprache (IDS)

    Lexicographic content interlinked within and between Internet dictionaries can be thought of as a network of streets. The streets connect different pieces of content in Internet dictionaries, thus forming the digital street network between different... mehr

     

    Lexicographic content interlinked within and between Internet dictionaries can be thought of as a network of streets. The streets connect different pieces of content in Internet dictionaries, thus forming the digital street network between different dictionary entries. The links in the user interface of a dictionary, from one headword to its associated synonyms for example, play an important role here as the main signposts by which users arrive, ideally, directly at their destination. Admittedly, this is not quite the same as reading a signpost in a street (cf. also Blumenthal et al. 1988). If you want to look up a place in an atlas, this can be done very conveniently online nowadays with the search function in digital maps. Direct access to dictionary content works in the same way. Here, there is a wide range of options for dictionary users to access individual pieces of lexicographic content. This chapter is intended to provide insights into the whole field of linking and access structures. In the process, our aim is not to provide an exhaustive overview but rather to demonstrate, by way of example, which basic possibilities exist. In the first section, we explain what can be understood by linking in Internet dictionaries and how the level of data management differs from the presentational level. In the second part, we present the options for both semasiological (→ Section 5.3.1) and onomasiological access structures (→ Section 5.3.2). Finally, in → Section 5.4, we show what new impulses electronic cross-linking and access structure can offer for modern dictionary research.

     

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Englisch
    Medientyp: Aufsatz aus einem Sammelband
    Format: Online
    DDC Klassifikation: Sprache (400)
    Schlagworte: Lexikografie; Internet; Wörterbuch; Online-Wörterbuch; Semasiologie; Onomasiologie
    Lizenz:

    creativecommons.org/licenses/by/4.0/ ; info:eu-repo/semantics/openAccess

  3. Fanfictions – Literatur von Frauen über Männer? Korpusbasierte Analyse der Geschlechterrollen bei Texten und Autor*innen deutschsprachiger Fanfictions
    Erschienen: 2024
    Verlag:  Zenodo

    Fanfictions wurden mit dem Aufstieg des Internets in den letzten Jahren zu einem wichtigen literarischen Genre der Online-Kultur und vielfach in den Digital Humanities mit unterschiedlichen Methoden untersucht. Der Großteil der Forschung ist jedoch... mehr

     

    Fanfictions wurden mit dem Aufstieg des Internets in den letzten Jahren zu einem wichtigen literarischen Genre der Online-Kultur und vielfach in den Digital Humanities mit unterschiedlichen Methoden untersucht. Der Großteil der Forschung ist jedoch momentan noch auf englisch-sprachige Korpora und Analysen konzentriert. Wir präsentieren Ergebnisse eines Projekt zur Analyse deutschsprachiger Fanfiction-Korpora mit Fokus auf Fragestellungen von Geschlechterrollen im Text und von Autor*innen. Wir berichten über die Akquise von über 410.000 deutschsprachigen Fanfictions und Metadaten von den Plattformen Fanfiktion.de und Archive of Our Own. Mittels Metadatenanalysen, NER und computergestützter Geschlechtserkennung von Namen stellen wir fest, dass der Großteil der Autor*innen weiblich ist aber primär über männliche Figuren, häufig im Kontext homo-romantischer Beziehungen schreibt. Wir diskutieren die Ergebnisse und Limitationen unseres Projekts im Kontext bisheriger Forschung.

     

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Deutsch
    Medientyp: Aufsatz aus einem Sammelband
    Format: Online
    DDC Klassifikation: Datenverarbeitung; Informatik (004); Germanische Sprachen; Deutsch (430); Literaturen germanischer Sprachen; Deutsche Literatur (830)
    Lizenz:

    cc_by_4