Cite Brykina, Maria; Gusev, Valentin; Szeverényi, Sándor; Wagner-Nagy, Beáta. INEL Nganasan Corpus. Version 1.0. Publication date 2025-05-02. https://hdl.handle.net/11022/0000-0007-FE63-C. Archived at Universität Hamburg. In: The INEL corpora of indigenous Northern Eurasian languages. https://hdl.handle.net/11022/0000-0007-F45A-1

Nganasanisch

Nganasan

Das INEL Nganasan Korpus wurde im Rahmen des langfristigen INEL-Projekts („Grammatiken, Korpora und Sprachtechnologie für indigene nordeurasische Sprachen“) 2016-2033 erstellt. Das Korpus basiert weitgehend auf dem Nganasan Spoken Language Corpus, das an die INEL-Standards angepasst und mit neuen Texten ergänzt wurde. Das Korpus ermöglicht eine typologisch orientierte korpusbasierte Forschung zum Nganasanischen und erweitert die Dokumentation der weniger beschriebenen indigenen Sprachen Nordeurasiens. Das INEL Nganasan Korpus besteht aus zwei Teilen. Der glossierte Teil des Korpus enthält Texte, die mit Quellendateien (soweit verfügbar) und kommentierten Transkripten versehen sind. Der archivierte Teil des Korpus enthält nicht glossierte Texte, die entweder durch Audioaufnahmen (optional mit vorläufigen Transkriptionen) oder durch gescannte Seiten von Manuskripten oder Publikationen dargestellt werden. Das Korpus umfasst Texte, die zwischen 1933 und 2019 in Nganasanisch aufgezeichnet wurden. Die Quellen des Korpus sind:
  • Tonaufnahmen von Maria Brykina, Valentin Gusev, Sándor Szeverényi und Beáta Wagner-Nagy.
  • Ältere Tonaufnahmen von A. Aksyonova, Svetlana S. Aksyonova, Josefina Budzisch, Michael Daniel, Oksana E. Dobzhanskaya, Eugene Helimski, Nadezhda T. Kosterkina, Jean-Luc Lambert, Marina D. Lyublinskaya, N. A. Popov, Florian Sobanski, Eugénie Stapert, Larisa Y. Turdagina, Zsuzsa Várnai, Peter Voliak, Tatjana Zhdanova und anderen.
  • Manuskripttranskriptionen aus dem Nachlass von Ekaterina P. Boldt, Eugene Helimski, Nadezhda T. Kosterkina, I. E. Machkinis, E. P. Nojfeld, A. K. Stolyarova, Natalia M. Tereshchenko und Tatjana Zhdanova.
  • Veröffentlichte Texte von Ekaterina P. Boldt, I. E. Machkinis, Tibor Mikola, Georgij N. Prokofiev und A. K. Stolyarova.


Zugang über das Zentrum für nachhaltiges Forschungsdatenmanagement der Universität Hamburg:
The INEL Nganasan corpus has been created within the long-term INEL project ("Grammatical Descriptions, Corpora and Language Technology for Indigenous Northern Eurasian Languages"), 2016–2033. The corpus is largely based on the Nganasan Spoken Language Corpus, which has been adapted to the INEL standards and supplemented with new texts. The corpus makes possible typologically oriented corpus-based research on Nganasan and expands the documentation of the lesser described indigenous languages of Northern Eurasia. The INEL Nganasan corpus consists of two parts. The glossed (searchable) part of the corpus includes texts provided with source media files (whenever available) and annotated transcripts. The archival part of the corpus contains non-glossed texts, represented either by audio recordings (optionally – with preliminary transcriptions) or scanned pages of the manuscripts or publications. The corpus includes texts recorded between 1933–2019 in Nganasan. The sources of the corpus are:
  • Audio recordings done by Maria Brykina, Valentin Gusev, Sándor Szeverényi and Beáta Wagner-Nagy.
  • Legacy audio recordings done by A. Aksyonova, Svetlana S. Aksyonova, Josefina Budzisch, Michael Daniel, Oksana E. Dobzhanskaya, Eugene Helimski, Nadezhda T. Kosterkina, Jean-Luc Lambert, Marina D. Lyublinskaya, N. A. Popov, Florian Sobanski, Eugénie Stapert, Larisa Y. Turdagina, Zsuzsa Várnai, Peter Voliak, Tatjana Zhdanova and possibly other people.
  • Legacy manuscript transcriptions done by Ekaterina P. Boldt, Eugene Helimski, Nadezhda T. Kosterkina, I. E. Machkinis, E. P. Nojfeld, A. K. Stolyarova, Natalia M. Tereshchenko and Tatjana Zhdanova.
  • Texts published by Ekaterina P. Boldt, I. E. Machkinis, Tibor Mikola, Georgij N. Prokofiev and A. K. Stolyarova.

Access to the corpus via the Center for sustainable research data management:
  • Download the corpus as a zip archive incl. audio and video materials (75.5 GB), only with audio in WAV format (60.5 GB), with audio in mp3 format (13.2 GB) und without any media sources (119.5 Mb)
  • Online search using Tsakorpus
  • Documentation
  • Complete Overview of corpus files and metadata (or see below)
  • Remote search using EXAKT (EXMARALDA Anaylsis- and concordance software).

  • Download Online (Tsakorpus)

    Cite Brykina, Maria; Gusev, Valentin; Szeverényi, Sándor; Wagner-Nagy, Beáta. INEL Nganasan Corpus. Version 1.0. Publication date 2025-05-02. https://hdl.handle.net/11022/0000-0007-FE63-C. Archived at Universität Hamburg. In: The INEL corpora of indigenous Northern Eurasian languages. https://hdl.handle.net/11022/0000-0007-F45A-1

    Impressum | Datenschutzerklärung | Sitemap