Cite Budzisch, Josefina; Wagner-Nagy, Beáta. 2024. INEL Nenets Corpus. Version 1.0. Publication date 2024-12-31. https://hdl.handle.net/11022/0000-0007-FE37-E. Archived at Universität Hamburg. In: The INEL corpora of indigenous Northern Eurasian languages. https://hdl.handle.net/11022/0000-0007-F45A-1

Nenzisch

Nenets

Das INEL-Nenzisch-Korpus wurde im Rahmen des Langzeitprojekts INEL („Grammatical Descriptions, Corpora and Language Technology for Indigenous Northern Eurasian Languages“, 2016–2033) erstellt. Es umfasst Texte aus den Jahren 1940 bis 2011, die in beiden nenzischen Lekten – Waldnenzisch und Tundranenzisch – aufgezeichnet wurden. Der Großteil der Texte stammt aus veröffentlichten Werken, die in den entsprechenden Abschnitten der Metadaten zitiert werden. Besonders berücksichtigt wurden folgende Publikationen (die vollständigen bibliografischen Angaben finden sich im Referenzteil der Dokumentation):
  • Barmich 2018
  • Burkova 2008
  • Burkova 2012
  • Burkova et al. 2003
  • Hajdú 1968
  • Koshkareva et al. 2007
  • Labanauskas 2001
  • Logany & Logany 2016
  • Lyubinskaya 2022
  • Pusztay 1976
  • Tereshchenko 1956
  • Tereshchenko 1990
  • Turutina 2003
  • Yangasova 2018
Svetlana Burkova stellte zudem eine Sammlung waldnenzischer Daten zur Verfügung, darunter eine Originaltonaufnahme des Agan-Dialekts, Transkripte und Glossen als Toolbox-Dateien sowie Word-Dokumente mit Texten aus den Agan- und Pur-Dialekt. Alle Texte sind mit interlinearen Morphem-zu-Morphem-Glossen versehen und in Englisch, Deutsch und Russisch übersetzt. Zusätzlich ist für einen der Texte eine Audioaufnahme verfügbar.

Zugang über das Zentrum für nachhaltiges Forschungsdatenmanagement der Universität Hamburg:
The INEL Nenets corpus has been created within the long-term INEL project ("Grammatical Descriptions, Corpora and Language Technology for Indigenous Northern Eurasian Languages"), 2016–2033. The corpus includes texts recorded between 1940–2011 in both Nenets lects – Forest Nenets and Tundra Nenets. The majority of texts in this corpus originate from published works, which are appropriately cited in the relevant sections of the metadata. In particular, the following publications were used, the full information can be found in the reference section of the documentation:
  • Barmich 2018
  • Burkova 2008
  • Burkova 2012
  • Burkova et al. 2003
  • Hajdú 1968
  • Koshkareva et al. 2007
  • Labanauskas 2001
  • Logany & Logany 2016
  • Lyubinskaya 2022
  • Pusztay 1976
  • Tereshchenko 1956
  • Tereshchenko 1990
  • Turutina 2003
  • Yangasova 2018
Svetlana Burkova kindly shared a collection of her Forest Nenets data including an original sound recording (Agan dialect), transcripts and glosses as Toolbox files and Word documents (Agan and Pur dialects), as well as published texts in Pur (Turutina 2003) and Numto (Logany & Logany 2016) dialects.
All texts in the corpus are provided with interlinear morpheme-by-morpheme glosses and translation into English, German and Russian. Audio recording is also provided for one text.
Access to the corpus via the Center for sustainable research data management:
  • Download the corpus as a zip archive incl. audio materials (248.1 MB), with audio in mp3 format (215.1 MB) und without any media sources (34.6.5 MB)
  • Online search using Tsakorpus
  • Documentation
  • Complete Overview of corpus files and metadata (or see below)
  • Remote search using EXAKT (EXMARALDA Anaylsis- and concordance software).

  • Download Online (Tsakorpus)

    Cite Budzisch, Josefina; Wagner-Nagy, Beáta. 2024. INEL Nenets Corpus. Version 1.0. Publication date 2024-12-31. https://hdl.handle.net/11022/0000-0007-FE37-E. Archived at Universität Hamburg. In: The INEL corpora of indigenous Northern Eurasian languages. https://hdl.handle.net/11022/0000-0007-F45A-1

    Impressum | Datenschutzerklärung | Sitemap