Das Korpus beinhaltet Audioaufnahmen und Manuskripte sowie deren (im Fall der Audioaufnahmen) zeit-alignierte, annotierte und glossierte Transkripte des Ewenkischen (als Teil der Tungusischen Sprachfamilie) und ist in der Version 1.0 unter
Open-Access-Bedingungen zugänglich.
Es entstand im Rahmen des INEL-Teilprojekes
Ewenkisch (2019-2021) und
leistet einen entscheidenden Teil zur Beschreibung und Analyse wenig dokumentierter indigener Sprachen des nordeurasischen Areals. Dabei deckt es nördliche (Taimyr, Khantayskoe Ozero, Ilimpi, Erbogachon) und südliche (Sym) Dialekte des Ewnkischen ab, die mit anderen Sprachen im Fokus des INEL Projektes (vornehmlich dem Dolganischen und Selkupischen) in Kontakt standen bzw. bis zum heutigen Tag stehen.
Das Korpus setzt sich zusammen aus den folgenden Quellen:
- Publizierte Texte verschiedener Sammlungen, vornehmlich "Sbornik materialov po evenkijskomu (tungusskomu) fol'kloru" (Vasilevich 1936), welche alle genannten Dialekte des Ewenkischen abdecken.
- Transkripte von Audioaufnahmen, die durch das Taimyr House of National Arts (TDNT) in Dudinka (2000er Jahre) und von Tat’yana V. Bolina bereitgestellt wurden und die jeweils den Khantayskoe Ozero Dialekt repräsentieren.
- Texte aus dem Handschriftarchivs des russischen Ethnographen und Linguistien Konstantin M. Rychkov welche in den 1900er/1910er Jahren entstanden und die Dialekte Taimyr, Ilimpi and Sym abdecken.
Alle Texte des Korpus enthalten morphologische Glossierungen, Übersetzungen ins Englische und Deutsche sowie Annotationen für Entlehnungen aus dem Russischen.
Eine Auswahl von Texten verfügt zudem über Annotationen Syntaktischer Funktionen, Semantischer Rollen und Informationsstatus.
Zugang über das Zentrum für nachhaltiges Forschungsdatenmanagement der Universität Hamburg:
The corpus contains audio recordings and manuscripts as well as their (in the case of the audio recordings) time-aligned, annotated, and glossed transcripts of Evenkian (as part of the Tungusic language family) and is accessible in version 1.0 under Open Access conditions.
It was created as part of the INEL subproject Evenki (2019-2021) and makes a crucial contribution to the description and analysis of poorly documented indigenous languages of the North Eurasian area.
It covers northern (Taimyr, Khantayskoe Ozero, Ilimpi, Erbogachon) and southern (Sym) dialects of Evenki, which have been in contact with other languages in the focus of the INEL project (mainly Dolgan and Selkup) or still are.
The corpus is composed of the following sources:
- Published texts of various collections, primarily "Sbornik materialov po evenkijskomu (tungusskomu) fol'kloru" (Vasilevich 1936), which cover all the mentioned dialects of Evenki
- Transcripts of audio recordings provided by the Taimyr House of National Arts (TDNT) in Dudinka (2000s) and by Tat'yana V. Bolina, each representing the Khantayskoe Ozero dialect.
- Texts from the manuscript archive of the Russian ethnographer and linguist Konstantin M. Rychkov which were written in the 1900s/1910s and cover the Taimyr, Ilimpi and Sym dialects.
All texts in the corpus contain morphological glosses, translations into English and German, and annotations for borrowings from Russian.
A selection of texts also has annotations of syntactic functions, semantic roles, and information status.
Access to the corpus via the Center for sustainable research data management: