home edit page issue tracker

This page pertains to UD version 2.

Treebank Statistics: UD_Old_East_Slavic-Ruthenian: Features: Gender

This feature is universal. It occurs with 3 different values: Fem, Masc, Neut.

47294 tokens (49%) have a non-empty value of Gender. 12764 types (80%) occur at least once with a non-empty value of Gender. 4299 lemmas (80%) occur at least once with a non-empty value of Gender. The feature is used with 8 part-of-speech tags: NOUN (19999; 21% instances), DET (7376; 8% instances), ADJ (6415; 7% instances), PROPN (5863; 6% instances), PRON (4822; 5% instances), VERB (2212; 2% instances), NUM (432; 0% instances), AUX (175; 0% instances).

NOUN

19999 NOUN tokens (100% of all NOUN tokens) have a non-empty value of Gender.

The most frequent other feature values with which NOUN and Gender co-occurred: Number=Sing (13333; 67%).

NOUN tokens may have the following values of Gender:

Paradigm племяMascFemNeut
Case=Datплемени
Case=Genплемени
Case=Nomплемѧплемѧ

Gender seems to be lexical feature of NOUN. 100% lemmas (1380) occur only with one value of Gender.

DET

7376 DET tokens (100% of all DET tokens) have a non-empty value of Gender.

The most frequent other feature values with which DET and Gender co-occurred: Number=Sing (4551; 62%), Poss=EMPTY (4145; 56%).

DET tokens may have the following values of Gender:

Paradigm нашъMascFemNeut
Animacy=Anim|Case=Acc|Number=Singнашого, нашег(о), нашего, нашог(о), н(а)шого, нашго, нашѣг(о)
Animacy=Anim|Case=Acc|Number=Plurнаших, нашых, нашихъ
Case=Acc|Number=Singнашъ, наш, н(а)шъ, нашь, н(а)шьнашу, нашꙋ, нашю, н(а)шу, н(а)шꙋнашо, н(а)шо, наше, н(а)ше
Case=Acc|Number=Plurнаши, нашы, шинаши, н(а)ши, нашынаши, наша, нашые
Case=Dat|Number=Singнашому, нашомꙋ, нашему, н(а)шому, нашемꙋ, н(а)шомꙋ, нашемоу, н(а)ш(е)му, н(а)ш(о)му, нашем(у), нашѣмоунашои, нашеи, нашой, н(а)шоинашому, н(а)шому, нашомꙋ, нашѣмоу
Case=Dat|Number=Plurнашим, нашимъ, нашым, н(а)шимъ, нашымъ, н(а)шим, н(а)шым, на[шимнашим, нашимъ, нашымнашим, нашымъ, нашимъ, н(а)шим, нашым
Case=Gen|Number=Singнашого, нашог(о), нашего, нашег(о), н(а)шого, н(а)шог(о), нашѣг(о), н(а)ш(о)г(о), н(а)ш(о)го, нашѣгонашое, нашее, н(а)шое, н(а)шее, нашей, нашоинашого, нашег(о), н(а)ш(о)го, н(а)шого, нашог(о), нашѣго
Case=Gen|Number=Plurнаших, нашых, нашихъ, н(а)ших, нашыхъ, на[ш]ихнаших, н(а)шихънаших, нашихъ, нашых
Case=Ins|Number=Singнашим, нашимъ, нашым, нашымъ, н(а)шимъ, н(а)шим, н(а)шымъ, н(а)ш(и)мъ, н(а)шым, нашомънашою, н(а)шою, нашею, нашѣюнашим, нашимъ, нашым
Case=Ins|Number=Plurнашими, нашыми, н(а)шими, наш[ими]нашими, нашеми, нашыми, шыминашими, наши, нашыми
Case=Loc|Number=Singнашом, нашомъ, нашем, нашемъ, н(а)шомъ, нашѣмнашои, нашой, н(а)шои, нашее, нашей, нашоі, нашѣинашомъ, нашом
Case=Loc|Number=Plurнаших, нашыхнаших, н(а)ших, нашихьнашых
Case=Nom|Number=Singнаш, нашъ, нашь, н(а)шъ, н(а)шьнаша, наш(а), н(а)ша, нащанаше, нашѣ, н(а)ше, н(а)шо, нашо
Case=Nom|Number=Plurнаши, нашы, н(а)шинашинаши, Наша

ADJ

6415 ADJ tokens (100% of all ADJ tokens) have a non-empty value of Gender.

The most frequent other feature values with which ADJ and Gender co-occurred: Degree=Pos (5799; 90%), Variant=EMPTY (5738; 89%), Number=Sing (4483; 70%).

ADJ tokens may have the following values of Gender:

Paradigm полоцкийMascFemNeut
Animacy=Anim|Case=Acc|Number=Singполоцкого, полоцъкого, полоцког(о), полоцького, пол(о)цког(о)
Animacy=Anim|Case=Acc|Number=Plurполоцких, полоцкихъ, полоцъкихъ, полоцъких, полоцькихъ
Case=Acc|Number=SingПолоцкии, Полочькиполоцкую, Полочьскую, полоцъкуюПолоцъкое, полоцкое
Case=Acc|Number=Plurполоцькыи, поцькыиполоцкии, полоцкие
Case=Acc|Number=Plur|Variant=Shortполоцьки
Case=Dat|Number=Singполоцкомꙋ, полоцкому, полоцъкому, полоцъкомꙋ, пол(оцкому), полоцкомъполоцкои, ПолоцъкоиПолоцкомꙋ, Полоцкому
Case=Dat|Number=Plurполоцким, полоцкимъ, полоцъкимъ, полоцкым, полѡтцкымъ
Case=Gen|Number=Singполоцкого, полоцког(о), полоцъкого, полоцьког(о), полотского, полоцького, пол(о)цког(о), полотског(о), полотьского, полочьког(о), Полоцого, пол(о)цьког(о), полоцкаг(о), полоцкго, полоцкогѡ, полочькогополоцкое, Полоцъкое, Полоцкои, ПолоцькоеПолоцкого, Полоцког(о), Полоцъкого, Полоцького, Пол(о)цког(о), Полоцьког(о), Полоцкѡг(о)
Case=Gen|Number=Plurполоцких, полоцкых, полоцкихъ, полоцъкихъ, полоцъких, полоцькых, пол(о)цкых, полоцкыхъ, по[лоцк]ых, пол(о)цких, пол(о)цькых, пололоцких, полоцьких, полоцькыхъ, полочькиихполоцъких, полоцких, полоцъкихъ, Полоцкое, полоцкихъ
Case=Ins|Number=Singполоцким, полоцкимъ, полоцкымъ, полоцъкимъполоцкою, полоцъкоюПолоцкимъ, Полоцъкимъ
Case=Ins|Number=Plurполоцкими, полоцькими, полоцъкимиполоцкимиполоцъкими
Case=Loc|Number=Singполоцком, Полоцкомъ, Полоцъкомъ, Пол]оцкомъПолоцкоиПолоцъкомъ, Полоцкомъ, Полоцком, Полоцъком
Case=Loc|Number=Plurполоцких
Case=Loc|Number=Plur|Variant=Shortполочьскы
Case=Nom|Number=Singполоцкии, полоцъкии, полоцкыи, полоц(кии), полоцкий, полоцькыи, пол(оцкии), полоцькии, Полѡтьцкыи, полотскии, полоцкіи, полочькииполоцкаѧ, Полоцкая, Полоцькая, Полочькаѧ, Полочьскаѧ, полоцъкаѧПолоцкое, Полоцькое
Case=Nom|Number=Sing|Variant=Shortполоцъкы
Case=Nom|Number=Plurполоцкии, полоцкие, полоцькыи, полоцъкие, пол(о)цкыи, полоцкыи, полоцъкии, поцькыи, полоцкиѣ, пол(о)цкые, полоцкые, полоцъкииеполоцкии

PROPN

5863 PROPN tokens (100% of all PROPN tokens) have a non-empty value of Gender.

The most frequent other feature values with which PROPN and Gender co-occurred: Number=Sing (5582; 95%), NameType=Giv (2953; 50%).

PROPN tokens may have the following values of Gender:

Paradigm ВасильMascFem
Animacy=Anim|Case=AccВасилѧ, Василя, Василья, Васильѧ
Case=DatВасилю, Василью
Case=GenВасилѧ, Василья, Василиѧ, Васильѧ, Василя
Case=NomВасилеи, Васил(ь), ВасильВасил(ь)

Gender seems to be lexical feature of PROPN. 99% lemmas (1573) occur only with one value of Gender.

PRON

4822 PRON tokens (69% of all PRON tokens) have a non-empty value of Gender.

The most frequent other feature values with which PRON and Gender co-occurred: Number=Sing (3701; 77%), Person=3 (2805; 58%), PronType=Prs (2805; 58%).

PRON tokens may have the following values of Gender:

Paradigm онъMascFemNeut
Animacy=Anim|Case=Acc|Person=3|PronType=Prsег(о)
Case=Acc|Person=3|PronType=Prsего, него, ег(о), нѣго, ѥго, нег(о)
Case=Dat|Person=3|PronType=Prsему, емꙋ, емоу, ѥму, нему, нѣмоу, му, немоу, немꙋ
Case=Dat|PronType=Relемꙋ
Case=Gen|Person=3|PronType=Prsего, ег(о), него, нег(о), нѣго, го, е]г(о), ниго, нѣг(о), нѣгo
Case=Ins|Person=3|PronType=Prsним, нимъ
Case=Loc|Person=3|PronType=Prsнем, немъ, нѣмего
Case=Nom|Person=3|PronType=Prsѡн, ѡнъ, онъ, он, енъ

VERB

2212 VERB tokens (27% of all VERB tokens) have a non-empty value of Gender.

The most frequent other feature values with which VERB and Gender co-occurred: Mood=EMPTY (2212; 100%), Person=EMPTY (2211; 100%), Tense=Past (2187; 99%), Number=Sing (2034; 92%), Analyt=EMPTY (1874; 85%), VerbForm=PartRes (1565; 71%), Voice=Act (1534; 69%), Aspect=Perf (1140; 52%).

VERB tokens may have the following values of Gender:

Paradigm метиMascFemNeut
Analyt=Yes|Aspect=Impмел
Analyt=Yesмелъмѣло
Aspect=Impмелъ
мел, мелъ, мял, мѣлъмела

NUM

432 NUM tokens (47% of all NUM tokens) have a non-empty value of Gender.

The most frequent other feature values with which NUM and Gender co-occurred: NumForm=Word (356; 82%), NumType=Card (319; 74%).

NUM tokens may have the following values of Gender:

Paradigm дваMascFemNeut
Case=Acc|NumType=Cardдвадве, двѣдве, два
Case=Acc|NumType=Fracдвѣ
Case=Dat|NumType=Fracдвѣ
Case=Gen|NumType=Cardдву, двоу, двух, двꙋхъдвꙋ, дву, двух
Case=Ins|NumType=Cardдвѣмадвема
Case=Loc|NumType=Cardдву, двꙋхъдвоу
Case=Nom|NumType=Cardдвадведва
Case=Nom|NumType=Fracдвѣ

AUX

175 AUX tokens (11% of all AUX tokens) have a non-empty value of Gender.

The most frequent other feature values with which AUX and Gender co-occurred: Mood=EMPTY (175; 100%), Number=Sing (175; 100%), Person=EMPTY (175; 100%), Tense=Past (175; 100%), VerbForm=PartRes (175; 100%), Voice=Act (175; 100%), Analyt=Yes (89; 51%).

AUX tokens may have the following values of Gender:

Paradigm бытиMascFemNeut
Analyt=Yesбыл, былъбылабыло
был, былъбылабыло

Relations with Agreement in Gender

The 10 most frequent relations where parent and child node agree in Gender: NOUN –[det]–> DET (6044; 99%), NOUN –[amod]–> ADJ (4922; 99%), NOUN –[conj]–> NOUN (2352; 65%), NOUN –[appos]–> PROPN (1453; 91%), PROPN –[flat:name]–> PROPN (1381; 99%), NOUN –[appos]–> NOUN (1295; 76%), PROPN –[conj]–> PROPN (643; 92%), ADJ –[conj]–> ADJ (403; 87%), NOUN –[nummod]–> NUM (255; 73%), PROPN –[appos]–> NOUN (228; 79%).