Важно!
Варианты морфологического разбора генерируются автоматически с использованием двух различных подходов:
- (только для шорского корпуса) экспериментальной модели, включающей словарь, описание фонологии и морфосинтаксиса, реализуемой в виде т.н. «конечного преобразователя» (finite-state transducer);
- при помощи наивного алгоритма, моделирующего морфологическую интуицию первокурсника; правильность разбора зависит от размера корпуса, его диалектной однородности и количества в нем разных словоформ, образованных от каждой основы (чем это количество больше, тем выше вероятность правильного разбора конкретной формы); в большинстве случаев приемлемый вариант присутствует в списке.
Справка
В списках правых и левых соседей, а также на графе показываются не более 12 слов (для просмотра всех соседей используйте ссылку «показать все» в конце списка). После соответствующего слова в скобках указывается количество его употреблений в данной позиции.
В качестве примеров в контексте случайным образом отбираются не более 7 предложений. Для просмотра всех употреблений слова в конкретном тексте щелкните по числу в графе «Количество употреблений» в таблице.
Условия использования
Вы можете свободно использовать небольшие (как правило, 1—3 предложения) отрывки из представленных в корпусе текстов в качестве примеров или иллюстраций.
Если вы хотите воспроизвести в какой-либо форме более крупные фрагменты либо полные тексты, вам необходимо обратиться к руководителю проекта для согласования условий.
При любом использовании материалов сайта обязательна ссылка на «Корпусы ИЭА РАН», при цитировании текстов обязательно указывать название и имя исполнителя.