Для чего нужны корпуса текстов?

Они используются для статистического анализа и проверки статистических гипотез, подтверждения лингвистических правил в данном языке. Корпус текстов является предметом исследования корпусной лингвистики.

Какой корпус текстов был первым?

Первым большим компьютерным корпусом считается Брауновский корпус (БК, англ. Brown Corpus, BC), который был создан в 1960-е годы в Университете Брауна и содержал 500 фрагментов текстов по 2 тысячи слов в каждом, которые были опубликованы на английском языке в США в 1961 году.

Чем корпус отличается от электронной библиотеки?

Национальный корпус, в отличие от электронной библиотеки, — это не собрание «интересных» или «полезных» текстов; это собрание текстов, интересных или полезных для изучения языка.

Для чего нужны корпусы в лингвистике?

Корпус создается для того, чтобы эти тексты изучать, но для этого с ними надо провести некоторые операции. ... Эта информация обычно на техническом языке, в корпусной лингвистике называется разметка, или аннотация. Собрание текстов в электронном виде, сопровожденное разметкой, называется корпусом, независимо от его объема.

Для чего нужна программа менеджер корпуса?

Корпусный менеджер может сообщать разного рода статистическую информацию по корпусу: например, строить частотный словарь употребления той или иной единицы текста. Все эти данные используются лингвистом при описании языка в целом либо при исследовании отдельного явления.

Сколько слов в Национальном корпусе русского языка?

Общий объём корпуса — 11 млн слов.

Что такое корпус текстов?

Корпус – это собрание текстов в электронной форме, в котором можно осуществлять поиск слов, словосочетаний, грамматических форм, значений слов с помощью определенной поисковой системы. ... В перспективе Нацио- нальный корпус русского языка должен содержать тексты общим объемом порядка 200 миллионов словоупотреблений.

Что такое корпус текстов и корпус звучащей речи?

О Корпуса звучащей речи, которые называют также речевыми базами данных, представляют собой важнейший тип языковых ресурсов. В состав корпуса часто включают и компьютерные программы, которые обеспечивают создание, сбор, организацию и управление собственно языковыми, в том числе и фонетическими, ресурсами.

Что такое корпус в доме?

Номер корпуса присваивается зданиям, если некоторые из них не имеют прямого выхода на улицу, то есть находятся во дворе. Зданию, имеющему выход на улицу, присваивается корпус 1, а остальным — тот же номер дома и следующие номера корпусов.

Что такое корпуса?

Корпус — туловище человека или животного, тело без головы и конечностей. Корпус — несущая оболочка чего-либо: Корпус корабля.

Как отбираются тексты для корпуса?

В состав корпуса текстов отбираются фрагменты из справочной и учебной литературы, научные статьи и рефераты, посвященные определенной тематике. По назначению выделяют исследовательские и иллюстративные корпусы. Исследовательские корпусы создаются с целью изучения различных аспектов функционирования языка.

Что такое информационные технологии в лингвистике?

Анализируя определение понятия «информационные технологии» в лингвистике, следует отметить что информационные технологии в лингвистике — это совокупность законов, способов и средств получения, хранения, передачи, распространения, преобразования информации о языке и законах его функционирования с помощью компьютеров.

Что такое корпусное исследование?

Корпусное исследование - это больше, чем методика анализа», - считает В. А. Плунгян [3]. Это направление представлено лингвистами, не только использующими корпусные методы или данные в своей работе, но и создающими и аннотирующими корпусные ресурсы (см., например, НКРЯ [4]).

Что такое корпусный менеджер?

Корпусный менеджер – это специализированная поисковая система, включающая программные средства для поиска данных в корпусе, получения статистической информации и предоставления результатов пользователю в удобной форме.

Что такое корпусная грамматика?

Русграм (Корпусно-ориентированная грамматика русского языка) – это проект написания новой современной грамматики русского языка. Проект существует уже около пяти лет. Части грамматического описания доступны по адресу www.rusgram.ru.

Интересные материалы:

Что делать если кошка не спит?
Что делать если кошка ничего не ест?
Что делать если кошка очень сильно линяет?
Что делать если кошка орет без причины?
Что делать если кошка плохо ест?
Что делать если кошка постоянно чешет уши?
Что делать если кошка постоянно прячется?
Что делать если кошка привередлива в еде?
Что делать если кошка съела целлофановый пакет?
Что делать если кошка сильно чешется?