Уважаемый пользователь!
В
настоящее время Вы имеете возможность работать со сбалансированным корпусом
текстов объемом более 1-го млн. словоупотреблений. Все тексты корпуса
акцентуированы (в них проставлено основное и вторичное ударение), а также
восстановлена в правах буква «ё».
По
корпусу создан частотный словарь акцентуированных словоформ, насчитывающий
около 125 тыс. единиц.
Акцентуированный корпус:
- поиск в словаре словоформ;
- частотный словарь акцентуированных словоформ
за исключением имен собственных (файл в формате Excel);
- создание конкорданса по текстам корпуса;
- создание конкорданса по текстам речевого корпуса (лучше - в Корпусе русской устной речи).
При обращении к словарю пользователь может задавать для поиска слово без
символов акцентуации. В этом случае ему будут выданы все имеющиеся в словаре
варианты заданного слова. Например, при запросе «чем» будут выданы следующие
три варианта: «че+м» - местоимение, «че^м» - союз и «чем» - местоимение в
сочетании «не+ с чем», когда по правилам орфоэпии ударение переносится на
предлог.
Если при запросе установить флажок «не раличать е и ё», то будут выданы
все имеющиеся варианты, как с «е», так и с «ё». Например, при запросе
«села» и установленном флажке в ответ пользователь получит три варианта:
«се+ла», «села+» и «сё+ла». В этих условия
такие же ответы будут выданы и при запросе «сёла».
Поскольку
тексты, включенные в корпус, и составленнный на их основе частотный словарь
содержат составные слова (см. об этом в разделе Морфология),
предусмотрена возможность поиска составных слов, содержащих слово, заданное в запросе.
Для этого следует задействовать опцию «искать и в составных словах». Теперь
при запросе, скажем, слова «другом» в ответах пользователь найдет
«дру+гом», «друго+м» и множество составных слов типа
«дру+г__за__дру+гом», «дру+г__с__дру+гом» и т.д.
В
ответ на свой запрос пользователь получает таблицу, содержащую имеющиеся в
словаре слова с их частотами по жанрам текстов, представленных в корпусе, и
по всему корпусу в целом.
Помимо
работы с частотным словарем пользователю предоставляется возможность создания
конкорданса, т.е. набора примеров-цитат из текстов корпуса, содержащих заданное
в запросе слово. На каждое слово будет выдана строка, содержащая это слово,
а также две предшествующие и две следующие строки. С конкордансом пользователь
имеет возможность работать либо непосредственно с сайта, либо может сохранить
выданную броузером страницу для последующего анализа офф-лайн. Правила создания
запроса примерно такие же, как при поиске в частотном словаре.
При работе с
текстами драмы возможны расхождения между частотами словоформ, полученными по словарю
и конкордансу: при создании словаря тексты авторских ремарок были отнесены к жанру
беллетристики, а программа создания конкорданса этого не учитывает.
Различается
работа с нижним-верхним регистром: если запрос задан только в нижнем регистре,
программа работает в режиме игнорирования регистра; если слово запроса начинается в верхнем
регистре, выдаются только реализации запрошенного слова.
|