ПРИНЦИПЫ АКУСТИКО-ФОНЕТИЧЕСКОЙ ТРАНСКРИПЦИИ
ЗВУЧАЩИХ ТЕКСТОВ

Одной из первостепенных задач функционального моделирования процессов восприятия речи человеком является выработка алгоритмов преобразования непрерывного речевого акустического сигнала в линейную последовательность лексических единиц. Для этого, прежде всего, надо хорошо представлять себе, с каким именно сигналом имеет дело каждый носитель языка, что именно поступает на вход системы восприятия речи. И в первую очередь - в процессе естественного речевого общения, т.е. необходимо знать, что собой представляет спонтанная речь в ее акустическом проявлении.

Исходя из этого фонеическая транскрипция ззвучащих текстов, представленная на этом сайте, производилась с максимальной опорой на акустические параметры речевого сигнала при максимально возможом снятии влияния лексико-грамматических знаний оператора, производящего транскрипцию.

Поскольку в дальнейшем результаты подобной разметки текстов предполагается обрабатывать с использование компьютеров, для описания сегментов не используются символы, требующие специальных наборов шрифтов. Вместо этого принята система, аналогичная набору SAMPA, используемому для отображения символов международной фонетической транскрипции в системе ANSII.

В результате получились следующие наборы символов:

ГласныеСимволы (латиница)
Между твердымиПосле или между мягкого(ими)Перед мягким
aa a:aI
oo o:oI
эe e:eI
иi ii
ыQ -Q
уu u:uI
шва@ @@I

Излишне долго произнесенные гласные маркируются символом «#».

В основном для маркирования согласных используется их латинская транслитерация, а кроме того:


СогласныеСимволы (латиница)
ГлухиеЗвонкие и озвонченные
ж- Z
цc D
хx h
чC G
шS -
щ$ Z'

Мягкость согласных маркируется символом «'» после согласного.

Помимо этого при разметке текстов используются следующие маркеры: «(нрзб)» - для неразборчиво произнесенных слов или фраз; «(ансмбл)» - для одновременной речи нескольких дикторов; «pause» - глухие паузы; «inh» - вдохи; «(gst)» - гортанная смычка или участки ларингализации; «(pXX)» - краткие паузы (ХХ -длительность в мс).

В орфографической записи звучащих текстов по аналогии с основным корпусом используются "составные" слова (то_есть, потому_что и т.п), которые в фонетической трансрипции будут представлены единой "словоформой". Помимо этого, при фонетическом транскрибировании дополнительно возникают "составные" словоформы при наличии стяжения гласных или согласных на стыке соседних словоформ (если_они[jEsl'&n'i]). Следует учитывать это обстоятельство при формировании запроса.

Все результаты поиска выдаются на одну страницу и могут быть сохранены либо как web-страница, либо скопированы через буфер обмена. В конце каждой строки протокола дается длительность соответствующего отрезка речевого сигнала в миллисекундах.

 
E-mail Home