Файл: Язык, его функции, знаковая природа, системная организация, уровневая структура. Дихотомия языкаречи. Текст как продукт речи.docx

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 29.11.2023

Просмотров: 88

Скачиваний: 3

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

  • признаки фонации

  • отсутствие/наличие голоса:

  • разведенные связки (глухой)

  • сведенные связки (звонкий)

  • тип голоса:

  • нейтральный (все языки)

  • напряженный (например, тайский)

  • слабый (яванский)

  • придыхательный (например, хинди)

  • скрипучий (например, бирманский)

  • аспирация:

  • аспирированный отступ (связки начинают колебаться позже момента рекурсии согласного, и возникает шум – легкий краткий выдох)

  • неаспирированный отступ

Универсальные признаки согласных

  • признаки артикуляции:

  • место образования

  • способ образования

  • признаки сложных дополнительных артикуляций

Универсальные признаки гласных

  • признаки фонации:

  • тип голоса

  • признаки артикуляции:

  • признаки язычной артикуляции (ряд и подъем)

  • признаки дополнительной артикуляции

  • лабиализованность

  • ширина глотки (нейтральная ↔ расширенная/суженная): африканские, казахский, монгольский)

  • ретрофлексность – приподнятость кончика языка к альвеолярной области (например, амер. bird, heard)

  • назализованность

  • признаки сложных типов артикуляции:

  • монофтонги

  • дифтонги (сложные двукомпонентные гласные; Обычно в составе дифтонгов один из компонентов является слоговым: low [loʊ] ear [ɪə]

  • (трифтонги) fire [faɪ̯ə̯]

  • количественно-динамические признаки:

  • долгота

  • долгие/краткие

  • напряженность

  • напряженные/ненапряженные




  1. Акустическая фонетика. Физические характеристики звука (частота, сила, спектральный состав, длительность) и восприятие их человеком.

Акустическая фонетика

Акустическая фонетика = речевая акустика (от греч. akustikos — слуховой, слышимый) изучает структуру речевого сигнала, речь с физической точки зрения.

Имеет особое значение для речевых технологий, автоматического анализа и синтеза речи

1. Физические характеристики звуков

Характеристики звуков:

частота

сила (интенсивность)

спектр (спектральный состав)

длительность (количественная характеристика)

Характеристики:

Объективные и субъективные

  • частота

      • высота

  • сила (интенсивность)

      • громкость

  • спектр (спектральный состав)

      • тембр

  • длительность (колич. характ-ка)


-частота – это число колебательных движений, полных колебательных циклов в единицу времени (Гц). Субъективное восприятие - высота.

-сила (интенсивность). Определяется его мощностью. Мощность звука – это энергия, которая излучается источником в единицу времени (Вт). Интенсивность или сила звука – это мощность звуковой волны (децибелы). Субъективное восприятие – громкость. Громкость звука зависит не только от интенсивности, но и от частот колебаний: более высокие звуки при той же интенсивности воспринимаются как более громкие.

- спектр (спектральный состав) – это относительная амплитуда всех его частотных составляющих. Субъектное восприятие спектра называется тембром. Спектральный анализ сложных звуков к получению значений частот и амплитуд простых тонов (гармоник), из которых состоит комплексный звук.


- длительность. Длительность (количественная характеристика) – время звучания. Обычно не менее 25 мс. В среднем — от 0,040 до 0,200 с.

абсолютная д-ть

относительная д-ть

Субъективно звуки могут восприниматься как долгие и краткие.


  1. Чистый тон и комплексный звук. Спектр звуков речи. Резонанс и резонаторы. Спектральный анализ речи.

Речевые звуки представляют собой комплексные колебания, то есть сложнейшие сочетания простых или чистых тонов и/или шумов. Простой тон — это периодическое колебание, которое имеет только одну частоту колебания. Иначе простое периодическое колебание называется гармоническим. Звуков такого рода в природе не существует, хотя имеются звуки, очень близкие чистому тону. К ним относится, например, звук, издаваемый камертоном. Если ударить по ножке камертона, то его усы (рожки) начинают смещаться из нейтрального положения, затем возвращаются в исходное положение под воздействием силы эластичности, затем, вследствие инерции, продолжают движение через точку покоя, затем обратно и т.д. Большинство источников производят не простые, а сложные (комплексные) колебания, то есть колебания, характеризующиеся наличием более чем одной частоты. Так, например, при колебании струны колеблется не только вся она целиком, но и ее половина, четвертая часть и т.п.

Все речевые звуки являются сложными. Комплексные колебания могут быть 1) (квази)периодическими, то есть имеющими регулярно повторяющуюся модель, и 2) непериодическими (у них отсутствует регулярное повторение модели вследствие неповторяющегося характера колебаний или быстрого их затухания).

Спектр речевого звука можно разложить на тоновую (периодическую) и шумовую (непериодическую) составляющие. Тоновые звуки образуются при участии голосовых связок, шумовые — препятствиями в полости рта. По наличию этих составляющих можно провести первую классификацию речевых звуков: • Гласные — тоновые • Глухие согласные — шумовые • Сонорные согласные — тоновые со слабой примесью шума • Звонкие согласные — шумовые с участием тона.

По форме спектра звуки речи могут быть: 1. Вокальные — невокальные. Для характеристики звука по этому признаку важно, есть ли в его спектре формантная структура, т. е. отчетливо выраженное регулярное усиление определенных частотных составляющих. Вокальными являются все гласные и сонорные согласные, невокальными — шумные согласные. 2. Консонантные — неконсонантные. Признак консонантности связан с общим уровнем энергии в спектре: звуки со слабым уровнем консонантны, звуки с высоким уровнем энергии неконсонантны. К первой группе относятся все согласные, в том числе и сонорные, ко второй группе — гласные. 3. Высокие — низкие. Для этих звуков важно, в какой части спектра преимущественно расположены составляющие — в области низких частот или высоких. Высокие — гласные переднего ряда, передне- и среднеязычные согласные, низкие — все непередние гласные, губные и заднеязычные согласные. 4. Компактные — диффузные. Компактность звука определяется относительной близостью усиленных составляющих друг к другу и одновременно к центру спектра (1000 Гц). Диффузные звуки не обладают этим качеством. Диффузные — гласные верхнего подъема, а также губные и зубные согласные. Все остальные звуки речи компактны. 5. Диезные — недиезные. Признак диезности связан с более высоким положением в спектре одной или нескольких областей усиления энергии. Диезные — мягкие согласные, а также гласные переднего ряда и те гласные, которые мы произносим между мягкими согласными. Все твердые согласные и непередние гласные недиезны. 6. Бемольные — небемольные. Бемольность — понижение всех или нескольких спектральных составляющих звука. Бемольны огубленные гласные и согласные, остальные небемольны. 7. Прерванные — непрерывные. У прерванных звуков начало отличается большим расходом энергии, который затем не возрастает. У непрерывных расход энергии относительно равномерно распределен во времени. Прерванные — смычные согласные. Непрерывные — все гласные и несмычные согласные. 8. Резкие — нерезкие. Резкие звуки — с явно выраженной неоднородностью спектра. Это аффрикаты и дрожащие согласные. Все остальные звуки речи — нерезкие. 9. Звонкие — глухие. Звонкие звуки — гласные и звонкие согласные — имеют в спектре самую низкую интенсивную составляющую (до 300 Гц), которая соответствует основному тону звука. Этот тон создается колебаниями голосовых связок. Области усиления энергии в спектре звука называются формантами. Поскольку звуки речи имеют протяженность во времени, их спектры удобно представлять с учетом трех характеристик: частоты, интенсивности и времени. На таких спектрограммах по горизонтальной оси отложена длительность, по вертикальной — частота. Об интенсивности свидетельствует степень потемнения различных участков спектрограммы.

Резонанс и резонаторы. Резонанс-Акустическое явление, при котором в результате воздействия колебаний одного тела, называемого вибратором, в др. теле, называемом резонатором, возникают аналогичные по частоте и близкие по амплитуде колебания. Наиболее полно Р. проявляется в условиях точной настройки резонатора на частоту колебаний вибратора и при хорошей (с малыми потерями энергии) передаче колебаний. В качестве резонатора может служить любой вибратор, однако на практике конструируют спец. резонаторы, оптимальные по своим характеристикам и соответствующие предъявляемым к муз. инструментам требованиям (по высоте, громкости, тембру, продолжительности звучания). Различают единичные резонаторы, отвечающие на одну частоту (резонирующая подставка камертона, резонаторы челесты, вибрафона и др.), и множественные резонаторы (деки фп., скрипок и др.).

Спектральный анализ речи. Метод установления акустической структуры звуков речи, представляющих собой сложный, непрерывно изменяющийся во времени акустический сигнал, образующийся рядом частотных составляющих с различной интенсивностью. При С. а. з. р. используются автоматически действующие электроакустические приборы спектрометры или спектрографы. Динамические спектрографы позволяют анализировать текущую речь; полученные спектрограммы отражают непрерывность перехода от одного звука к другому.


  1. Акустическая теория речи. Типы звуковых источников и фильтров. Акустическая классификация звуков.

Акустическая теория речи (АТР)

Роман Якобсон

Гуннар Фант

Моррис Халле

Начальные работы 1950-х – 1960-х гг.

В акустической теории речеобразования (АТР), создателем которой является шведский ученый Гуннар Фант, речь рассматривается как процесс фильтрации. Это означает, что речевой тракт выступает в функции фильтра, пропускающего (усиливающего) только те частоты, порожденные источником звука, которые совпадают с его собственной частотой.

Типы источников:

  • Голосовой.

  • В пределах колебания связок скорость воздушного потока постепенно нарастает (голосовая щель открывается), достигает максимума, затем убывает (голосовая щель закрывается) и некоторое время остается равной нулю (голосовая щель закрыта)

  • Шумовой.

  1. Импульсный

  2. Турбулентный


Акустические признаки звуков в АТР (всего 9)

  • вокальные – невокальные

    • гласные и сонорные ↔ согласные

  • консонантные – неконсонантные

    • согласные ↔ гласные

  • высокие – низкие

    • высокие: гласные п.р., переднеязычные согласные

  • компактные – диффузные

    • гласные неверхнего подъема, нёбные согласные ↔ гласные верхнего подъема, губные и зубные согласные

  • бемольные – небемольные

    • лабиализованные ↔ нелабиализованные

  • диезные – недиезные

    • гласные рядом с мягкими, палатализованные согласные ↔ «обычные» гласные, непалатализованные согласные

  • прерывистые (прерван.) – непрерывные

    • смычные ↔ щелевые и гласные

  • резкие – нерезкие

    • аффрикаты и дрожащие ↔ все прочие

  • звонкие – глухие

    • гласные и звонкие согласные ↔ глухие согласные




  1. Перцептивная фонетика. Работа слухового аппарата. Этапы и свойства человеческого восприятия речи. Теории восприятия речи.

Перцептивная фонетика — раздел фонетики, рассматривающий восприятие звуков речи человеческими органами слуха.

Задачи перцептивной фонетики:

  • Понять какие механизмы обеспечивают восприятие речи в естественных условиях коммуникации

  • Исследовать реакции на речевые сигналы

  • способность опознавать и различать звуковые единицы языка, слоги, слова в разных экспериментальных условиях

  • способность оценивать и интерпретировать изменение акустических характеристик речевого сигнала и др.

Этапы приема акустического сигнала:

  • первичный слуховой анализ

  • выделение акустических событий и признаков

  • лингвистическая интерпретация речевого сообщения

Слуховой аппарат человека

Три отдела слухового аппарата:

  • периферический

    • наружное, среднее, внутреннее ухо

  • проводниковый

    • нервные пути

  • центральный

    • головной мозг

Свойства наружного уха

Ушная раковина и наружный слуховой проход (около 2,5 см) – резонаторы. Усиливают звуковые частоты в диапазоне 3 000

5 000 Гц приблизительно в 2-4 раза.


Форма ушной раковины уменьшает чувствительность к волнам, поступающим сзади.

Устройство среднего уха

Костная полость, заполненная воздухом. С одной стороны ограничена барабанной перепонкой, с другой — системой внутреннего уха.

В среднем ухе находятся три слуховые косточки: молоточек, наковаленка (наковальня) и стремечко (стремя).

Колебания барабанной перепонки приводят в движение прикрепленный к ней молоточек. Его колебания передаются наковаленке и стремечку. Основание стремечка действует как поршень на жидкость, находящуюся во внутреннем ухе, вызывая в ней изменение давления.
Свойства среднего уха

При прохождении через структуры среднего уха уровень передаваемого давления увеличивается приблизительно на 30 дБ!

Наиболее эффективно передаются колебания среднего частотного диапазона (800 – 3000 Гц).

Давление воздуха в полости среднего уха равно внешнему атмосферному давлению. Нарушение этого баланса (ощущения при резком подъеме и спуске) ухудшает работу барабанной перепонки. Полость среднего уха с носоглоткой соединяет евстахиева труба, которая открывается при глотании или зевании.

Устройство внутреннего уха

Множество каналов, расположенных в височной кости, заполненных жидкостью.

Одна из костных структур имеет форму спирали и называется улиткой. Закручивается вокруг костного стержня почти три раза.

Внутри улитки вдоль всей длины проходят две мембраны. Возбуждение клеток мембран передаются окончаниям слухового нерва. Таким образом генерируются электрические импульсы.

Улитка: преобразование колебаний

Электрические импульсы передаются в кору головного мозга.

Пространственно-временной рисунок, получаемый в слуховом нерве, напоминает динамическую спектрограмму речи.

Интерпретация первичного слухового анализа

Свойства восприятия речи:

категориальность

нелинейность

Сегментация речевого сигнала

  • Выделение фрагментов со сменой источника и степени сужения речевого тракта, т. е. быстрых изменений в спектре.

  • Наиболее яркие акустические фрагменты:

    • пауза

    • звонкая пауза при произнесении звонкого смычного

    • взрыв (резкое начальное нарастание)

    • длительный шум с нерезким началом (щелевой)

    • вокализованный шум (звонкий щелевой)

    • вокальный участок (гласный или сонорный)

    • Резкие изменения в частоте и амплитуде сигнала.




Гипотезы распознавания речевого сигнала (теории восприятия речи):

Артикуляционная гипотеза (моторная теория): восприятие зависит от модели артикуляции, которую воссоздает слушающий (как бы одновременно артикулируя с говорящим).

Количественная: восприятие зависит от изменения положения артикулирующих органов при переходе от одного звука к другому.

Акустическая: восприятие зависит от акустической картины.


  1. Проблемы автоматического анализа и синтеза речи. Принципы артикуляционного и акустического синтеза. Системы Text To Speech (TTS).

Автоматический анализ и синтез устной речи

Этапы анализа и синтеза устной речи

  • понять и среагировать (анализ)

  • первичная акустическая сегментация

  • смысловая интерпретация

  • преобразовать и выдать (синтез)

  • смысловой синтез

  • акустический синтез


Генеральные проблемы:

сегментация речи

снятие омонимии (разрешение многозначности)
Трудности первичной сегментации речи

плавность речевого потока

огромное количество звуковых нюансов, специфическая сочетаемость звуков

отсутствие пауз между словами, несоответствие пауз и синтаксических единиц

наличие интонации, мелодическая изменчивость

индивидуальные особенности речи

… …
Синтез речи-1

Моделирование речевого аппарата: артикуляторный синтез

Синтез речи-2

Моделирование звукового сигнала (акустический синтез):

а) формантный синтез (по правилам),

б) компилятивный синтез
Формантный синтез

Генерация сигнала источником (синтезатором)  Фильтрация исходного сигнала, моделирование параметров голосового тракта.
Компилятивный синтез: «Склейка» речи из имеющихся единиц
Современные синтезаторы: системы Text To Speech (TTS)

Интеграция в операционные системы, мобильные телефоны, электронные книги, GPS-навигаторы

Text-to-Speech (TTS), или синтез речи, — это технология, которая преобразует печатный текст в звучащую речь. Синтез речи применяется во многих сферах.


  1. Фонология. Звуки речи и звуковые типы. Фонема как единица языка. Трактовка фонемы И. А. Бодуэна де Куртенэ как основание появления последующих фонологических теорий.