Сжатие речевого сигнала на основе линейного предсказания - реферат

Введение

Одной из задач такового широкого раздела как «Цифровая обработка речевых сигналов», входящего в состав науки, занимающейся цифровой обработкой сигналов либо просто обработкой сигналов является сжатие либо кодирование речевого сигнала (РС). Сжатие РС может быть как без утрат (архивация), так и с потерями. При этом в последнем случае это Сжатие речевого сигнала на основе линейного предсказания - реферат кодирование можно подразделить на три вида:

1. кодирование конкретно реализации РС (WaveFormCodec);

2. измерение, кодирование и передача на приемную сторону характеристик РС, по которым уже на приемной стороне делается синтез этого (искусственного) РС. Такие системы именуют вокодерными (Source Codec);

3. гибридные методы кодировки, т.е. сочетание первого и второго методов кодировки. В задачку данной Сжатие речевого сигнала на основе линейного предсказания - реферат работы заходит рассмотрение первого метода кодировки.

Под кодировкой предполагается преобразование РС в некий «другой» сигнал, который можно представить с наименьшим числом разрядов, что в конечном итоге повысит скорость передачи данных. Одним из видов такового кодировки является дифференциальная импульсно-кодовая модуляция (ДИКМ), о которой и речь пойдет в Сжатие речевого сигнала на основе линейного предсказания - реферат предстоящем.

Дифференциальная импульсно-кодовая модуляция

В обыкновенной импульсно-кодовой модуляции каждый отсчет кодируется независимо от других. Но у многих источников сигнала при стробировании с частотой Найквиста либо резвее проявляется значимая корреляция меж поочередными отсчетами [1] (а именно, источник РС является квазистационарным источником и может относиться к рассматриваемым видам источников). Другими словами, изменение амплитуды Сжатие речевого сигнала на основе линейного предсказания - реферат меж поочередными отсчетами в среднем относительно малы. Как следует, схема кодировки, которая учитывает избыточность отсчетов, будет добиваться более низкой битовой скорости.

Сущность ДИКМ заключается в последующем. Предсказывается текущее значение отсчета на базе прошлых M отсчетов. Для конкретности представим, что значит текущий отсчет источника, и пусть обозначает предсказанное значение (оценку Сжатие речевого сигнала на основе линейного предсказания - реферат) для , определяемое как

.

Таким макаром, является взвешенной линейной композицией M отсчетов, а являются коэффициентами пророчества. Величины выбираются так, чтоб минимизировать некую функцию ошибки меж и . Проиллюстрируем вышеупомянутое на отрезке РС:

До того как идти далее, разглядим виды пророчества. «Линейное» пророчество значит, что является линейной функцией прошлых отсчетов Сжатие речевого сигнала на основе линейного предсказания - реферат; при «нелинейном» пророчестве – это нелинейная функция. Порядок пророчества определяется количеством применяемых прошлых отсчетов. Другими словами, пророчество нулевого и первого порядка является линейным, а второго и поболее высочайшего порядка - нелинейным. При линейном пророчестве вернуть сигнал существенно проще, чем при нелинейном пророчестве. Будем рассматривать только линейное пророчество.

Виды линейных пророчеств

1. Пророчество Сжатие речевого сигнала на основе линейного предсказания - реферат нулевого порядка.

В данном случае для пророчества текущего отсчета употребляется только предшествующий отсчет РС, т.е.

=>

2. Пророчество первого порядка (линейная экстраполяция).

В данном случае для пророчества текущего отсчета употребляется не только лишь предшествующий отсчет, да и разница меж предпоследним и последним отсчетами, которая суммируется к общему результату:

=>

Коэффициенты линейного пророчества (получение Сжатие речевого сигнала на основе линейного предсказания - реферат и расчет)

Формирование сигнала ошибки при использовании линейного пророчества эквивалентно прохождению начального сигнала через линейный цифровой фильтр. Этот фильтр именуется фильтром сигнала ошибки (ФСО) либо оборотным фильтром.

Обозначим передаточную функцию такового фильтра как А(z):

,

где E(z) и X(z) – прямое z - преобразование от сигнала ошибки и входного сигнала Сжатие речевого сигнала на основе линейного предсказания - реферат соответственно.

На приемной стороне при прохождении сигнала ошибки через формирующий фильтр (ФФ) мы в эталоне получим начальный сигнал. Обозначим передаточную функцию формирующего фильтра как K(z).

Т.е. передаточная функция K(z) связана с A(z) последующим соотношением:

.

Разглядим поочередно соединенные кодер и декодер:

При условии, что A(z Сжатие речевого сигнала на основе линейного предсказания - реферат)K(z) = 1, будет обеспечено полностью четкое восстановление сигнала, т.е. . Но это в эталоне, по сути такового быть не может по причинам, о которых скажем ниже.

Для примера, найдем передаточные функции ФСО и ФФ для различных типов линейного пророчества.

а) пророчество нулевого порядка;

; ;

Получили, что таковой фильтр Сжатие речевого сигнала на основе линейного предсказания - реферат неустойчив (граница стойкости), потому что полюс находится на единичной окружности.

б) пророчество первого порядка;

; ;

Получили, что и таковой фильтр тоже неустойчив (граница стойкости).

в) общая форма пророчества;

Было получено, что => .

; ;

На основании рассмотренных примеров можно сделать последующие выводы.

Фильтр сигнала ошибки всегда является КИХ фильтром, а формирующий фильтр – БИХ фильтром. Коэффициенты Сжатие речевого сигнала на основе линейного предсказания - реферат передаточной функции ФФ, которые, как уже было сказано выше, являются коэффициентами линейного пророчества (LPC: LinearPredictionCoefficients), должны быть такими, чтоб:

1. формирующий фильтр был устойчивым;

2. ошибка была мала.

Для получения передаточной функции ФФ, более точно воспроизводящего частотную характеристику голосового тракта для данного звука, следует определять коэффициенты передаточной функции Сжатие речевого сигнала на основе линейного предсказания - реферат исходя из условия меньшей ошибки линейного пророчества речевого сигнала (по условию минимума среднего квадрата ошибки).

Запишем выражение для оценки дисперсии сигнала ошибки, которую нужно свести к минимуму:

; ;

Получили, что - функция нескольких переменных. Продифференцируем ее и приравняем личные производные для нахождения экстремума:

; ,

где - знак Кронекера. Как следует: ;

; => ;

Получили обычные уравнения либо уравнения Юла Сжатие речевого сигнала на основе линейного предсказания - реферат-Волкера. Введем обозначение: , где - есть ни что другое, как корреляционная функция. Перепишем приобретенное выражение с учетом принятого обозначения:

(*)

Для вычисления функции нужно найти пределы суммирования по n : , где N – количество отсчетов в секторе РС, а M - количество отсчетов, нужных для расчета коэффициентов пророчества (M + 1)-го отсчета. Означает Сжатие речевого сигнала на основе линейного предсказания - реферат, 1-ое предсказанное значение запишется так: , где n = M + 1.

Получили:

;

Обозначим n – k = j => n = k + j , n – m = k + j – m n – m = i + j , где i = k – m . Как следует:

Таким макаром, выходит выражение, имеющее структуру краткосрочной ненормированной АКФ, но зависящей не только лишь от относительного сдвига последовательности Сжатие речевого сигнала на основе линейного предсказания - реферат i , да и от положения этих последовательностей снутри сектора РС, которые определяются индексом k , входящим в пределы суммирования. Таковой способ определения функции именуется ковариационным .

Выражение (*) представляет собой систему линейных алгебраических уравнений (СЛАУ) относительно , у каких все коэффициенты различны.

При использовании ковариационного способа получаются несмещенные оценки коэффициентов линейного пророчества, другими словами E Сжатие речевого сигнала на основе линейного предсказания - реферат{ak }= ak .ист , где ak .ист – настоящие значения коэффициентов линейного пророчества.

Другой метод определения коэффициентов системы (*) заключается в том, что заместо функции употребляется некая другая функция , которая определяется как

,

где - ненормированная краткосрочная АКФ. Так как определение функции сводится к расчету АКФ, то таковой способ именуется автокорреляционным. При использовании этого способа Сжатие речевого сигнала на основе линейного предсказания - реферат мы получаем смещенные оценки коэффициентов линейного пророчества (но, при M << N смещение пренебрежимо не много).

Перепишем СЛАУ (*) с учетом введенной функции :

.

.

При использовании автокорреляционного способа вся информация о сигнале, нужная для определения коэффициентов линейного пророчества, содержится в краткосрочной ненормированной АКФ B (i ).

Распишем полученную систему линейных алгебраических уравнений (СЛАУ Сжатие речевого сигнала на основе линейного предсказания - реферат) в очевидном виде:

Перепишем ее в матричной форме:

;

Характеристики матрицы коэффициентов системы:

1) матрица симметрична;

2) матрица Теплица (матрица, в границах каждой диагонали которой все элементы равны);

Для решения СЛАУ с таковой матрицей употребляется метод Левинсона – Дурбина, который просит наименьших вычислительных издержек, чем стандартные методы. Он смотрится последующим образом.

Исходные значения Сжатие речевого сигнала на основе линейного предсказания - реферат для метода:

Метод:

Сеточный фильтр сигнала ошибки пророчества

В прошлом разделе приводилась процедура вычисления коэффициентов пророчества Левинсона-Дурбина. В этой процедуре, как промежные величины, употребляются некие коэффициенты km , которые именуются коэффициентами отражения. Их физический смысл заключается в последующем. Голосовой тракт человека представляет собой трубу, состоящую из секций Сжатие речевого сигнала на основе линейного предсказания - реферат, соединенных поочередно, но имеющих различный поперечник. При прохождении звуковой волны через такую систему, появляются отражения на соединениях секций, т.к. каждый стык является неоднородностью. Коэффициент отражения охарактеризовывает величину проходимости стыка 2-ух секций (сред). Коэффициент отражения равен:

.

Поясним его смысл на последующем рисунке («жирным» показана m – секция голосового тракта):

Если Сжатие речевого сигнала на основе линейного предсказания - реферат rm = -1, то произойдет обрыв в цепи передачи сигнала (обрыв прямой ветки). Такового быть не должно, потому нужно смотреть за этим.

Модель акустических труб может быть представлена в виде фильтра, имеющего решетчатую (либо лестничную) структуру. Основными параметрами такового фильтра являются коэффициенты отражения.

Система акустических труб – резонансная система, потому если фильтр без утрат Сжатие речевого сигнала на основе линейного предсказания - реферат, то на его АЧХ будут наблюдаться разрывы (всплески в бесконечность). Реально на месте этих всплесков будут резонансные пики, и резонансные частоты таких пиков именуются формантными. Обычно в реальных голосовых трактах человека формантных частот (либо формант) менее 3-х. Более тщательно о коэффициентах отражения и решетчатых фильтрах можно Сжатие речевого сигнала на основе линейного предсказания - реферат прочесть в [2, глава 3].

Потому что коэффициенты отражения и коэффициенты пророчества рассчитываются в рамках одной и той же процедуры метода Левинсона-Дурбина, то они могут быть выражены друг через друга. Приведем тут эти алгритмы.

Ровная рекурсия (коэффициенты отражения -коэффициенты пророчества):

Оборотная рекурсия (коэффициенты пророчества -коэффициенты отражения):

Как уже было сказано, фильтры Сжатие речевого сигнала на основе линейного предсказания - реферат сигнала ошибки представляют собой КИХ фильтры либо нерекурсивные фильтры, что значит отсутствие веток оборотной связи. Системы с КИХ также могут владеть строго линейной ФЧХ. Линейность ФЧХ является очень принципиальным обстоятельством применительно к РС в тех случаях, когда требуется сохранить обоюдное размещение частей сигнала. Это значительно упрощает задачку их Сжатие речевого сигнала на основе линейного предсказания - реферат проектирования и позволяет уделять только внимание аппроксимации их АЧХ. За это достоинство приходится рассчитываться необходимостью аппроксимации протяженной импульсной реакции в случае фильтров с крутыми АЧХ [2].

Изобразим граф фильтра, имеющего решетчатую структуру, на примере фильтра 3–го порядка:

В отличие от формирующего фильтра этот фильтр имеет один вход и два выхода:

1) ei – последовательность Сжатие речевого сигнала на основе линейного предсказания - реферат отсчетов сигнала ошибки прямого линейного пророчества;

2) bi – последовательность отсчетов сигнала ошибки оборотного линейного пророчества.

Значимость bi определяется тем, что по нему вместе с сигналом ошибки ei могут быть оценены коэффициенты отражения.

,

где N – количество отсчетов в секторе.

Приобретенная формула для расчета коэффициентов отражения имеет также другой физический смысл. Это Сжатие речевого сигнала на основе линейного предсказания - реферат не что другое, как коэффициент корреляции меж последовательностью отсчетов сигнала ошибки прямого и оборотного линейных пророчеств.

Приведем также рекуррентные разностные уравнения решетчатого фильтра сигнала ошибки:

выход фильтра;

Исходные условия для этой рекуррентной процедуры:

Реализация ДИКМ

Имея способ определения коэффициентов пророчества, разглядим блок-схему практической системы ДИКМ, показанную ниже.

В этой Сжатие речевого сигнала на основе линейного предсказания - реферат схеме предсказатель стоит в цепи оборотной связи, обхватывающей квантователь. Вход предсказателя обозначен . Он представляет собой сигнальный отсчет , искаженный в итоге квантования сигнала ошибки. Выход предсказателя равен:

; (**)

Разность является входом квантователя, а обозначает его выход. Величина квантованной ошибки пророчества кодируется последовательностью двоичных знаков и передается через канал Сжатие речевого сигнала на основе линейного предсказания - реферат в пункт приема. Квантованная ошибка также суммируется с предсказанной величиной , чтоб получить .

В месте приема употребляется таковой же предсказатель, как на передаче, а его выход суммируется с , чтоб получить (см. рис. ниже).

Сигнал является входным воздействием для предсказателя и в то же время образует входную последовательность, по которой с помощь ЦАП Сжатие речевого сигнала на основе линейного предсказания - реферат восстанавливается сигнал x (t ). Внедрение оборотной связи вокруг квантователя обеспечивает то, что ошибка в - просто ошибка квантования и что тут нет скопления прошлых ошибок квантования при декодировании. Имеем

Как следует, . Это значит, что квантованный отсчет отличается от входа ошибкой квантования независимо от использования предсказателя. Означает, ошибки квантования не Сжатие речевого сигнала на основе линейного предсказания - реферат скапливаются.

В рассмотренной выше системе ДИКМ оценка либо предсказанная величина отсчета сигнала выходит средством линейной композиции прошлых значений , k = 1, 2, …, M, как показано в формуле (**). Улучшение свойства оценки можно получить включением в оценку линейно отфильтрованных последних значений квантованной ошибки.

Непосредственно, оценку можно выразить так:

,

где { } – коэффициенты фильтра для квантованной последовательности Сжатие речевого сигнала на основе линейного предсказания - реферат ошибок . Блок-схемы кодера на передаче и декодера на приеме приведены ниже.

Тут два ряда коэффициентов { } и { } выбираются так, чтоб минимизировать некую функцию ошибки , к примеру среднеквадратическую ошибку.

Адаптивная дифференциальная импульсно-кодовая модуляция

Многие реальные источники (к примеру, источники РС), как уже было сказано выше, являются квазистационарными по собственной природе. Одно из Сжатие речевого сигнала на основе линейного предсказания - реферат параметров квазистационарности черт случайного выхода источника состоит в том, что его дисперсия и автокорреляционная функция медлительно изменяются с течением времени. Кодеры ИКМ и ДИКМ, но, проектируются в предположении, что выход источника стационарен. Эффективность и рабочие свойства таких кодеров могут быть усовершенствованы, если они будут приспособиться к Сжатие речевого сигнала на основе линейного предсказания - реферат медлительно меняющейся во времени статистике источника. Как в ИКМ, так и в ДИКМ ошибка квантования , возникающая в равномерном квантователе, работающем с квазистационарным входным сигналом, будет иметь меняющуюся во времени дисперсию (мощность шума квантования).

Одно улучшение, которое уменьшает динамический спектр шума квантования, - это внедрение адаптивного квантователя. Другое – сделать адаптивным предсказатель Сжатие речевого сигнала на основе линейного предсказания - реферат в ДИКМ. При всем этом коэффициенты предсказателя могут временами изменяться, чтоб отразить меняющуюся статистику источника сигнала. И приобретенная СЛАУ, для решения которой употребляется метод Левинсона – Дурбина, остается справедливой и с короткосрочной оценкой автокорреляционной функции B (i ) (при принятых обозначениях B (i ) – уже краткосрочная АКФ), поставленной заместо оценки функции корреляции Сжатие речевого сигнала на основе линейного предсказания - реферат по ансамблю. Определенные таким макаром коэффициенты предсказателя могут быть вкупе с ошибкой квантования переданы приемнику, который употребляет таковой же предсказатель. К огорчению, передача коэффициентов предсказателя приводит к повышению нужной битовой скорости, отчасти компенсируя понижение скорости, достигнутое средством квантователя с немногими битами (немногими уровнями квантования) для уменьшения динамического спектра ошибки , получаемой Сжатие речевого сигнала на основе линейного предсказания - реферат при адаптивном пророчестве.

В качестве кандидатуры предсказатель приемника может вычислить свои собственные коэффициенты пророчества через и , где

;

Если пренебречь шумом квантования, эквивалентно . Как следует, можно использовать для оценки АКФ B (i ) в приемнике, и результирующие оценки могут быть применены в СЛАУ заместо B (i ) при нахождении коэффициентов предсказателя. При довольно Сжатие речевого сигнала на основе линейного предсказания - реферат большенном числе уровней квантования разность меж и очень мала. Как следует, оценка B (i ), приобретенная через , может быть применена для определения коэффициентов предсказателя. Выполненный таким макаром адаптивный предсказатель приводит к низкой скорости кодировки данных источника.

Заместо использования блоковой обработки для нахождения коэффициентов предсказателя { }, как описано выше, мы можем адаптировать Сжатие речевого сигнала на основе линейного предсказания - реферат коэффициенты предсказателя поотсчетно, используя метод градиентного типа, который мы и разглядим.

Основное преимущество такового способа адаптации – это отказ от решения СЛАУ, что существенно уменьшает вычислительные издержки.

Запишем оценку среднего квадрата ошибки пророчества:

Изобразим два графика, объясняющих многофункциональную зависимость в одномерном случае ( ) и в двумерном случае ( ):

Разумеется, что в общем случае Сжатие речевого сигнала на основе линейного предсказания - реферат, т.е. при фигура, приобретенная при 2-ух коэффициентах пророчества, перевоплотится в многомерный параболоид. Цель градиентного способа заключается в том, чтоб отыскать таковой вектор аор t , при котором функция s2 будет иметь меньшее значение, т.е. после определенных итераций нужно достигнуть верхушки этого параболоида. Метод такового градиентного способа смотрится так:

,

где Сжатие речевого сигнала на основе линейного предсказания - реферат i – номер шага, μ – шаг метода.

При малом шаге метода мы фактически вполне устраняем возможность расхождения метода, но при всем этом проигрываем в скорости сходимости либо в скорости нахождения коэффициентов предсказателя. И напротив.

Следует сказать, что таковой метод сходится при очень большенном количестве итераций, в общем случае Сжатие речевого сигнала на основе линейного предсказания - реферат, при количестве итераций стремящемся к бесконечности. Потому нужно также до вычислений задаться допустимой погрешностью, которая нас может устроить.

Найдем личную производную:

Тогда метод адаптации коэффициентов линейного пророчества воспримет последующий вид:

Иллюстрации

Ниже приводятся иллюстрации 1-го из опытов, проделанного в лабораторной работе.

Обрабатываемый сектор речевого сигнала:

Ошибка пророчества:

Коэффициенты отражения и Импульсная черта Сжатие речевого сигнала на основе линейного предсказания - реферат формирующего фильтра:

Передаточные функции ФФ и ФСО и Диаграмма полюсов:

Приобретенный (синтезированный) сектор РС:

Ошибка пророчества:

В проделанной работе проводились исследования воздействия разрядности коэффициентов пророчества / отражения и сигнала ошибки на синтезированный сигнал в системе с АДИКМ, приобретенный по этим величинам на приемной стороне декодером. Как уже ясно Сжатие речевого сигнала на основе линейного предсказания - реферат из наименования коэффициентов, исследовались и сравнивались два типа фильтров: стандартный и сеточный.

В итоге можно сделать последующие выводы.

Сеточный фильтр всегда устойчив и коэффициенты отражения всегда меньше 1, так как коэффициенты отражения являются также и коэффициентами корреляции. Устойчивость решетчатого фильтра инвариантна к разрядности коэффициентов отражения. Разрядность коэффициентов отражения сказывается Сжатие речевого сигнала на основе линейного предсказания - реферат только на форме передаточной функции и, как следствие, на диаграмме полюсов и импульсной характеристике, а на форму синтезированного РС оказывает влияние очень некординально, при условии неизменной, достаточно высочайшей (12) разрядности сигнала ошибки.

В случае фиксированной, достаточно низкой, разрядности коэффициентов отражения (4) и уменьшающейся разрядности сигнала ошибки до значения (6), ухудшение синтезированного РС Сжатие речевого сигнала на основе линейного предсказания - реферат некординально. При числе разрядов меньше (6) уже начинают наблюдаться значимые преломления. Если сопоставить эти опыты с опытами, проделанными над стандартным фильтром, то для такого же сектора и при значении разрядности (8), наблюдалась неустойчивость синтезированного фильтра и, как следствие, полное искажение РС.

В случае, если два фильтра были устойчивы и разрядность их коэффициентов, также Сжатие речевого сигнала на основе линейного предсказания - реферат разрядность сигнала ошибки была схожей, то синтезированный сигнал оказывался схожим.

Следует также отметить не только лишь воздействие разрядности коэффициентов пророчества / отражения на синтезированный сигнал, да и, сначала, саму реализацию начального аналогового РС, как базы, по которой рассчитываются сами коэффициенты. Потому нужно иметь припас по разрядности коэффициентов пророчества Сжатие речевого сигнала на основе линейного предсказания - реферат, чтоб стандартный фильтр для неких реализаций не оказался неустойчив (сеточный фильтр устойчив в любом случае). Экспериментально был подобран вариант выбора разрядности коэффициентов пророчества (12), а сигнала ошибки (8) (разрядность коэффициентов отражения не играет практически никакой роли). Это довольно отлично различимая речь.

Заключение

В данной работе довольно тщательно изложен способ цифрового сжатия Сжатие речевого сигнала на основе линейного предсказания - реферат речевого сигнала на базе линейного пророчества. Показано, что есть несколько подходов к решению этой задачки. Приведены иллюстрации из проделанной лабораторной работы со всеми необходимыми комментами и выводами.

Перечень литературы

1. Прокис Дж., «Цифровая связь», - М: Радио и связь, 2000.

2. Рабинер Л.Р., Шафер Р.В., «Цифровая обработка РС», - М: Радио и связь, 1981.

3. Конспект лекций Сжатие речевого сигнала на основе линейного предсказания - реферат по курсу «Цифровая обработка РС», 2004.


svyaz-mezhdu-istinnim-i-magnitnim-azimutom.html
svyaz-mezhdu-napryazhyonnostyu-i-potencialom.html
svyaz-mezhdu-pleyadeancami-i-hristom-i-ee-naznachenie.html