Адаптивный алгоритм сжатия речевых сигналов

(новый адаптивный аудиокодек, позволяющий значительно уменьшить поток передаваемых данных при незначительном ухудшении качества восстановленной речи на приемной стороне)

В большинстве современных приложений, использующих передачу голосовых данных по сети Интернет, применяются алгоритмы параметрического кодирования (CELP, ACELP, LD-CELP), которые позволяют значительно повысить скорость передачи речевой информации за счет ухудшения качества. Одной из основных проблем таких методов кодирования является выбор наиболее эффективного способа сжатия переходных, вокализованных и невокализованных сегментов. Существует большое количество методов, решающих эту проблему, однако пока ни один из них не обеспечивает высокого качества MOS (Mean Opinion Score), из-за некорректного кодирования переходных сегментов.

Наиболее распространенным ортогональным преобразованием, используемым в различных алгоритмах сжатия речевых сигналов и изображений, является вейвлет-преобразование. Свойства частотно-временной локализации и хорошо разработанные  алгоритмы быстрого преобразования обуславливают широкое применение вейвлет-преобразования в области анализа нестационарных сигналов.

Разработан новый алгоритм, который базируется на работе классификатора, позволяющего выделять переходные (взрывные, тишина-невокализованный, аффрикаты), вокализованные и невокализованные сегменты, с последующим этапом подбора наиболее эффективного ортогонального преобразования, что позволяет значительно уменьшить поток передаваемых данных по цифровому каналу связи при незначительном ухудшении качества восстановленной речи на приемной стороне.