Адаптивный алгоритм сжатия речевых сигналов – Кафедра електронних пристроїв та систем

(новый адаптивный аудиокодек, позволяющий значительно уменьшить поток передаваемых данных при незначительном ухудшении качества восстановленной речи на приемной стороне)

В большинстве современных приложений, использующих передачу голосовых данных по сети Интернет, применяются алгоритмы параметрического кодирования (CELP, ACELP, LD-CELP), которые позволяют значительно повысить скорость передачи речевой информации за счет ухудшения качества. Одной из основных проблем таких методов кодирования является выбор наиболее эффективного способа сжатия переходных, вокализованных и невокализованных сегментов. Существует большое количество методов, решающих эту проблему, однако пока ни один из них не обеспечивает высокого качества MOS (Mean Opinion Score), из-за некорректного кодирования переходных сегментов.

Наиболее распространенным ортогональным преобразованием, используемым в различных алгоритмах сжатия речевых сигналов и изображений, является вейвлет-преобразование. Свойства частотно-временной локализации и хорошо разработанные алгоритмы быстрого преобразования обуславливают широкое применение вейвлет-преобразования в области анализа нестационарных сигналов.

Разработан новый алгоритм, который базируется на работе классификатора, позволяющего выделять переходные (взрывные, тишина-невокализованный, аффрикаты), вокализованные и невокализованные сегменты, с последующим этапом подбора наиболее эффективного ортогонального преобразования, что позволяет значительно уменьшить поток передаваемых данных по цифровому каналу связи при незначительном ухудшении качества восстановленной речи на приемной стороне.

Залишити відповідь Скасувати коментар