Эффективное кодирование при взаимозависимых символах

Рассмотрим кратко некоторые методы эффективного кодирования в случае коррелированной последовательности букв.

Декорреляция исходной последовательности может быть осуществлена путем укрупнения алфавита букв. Подлежащие передаче сообщения разбиваются на 2-х, 3-х или l-буквенные сочетания, вероятности появления которых известны.

.

Каждому сочетанию ставится в соответствие кодовая комбинация по методике Шеннона-Фено или Хаффмена. Недостаток такого метода заключается в том, что не учитываются корреляционные связи между буквами, входящими в состав следующих друг за другом сочетаний. Естественно, этот недостаток проявляется тем меньше, чем больше букв входит в каждое сочетание.

Указанный недостаток устраняется при кодировании по методу диграмм, триграмм или l-грамм. (l-грамма – это сочетание из l смежных букв сообщения). http://peredacha-informacii.ru/ Сочетание из 2-х смежных букв называется диграммой, из трех – триграммой и т.д.

Теперь в процессе кодирования l-грамма непрерывно изменяется по тексту сообщения.

.

Кодовое обозначение каждой очередной буквы зависит от (l – 1) предшествовавших ей букв и определяется по вероятностям различных l-грамм на основании методики Шеннона-Фено или Хаффмена.

Конкретное значение l выбирается в зависимости от степени корреляционной связи между буквами или растущей сложности технической реализации кодирующих и декодирующих устройств в сравнении с получаемым эффектом сжатия.