Изменения

Код Хаффмана (править)

Версия от 22:20, 25 мая 2009

4178 байт добавлено , 16 лет назад

м

← Правки 95.24.165.157 (обсуждение) откачены к версии Mstislavl

Строка 7: Строка 7:

# Построение оптимального кодового дерева.

# Построение отображения код-символ на основе построенного дерева.

+

== Алгоритм ==

+

# Подсчитываются вероятности появления символов [[первичный алфавит|первичного алфавита]] в исходном тексте (если они не заданы заранее)

+

# Символы первичного алфавита m1 выписывают в порядке убывания вероятностей.

+

# Последние n0 символов объединяют в новый символ, вероятность которого равна суммарной вероятности этих символов, удаляют эти символы и вставляют новый символ в список остальных на соответствующее место (по вероятности). n0 вычисляется из системы: <math>

+

\left\{\begin{matrix} 2 \le n_0 \le m_2

+

\\ n_0 = m_1 - a(m_2-1) \end{matrix}\right.

+

</math>, где a — целое число, m1 и m2 — мощность первичного и вторичного алфавита соответственно.

+

# Последние m2 символов снова объединяют в один и вставляют его в соответствующей позиции, предварительно удалив символы, вошедшие в объединение.

+

# Предыдущий шаг повторяют до тех пор, пока сумма всех m2 символов не станет равной 1.

+

Этот процесс можно представить как построение [[Дерево (теория графов)|дерева]], корень которого — символ с вероятностью 1, получившийся при объединении символов из последнего шага, его m2 потомков — символы из предыдущего шага и т. д.

+

Каждые m2 элементов, стоящих на одном уровне, нумеруются от 0 до m2-1. Коды получаются из путей (от первого потомка корня и до листка). При декодировании можно использовать то же самое дерево, считывается по одной цифре и делается шаг по дереву, пока не достигается лист — тогда выводится символ, стоящий в листе и производится возврат в корень.

+

== Построение дерева Хаффмана ==

+

Бинарное дерево, соответствующее коду Хаффмана, называют деревом Хаффмана.

+

Задача построения кода Хаффмана равносильна задаче построения соответствующего ему дерева.

+

Общая схема построения дерева Хаффмана:

+

# Составим список кодируемых символов (при этом будем рассматривать каждый символ как одноэлементное бинарное дерево, вес которого равен весу символа).

+

# Из списка выберем 2 узла с наименьшим весом (под весом можно понимать частоту использования символа — чем чаще используется, тем больше весит).

+

# Сформируем новый узел и присоединим к нему, в качестве дочерних, два узла выбранных из списка. При этом вес сформированного узла положим равным сумме весов дочерних узлов.

+

# Добавим сформированный узел к списку.

+

# Если в списке больше одного узла, то повторить 2-5.

== Пример реализации ==

Анонимный участник

w>Ashik