Как дублирование реализовано в архивировании, и как я извлекаю выгоду из него?
Я предположил бы, что это состоит из чего-то как хранение справочных таблиц дважды, таким образом, единственный дефект не делает недействительным целый отдых файла. Относительно варианта использования, возможно храня файл на CD, у которого появляется легкая царапина?
Однако я лично никогда не получал прибыли от добавляющего дублирования до zip-файлов, и я склонен опускать их, таким образом, я задавался вопросом, на самом деле ли они полезны на практике.
Я полагаю, что Вы говорите об адаптивном алгоритме LZ. Это не упоминается как дублирование ни из-за чего, что это становится дублированным в процессе создания zip-файла. Термин прибывает из того, как этот метод сжатия работает.
Для иллюстрирования вот, пример. Скажем, у меня был документ, содержащий фразу:
It is what it is because that's what it is
Если бы я хотел сделать эту фразу короче через дублирование, то я сначала сделал бы словарь, содержащий все слова, которые были повторены, как так
1it
2is
3what
И затем я переписал бы предложение как
12312becausethats312
Если я затем хочу сжать его дальше, я могу добавить следующее к своему словарю:
312x
12y
Так, чтобы это стало
yxbecausethatsx
Как Вы видите, больше проверок по избыточности, Вы проходите большее сжатие. Но Вы также увеличиваете вероятный капот повреждения. Это вызвано тем, что, поскольку словарь растет, это становится более подверженным повреждению и если какая-либо часть словаря повреждена, остальные не могут быть считаны.