Рефетека.ру / Информатика и програм-ие

Реферат: Проблема аутентификации данных и блочные шифры

Данная статья является продолжением серии статей автора о реализациях и использовании Российского стандарта шифрования [1,2,3] и об архитектуре и режимах использования блочных шифров [4], и посвящена проблемам подтверждения подлинности и авторства сообщений.  Статья была написана осенью 1995 года – почти три года назад, и подготовлена для публикации в журнале «Монитор», где у автора вышли 2 статьи по криптографии.  Однако по разным причинам статья тогда не была опубликована – сначала из-за нехватки времени на ее окончательную доводку и подготовку кодов–примеров к статье, а затем из-за закрытия «Монитора».

Содержание

Введение......................................................................................................................................... 2

1. Задача аутентификации данных...............................................................................................

2. Контроль неизменности массивов данных.............................................................................

2.1. Задача имитозащиты данных.............................................................................................

2.2. Подходы к контролю неизменности данных...................................................................

2.3. Выработка кода аутентификации сообщений..................................................................

2.4. Выработка кода обнаружения манипуляций....................................................................

3. Цифровая подпись на основе традиционных блочных шифров.........................................

3.1. Что такое цифровая подпись...........................................................................................

3.2. Базовая идея Диффи и Хеллмана.....................................................................................

3.3. Модификация схемы Диффи–Хеллмана для подписи битовых групп........................

3.4. Схема цифровой подписи на основе блочного шифра.................................................

Заключение................................................................................................................................... 24

Литература.................................................................................................................................... 24


Введение

Наш совсем уже близкий к своему завершению век с полным правом может считаться веком тотальной информатизации общества – роль информации в современном мире настолько велика, что информационная индустрия стала одной из ведущих отраслей наших дней, а получившие огромное распространение устройства для обработки цифровых данных – компьютеры – являются одним из символов нашей цивилизации.  Информация, представленная в самых различных формах, подобно другим товарам производится, хранится, транспортируется к потребителю, продается, покупается наконец потребляется, устаревает, портится, и т.д..  На протяжении жизненного цикла информационные массивы могут подвергаться различным нежелательным для их потребителя воздействиям, проблемам борьбы с которыми и посвящена данная статья.

Так как информация имеет нематериальный характер, массивы данных не несут на себе никаких отпечатков, по которым можно было бы судить об их прошлом – о том, кто является автором, о времени создания, о фактах, времени и авторах вносимых изменений.  Модификация информационного массива не оставляет осязаемых следов на нем и не может быть обнаружена обычными методами.  «Следы модификации» в той или иной форме могут присутствовать только на материальных носителях информации – так, специальная экспертиза вполне способна установить, что сектор  X  на некоей дискете был записан позже всех остальных секторов с данными на этой же дорожке дискеты, и эта запись производилась на другом дисководе.  Указанный факт, будучи установленным, может, например, означать, что в данные, хранимые на дискете, были внесены изменения.  Но после того, как эти данные будут переписаны на другой носитель, их копии уже не будут содержать никаких следов модификации.  Реальные компьютерные данные за время своей жизни многократно меняют физическую основу представления и постоянно кочуют с носителя на носитель, в силу чего их не обнаружимое искажение не представляет серьезных проблем.  Поскольку создание и использование информационных массивов практически всегда разделены во времени и/или в пространстве, у потребителя всегда могут возникнуть обоснованные сомнения в том, что полученный им массив данных создан нужным источником и притом в точности таким, каким он дошел до него.

Таким образом, в системах обработки информации помимо обеспечения ее секретности важно гарантировать следующие свойства для каждого обрабатываемого массива данных:

подлинность – он пришел к потребителю именно таким, каким был создан источником и не претерпел на своем жизненном пути несанкционированных изменений;

авторство – он был создан именно тем источником, каким предполагает потребитель.

Обеспечение системой обработки этих двух качеств массивов информации и составляет задачу их аутентификации, а соответствующая способность системы обеспечить надежную аутентификацию данных называется ее аутентичностью.

1. Задача аутентификации данных.

На первый взгляд может показаться, что данная задача решается простым шифрованием.  Действительно, если массив данных зашифрован с использованием стойкого шифра, такого, например, как ГОСТ 28147–89, то для него практически всегда будет справедливо следующее:

в него трудно внести изменения осмысленным образом, поскольку со степенью вероятности, незначительно отличающейся от единицы, факты модификации зашифрованных массивов данных становятся очевидными после их расшифрования – эта очевидность выражается в том, что такие данные перестают быть корректными для их интерпретатора: вместо текста на русском языке появляется белиберда, архиваторы сообщают, что целостность архива нарушена и т.д.;

только обладающие секретным ключом шифрования пользователи системы могут изготовить зашифрованное сообщение, таким образом, если к получателю приходит сообщение, зашифрованное на его секретном ключе, он может быть уверенным в его авторстве, так как кроме него самого только законный отправитель мог изготовить это сообщение.

Тем не менее, использование шифрования в системах обработки данных само по себе неспособно обеспечить их аутентичности по следующим причинам:

1. Изменения, внесенные в зашифрованные данные, становятся очевидными после расшифрования только в случае большой избыточности исходных данных.  Эта избыточность имеет место, например, если массив информации является текстом на каком-либо человеческом языке.  Однако в общем случае это требование может не выполняться – если случайная модификация данных не делает их недопустимым для интерпретации со сколько-нибудь значительной долей вероятности, то шифрование массива не обеспечивает его подлинности.  Говоря языком криптологии, аутентичность и секретность суть различные свойства криптосистем.  Или, более просто: свойства систем обработки информации обеспечивать секретность и подлинность обрабатываемых данных в общем случае могут не совпадать.

2. Факт успешного (в смысле предыдущего пункта) расшифрования зашифрованных на секретном ключе данных может подтвердить их авторство только в глазах самого получателя.  Третья сторона не сможет сделать на основании этого однозначного вывода об авторстве массива информации, так как его автором может быть любой из обладателей секретного ключа, а их как минимум два – отправитель и получатель.  Поэтому в данном случае споры об авторстве сообщения не могут быть разрешены независимым арбитражем.  Это важно для тех систем, где между участниками нет взаимного доверия, что весьма характерно для банковских систем, связанных с управлением значительными ценностями.

Таким образом, существование проблемы подтверждения подлинности и авторства массивов данных, отдельной от задачи обеспечения их секретности, не вызывает сомнения.  В последующих разделах настоящей статьи излагаются подходы к ее решению, базирующиеся на использовании классических блочных шифров.  В разделе 2 рассматриваются подходы к решению задачи подтверждения подлинности данных, а в разделе 3 – к задаче подтверждения их авторства.  В принципе, для решения указанных задач может быть использован любой традиционный блочный криптографический алгоритм.  В компьютерных кодах, прилагаемых к настоящей статье, автор использует наиболее знакомый и близкий ему шифр – криптоалгоритм ГОСТ28147–89.

2. Контроль неизменности массивов данных. 2.1. Задача имитозащиты данных.

Под имитозащитой данных в системах их обработки понимают защиту от навязывания ложных данных.  Как мы уже выяснили, практически всегда на некоторых этапах своего жизненного цикла информация оказывается вне зоны непосредственного контроля за ней.  Это случается, например, при передаче данных по каналам связи или при их хранении на магнитных носителях ЭВМ, физический доступ к которым посторонних лиц исключить почти никогда не представляется возможным.  Только если целиком заключить линию связи в кожух из твердого металла, внутрь кожуха закачать газ под давлением и высылать роту автоматчиков прочесывать местность каждый раз, когда в секции такой системы будут зафиксированы малейшие изменения давления, как это, по слухам, делают Российские спецслужбы, ответственные за правительственную связь, будет хоть какая-то гарантия неприкосновенности передаваемых данных, не всегда, впрочем, достаточная.  Но подобный подход многократно удорожает стоимость каналов связи, ведь стоимость кожуха, защищенных помещений для обработки сигнала и услуг вооруженных людей на много порядков превышает стоимость проложенной витой пары проводов.  И как в этом случае быть с электромагнитным сигналом? – ведь не до всех мест можно дотянуть провод, а такой сигнал, даже если это узконаправленный лазерный пучок, не говоря об обычном радиосигнале, не спрячешь в кожух.

Таким образом, физически предотвратить внесение несанкционированных изменений в данные в подавляющем большинстве реальных систем их обработки, передачи и хранения не представляется возможным.  Поэтому крайне важно своевременно обнаружить сам факт таких изменений – если подобные случайные или преднамеренные искажения будут вовремя выявлены, потери пользователей системы будут минимальны и ограничатся лишь стоимостью «пустой» передачи или хранения ложных данных, что, конечно, во всех реальных ситуациях неизмеримо меньше возможного ущерба от их использования.  Целью злоумышленника, навязывающего системе ложную информацию, является выдача ее за подлинную, а это возможно только в том случае, если сам факт такого навязывания не будет вовремя обнаружен, поэтому простая фиксация этого факта сводит на нет все усилия злоумышленника.  Подведем итог – под защитой данных от несанкционированных изменений в криптографии понимают не исключение самой возможности таких изменений, а набор методов, позволяющих надежно зафиксировать их факты, если они имели место.

Попытаемся найти универсальные подходы к построению такой защиты.  Прежде всего, в распоряжении получателя информации должна быть процедура проверки или аутентификации  A(T), позволяющая проверить подлинность полученного массива данных  T.  На выходе указанная процедура должна выдавать одно из двух возможных булевых значений – массив данных опознается как подлинный, либо как ложный: A(T)Î{0,1}  для любого допустимого  T.  Условимся, что значение  1  соответствует подлинному массиву данных, а значение  0 – ложному.  Процедура аутентификации должна обладать следующими свойствами, ограничивающими возможность злоумышленника подобрать массив данных  T1, отличающийся от подлинного массива  T  (T¹T1), который бы тем не менее был бы этой процедурой опознан как подлинный (A(T1)=1):

у злоумышленника не должно быть возможности найти такое сообщение иначе как путем перебора по множеству допустимых сообщений – последняя возможность есть в его распоряжении всегда;

вероятность успешно пройти проверку на подлинность у случайно выбранного сообщения  T*  не должна превышать заранее установленного значения  p.

Теперь вспомним про универсальность конструируемой схемы защиты, которая, в частности, означает, что схема должна быть пригодной для защиты любого массива данных  T  из достаточно широкого класса.  Однако, если реализовать схему буквально, т.е. использовать для проверки в точности то сообщение, которое отправитель должен передать получателю, принцип универсальности может придти в противоречие со вторым требованием к процедуре проверки.  Действительно, исходя из этого принципа мы можем потребовать, чтобы все возможные сообщения  T  были допустимыми, что совершенно явно нарушит второе требование к функции проверки.  Для того, чтобы их примирить, в схему необходимо ввести дополнительные шаги – преобразование данных отправителем и обратное преобразование получателем.  Отправитель выполняет преобразование данных с использованием некоторого алгоритма  FT'=F(T).  Тогда, помимо процедуры аутентификации, в распоряжении получателя должна быть процедура  G  восстановления исходных данных: T=G(T').  Весь смысл этих преобразований заключается в том, чтобы множество преобразованных сообщений  {T'},  взаимно однозначно отображающееся на множество допустимых исходных сообщений  {T},  было неизвестно злоумышленнику, и вероятность случайно угадать элемент из этого множества была достаточно мала для того, чтобы ее можно было не принимать во внимание.

Последнее требование в сочетанием с принципом универсальности однозначно приводит к необходимости внесения определенной избыточности в сообщение, что означает попросту тот факт, что размер преобразованного сообщения должен быть больше размера исходного сообщения на некоторую величину, как раз и составляющую степень избыточности:  |T'|–|T|=D.  Очевидно, что чем больше эта величина, тем меньше вероятность принять случайно взятое сообщение за подлинное – эта вероятность равна  2–D.  Если бы не требование внесения избыточности, в качестве функций преобразования  F  и  G  данных могли бы использоваться функции зашифрования и расшифрования данных на некотором ключе  KF(T)=EK(T),  G(T')=DK(T').  Однако при их использовании размер массива зашифрованных данных  T'  равен размеру массива исходных данных  T:  |T'|=|T|, поэтому метод здесь не подходит.

Наиболее естественно реализовать алгоритм преобразования с внесением избыточности простым добавлением к исходным данным контрольной комбинации фиксированного размера, вычисляемой как некоторая функция от этих данных: T'=F(T)=(T,C),  C=f(T), |C|=D.  В этом случае выделение исходных данных из преобразованного массива заключается в простом отбрасывании добавленной контрольной комбинации  CT=G(T')=G(T,C)=T.  Проверка на подлинность заключается в вычислении для содержательной части  T  полученного массива данных  T'  значения контрольной комбинации  C'=f(T) и сравнении его с переданным значением контрольной комбинацией  C.  Если они совпадают, сообщение считается подлинным, иначе – ложным:

Проблема аутентификации данных и блочные шифры .

Теперь рассмотрим свойства, которым должна удовлетворять функция выработки контрольной комбинации  f:

1. Эта функция должна быть вычислительно необратимой, то есть не должно существовать способа подобрать массив данных  T  под заданную контрольную комбинацию  C  иначе как перебором по пространству возможных значений  T.

2. Эта функция не должна быть известна злоумышленнику – у него не должно быть способа вычислить контрольную комбинацию  C  ни для какого массива данных  T.  Это требование по сути означает, что функция  f  должна быть секретной, рассмотрим его подробнее:

во-первых, в соответствии с общепризнанным в криптографии принципом Кирхгоффа требование секретности функции выработки контрольной комбинации следует заменить на применение открытой функции, использующей вектор секретных параметров (ключ) – точно так же, как это делается при построении шифров:  C=f(T)=fK(T).

во-вторых, оказывается, что в отдельных случаях это требование можно существенно ослабить.  Дело в том, что истинная цель этого пункта – исключить для злоумышленника возможность отправить ложное сообщение  T1,  снабдив его корректно вычисленной контрольной комбинацией  C1=f(T1).  Этого можно достичь двумя следующими способами:

(a) с помощью использованного выше требования секретности функции вычисления контрольной комбинации или зависимости ее от вектора секретных параметров (ключа);

(b) с помощью организации такого протокола использования средств защиты, который бы исключал возможность подобного навязывания ложных данных.

Очевидно, что возможность (b) может быть реализована только если контрольная комбинация передается или хранится отдельно от защищаемых данных.  Несмотря на кажущуюся экзотичность, такая возможность встречается достаточно часто, речь о ней впереди.

Рассмотрим некоторые хорошо известные способы вычисления контрольной комбинации и оценим возможность их использования в рассматриваемой системе имитозащиты данных.  Простейшим примером такой комбинации является контрольная сумма блоков сообщения, взятая по модулю некоторого числа, обычно берут два в степени размера блока:

если  T=(T1,T2,...,Tm),  то  C=f(T)=(T1+T2+...+Tm)mod2N,

где  N=|T1|=|T2|=...=|Tm| – размер блоков сообщения.

Однако такое преобразование не соответствует обоим вышеизложенным требованиям к функции вычисления контрольной комбинации и поэтому непригодно для использования в схеме имитозащиты:

во-первых, и это самое главное – оно не исключает возможность подбора данных под заданную контрольную комбинацию.  Действительно, пусть отправитель информации передал по ненадежному каналу сообщение  T  и контрольную сумму  C  для него, вычисленную по приведенной выше формуле.  В этом случае все, что потребуется злоумышленнику для навязывания получателю произвольно взятого ложного массива данных  T'=(T'1,T'2,...,T'm') – это дополнить его еще одним блоком, вычисленным по следующей формуле:

T'm'+1=C–(T'1+T'2+...+T' m')mod2N.

Все блоки ложного сообщения, кроме одного, не обязательно последнего, злоумышленник может установить произвольными.

во-вторых, рассмотренное преобразование не является криптографическим, и для злоумышленника не составит труда изготовить контрольную комбинацию для произвольного выбранного им сообщения, что позволяет ему успешно выдать его за подлинное – если контрольная комбинация хранится или передается вместе с защищаемым массивом данных.

2.2. Подходы к контролю неизменности данных.

В настоящее время известны два подхода к решению задачи защиты данных от несанкционированного изменения, базирующихся на двух изложенных выше подходах к выработке контрольной комбинации:

1. Выработка MACMessage Authentification Code – кода аутентификации сообщений. Этот подход заключается в том, что контрольная комбинация вычисляется с использованием секретного ключа с помощью некоторого блочного шифра.  Важно, что на основе любого такого шифра можно создать алгоритм вычисления MAC для массивов данных произвольного размера.  В литературе МАС иногда не вполне корректно называется криптографической контрольной суммой, или, что более точно, криптографической контрольной комбинацией.  Данный подход к аутентификации данных общепризнан и закреплен практически во всех криптографических стандартах - имитовставка, формируемая согласно ГОСТ 28147-89 является типичным образцом MAC.

2. Выработка MDCМаnipulation Detection Code – кода обнаружения манипуляций (с данными).  Для вычисления MDC для блока данных используется так называемая необратимая функция сжатия информации, в литературе также называемая односторонней функцией, функцией одностороннего сжатия (преобразования) информации, криптографической хэш–функцией, или просто хэш–функцией.  Понятно, что ее необратимость должна носить вычислительный характер:

вычисление прямой функции  Y=f(X) легко осуществимо вычислительно;

вычисление обратной функции  X=f–1(Y) неосуществимо вычислительно, то есть не может быть выполнено более эффективным путем, чем перебором по множеству возможных значений  X;

Оба способа вычисления контрольной комбинации – MDC и MAC принимают в качестве аргумента блок данных произвольного размера и выдают в качестве результата блок данных фиксированного размера.

В следующей ниже таблице 1 приведены сравнительные характеристики обоих подходов:

Таблица 1. Сравнительные характеристики подходов к решению задачи контроля неизменности массивов данных.

Рефетека ру refoteka@gmail.com