Файл: Семинар сынылады he жне spo жйесіндегі омо сарапшылы кеесі.docx
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 30.11.2023
Просмотров: 595
Скачиваний: 3
ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
№10 Зертхана
БИГРАМАЛЫҚ ӘДІСІ АРҚЫЛЫ ҚАРАПАЙЫМ ОРЫН АСЫРУ ШИФЕРІН ОЙЛАУ
Жұмыс мақсаты: ауыстыру әдісімен мәліметтерді шифрлау (дешифрлеу) негіздерімен танысу. Биграмма көмегімен мәліметтердің шифрын ашу әдісін меңгеру.
Зертхананың сипаттамасы
Шифрлау әдісінің сипаттамасы. Орын ауыстыру шифрлары ерте заманнан бері қолданылып келеді. Дегенмен, кез келген дерлік қазіргі симметриялық криптожүйеде ауыстыру элементтерін табуға болады (мысалы, DES алгоритмінде, бастапқы және соңғы ауыстырулардың матрицалары). Мұнда ауыстыру шифрының мысалы келтірілген. Натурал санды таңдаймыз, айталық 5(n); 1-ден 5-ке дейінгі сандарды орналастырыңыз(n)
-
екі жолды белгілеу, онда екінші жол жоғарғы жолдағы сандарды ерікті ауыстыру болып табылады:
1 2 3 4 5
3 2 5 1 4
Бұл конструкция алмастыру деп аталады, ал 5 саны оның дәрежесі деп аталады.
«КИЕЛІ РИМ ИМПЕРИЯСЫ» деген сөз тіркесін шифрлап көрейік.
-
Бұл сөйлемде 23 әріп бар. Оны екі ерікті әріппен (мысалы, b, e) 5-тің ең жақын еселігіне дейін толықтырайық, яғни. 25-ке дейін. Осы күшейтілген сөз тіркесін алмастыру дәрежесіне қарай бес таңбалы топқа бөліп, бос орынсыз жазайық:
ҚАСИЕТТІ НАЯР ИМСК ДЖАЙМПЕ РИЖАЕ
Әр топтың әріптерін көрсетілген екі жолды жазбаға сәйкес келесі ереже бойынша қайта орналастырамыз: бірінші әріп үшінші орынға, екіншіден екіншіге, үшіншіден бесіншіге, төртіншіден біріншіге және бесіншіден төртіншіге дейін. Алынған мәтін бос орынсыз жазылады:
ШВСЕЯЯННРАКМИАСПИЕМИЕРЕЯ
Шифрды ашу кезінде мәтін бес әріптен тұратын топтарға бөлінеді.
-
әріптер кері ретпен қайта орналасады: біріншіден төртінші орынға, екіншіден екіншіге, үшіншіден біріншіге, төртіншіден бесіншіге және бесіншіден үшіншіге дейін. Шифр кілті – таңдаудың ауыстыру дәрежесі
Зертхана №10103
(біздің жағдайда 5 саны) және екі жолды жазбаның төменгі жолындағы сандардың реті.
-
Математикалық индукция әдісіне сәйкес екі жолды жазбаның төменгі жолын толтыру үшін 1 2 3 ... n (n!) опциясы бар екенін оңай тексеруге болады. Осылайша, ұзындығы n хабарламаларды шифрлауға арналған ауыстыру шифрінің әртүрлі түрлендірулерінің саны n-ден аз немесе оған тең! (назар аударыңыз, бұл
-
бұл сан да барлық таңбаларды өз орындарында қалдырып, түрлендіру опциясына кіреді).
Шифрды ашу әдісінің сипаттамасы. Хабарламалар қаншалықты күрделі болса да, белгілер тізбегі ретінде берілуі мүмкін. Бұл таңбалар кирилл әліпбиі немесе түстер палитрасы (қызыл, жасыл, көк) сияқты алдын ала бекітілген жиынтықтан алынған. Әртүрлі жиіліктегі хабарламаларда әртүрлі белгілер пайда болады. Сондықтан әртүрлі таңбалармен берілетін ақпарат көлемі әртүрлі болуы мүмкін. К.Шэннонның белгілі формуласы бойынша ақпарат көлемі хабарламаның келесі сипатын болжау үшін ИӘ және ЖОҚ жауаптары бар ықтимал сұрақтардың орташа санымен анықталады.
Тиімді кодтау Шеннонның кедергісіз арна үшін негізгі теоремасына негізделген, оның мәні төмендегідей.
Шеннон теоремасының мәні
Кейбір алфавиттің әріптерінен құралған хабарламалар бір әріптегі екілік таңбалардың орташа саны осы хабарламалар көзінің энтропиясына ерікті түрде жақын, бірақ осы мәннен кем болмайтындай етіп кодталуы мүмкін.
Егер мәтіндегі әріптер бір-бірінен тәуелсіз болса, онда бір таңбадағы хабарламадағы ақпараттың орташа мөлшері:
-
=ПменЖурнал21,
Пмен
онда Пменi таңбасының пайда болу жиілігі болып табылады.
Ақпарат көлемінің бұл анықтамасының үш ерекшелігін атап өтеміз.
-
Оның семантикаға, хабарламаның мағынасына мүлдем қатысы жоқ,
-
оны нақты мағынасы түсініксіз болса да қолдануға болады.
-
Ол белгілердің пайда болу ықтималдығының олардың тарихқа дейінгі кезінен тәуелсіздігін болжайды.
-
Хабарлама берілетін белгі жүйесі алдын ала белгілі, яғни. тіл, кодтау әдісі.
-
3-БӨЛІМ
-
Шеннон бойынша ақпарат көлемінің мәні қандай бірліктермен өрнектеледі? Бұл сұраққа ең дәл жауапты кодтау теоремасы береді, ол кез келген хабарламаны 0 және 1 таңбаларымен кодтауға болады, осылайша алынған хабарлама ұзындығы жоғарыдан Н-ге ерікті түрде жақын болады. Бұл теорема сонымен қатар бізге атау беруге мүмкіндік береді. ақпарат бірлігі – бит.
Дербес компьютерде жұмыс істеу кезінде архиваторларды пайдаланған кез келген адам мәтіндік файлдарды ешнәрсе жоғалтпай қаншалықты тиімді қысатынын біледі. Олардың жұмысы Шеннон теоремасының әрекеттегі ең жақсы көрінісі болып табылады. Орыс тіліндегі мәтін тек бас әріппен берілетіндіктен, H = 4,43 және бұл, негізінен, орыс алфавитінде тек 22 әріппен жұмыс істеуге немесе ASCII файлдарының ұзындығын 45% қысқартуға болатынын білдіреді. . Осылайша, хабарламалар қажеттен көбірек орын алады. Бұл құбылыс тілдік артықшылық деп аталады, соған байланысты хабарламаның жеке кейіпкерлерінің бұрмалануы көбінесе мазмұнды бұзбайды, бұл артықшылық болмаған кезде орын алатын. Компьютерде пернетақтаның ортасында орналасқан ең көп таралған ETOANIRSHDLU таңбалары (ағылшын тілінде жиіліктердің кему ретімен берілген) бар екенін ескеріңіз, теру кезінде саусақтардың қозғалысы аз болуы үшін. Бұл негізгі құрылымды линотипті ойлап тапқан Оттомар Мергенталер ұсынды, ол операцияны жеңілдету үшін тілдің артықтығын пайдаланды. Байланыстағы мәтінде символдың пайда болу ықтималдығы оның тарихына байланысты емес деген тұжырым статистикалық тұрғыдан да, лингвистикалық тұрғыдан да дұрыс емес. Әдетте дауыссыз дыбыстан кейін дауысты дыбыс, ал дауыссыз дыбыстан кейін дауыссыз дыбыс келетінін филологтар бұрыннан байқаған. Сондықтан ХІХ ғасырдың аяғында. Петербург математигі А.А.Марков мәтінді таңбалар тізбегі ретінде қарастыруды ұсынды, мұнда ықтималдық байланысты мәтіндегі кейіпкердің пайда болу ықтималдығы оның тарихына байланысты емес екендігі статистикалық және лингвистикалық тұрғыдан дұрыс емес. Әдетте дауыссыз дыбыстан кейін дауысты дыбыс, ал дауыссыз дыбыстан кейін дауыссыз дыбыс келетінін филологтар бұрыннан байқаған. Сондықтан ХІХ ғасырдың аяғында. Петербург математигі А.А.Марков мәтінді таңбалар тізбегі ретінде қарастыруды ұсынды, мұнда ықтималдық байланысты мәтіндегі кейіпкердің пайда болу ықтималдығы оның тарихына байланысты емес екендігі статистикалық және лингвистикалық тұрғыдан дұрыс емес. Әдетте дауыссыз дыбыстан кейін дауысты дыбыс, ал дауыссыз дыбыстан кейін дауыссыз дыбыс келетінін филологтар бұрыннан байқаған. Сондықтан ХІХ ғасырдың аяғында. Петербург математигі А.А.Марков мәтінді таңбалар тізбегі ретінде қарастыруды ұсынды, мұнда ықтималдық
әріптің пайда болуы алдыңғыға және тек соған байланысты. Осылайша, ол P ықтималдықтарын емес, қарастыра бастадыjхабардағы j белгісінің пайда болуы және ықтималдықтары Рijj таңбасының пайда болуы, оның алдында i таңбасы болған жағдайда. Марков тізбектерінің теориясы криптография үшін өте өнімді болып шықты, біз оның жеке қосымшаларына кейінірек ораламыз. Әзірге оның Андрей Андреевич Марковтың өзі жазған «Евгений Онегин» мәтіндерін талдауда алғашқы сынақтан өткенін атап өту жеткілікті. Марков тізбегінің бір символындағы ақпарат мөлшері келесі формуламен анықталады:
| 1 | | |
Х=ПменПijЖурнал2 | | . | |
| | ||
| Пij | |
Зертхана №10105
-
Бұл жағдайда белгілердің тәуелсіздігі талабына қайшылық жоқ, өйткені мұндағы белгі жеке таңба емес, диаграмма болып саналады. Қосымшада орыс тіліндегі техникалық мәтінде биграммалардың пайда болу ықтималдығының кестесі бар. Ықтималдықтар өсу ретімен 0-ден 9-ға дейінгі он класта берілген және орташа мәндердің геометриялық прогрессиясын құрайды. Бұл кестенің оң жағында жеке белгілердің пайда болу ықтималдығы берілген. Демек, АИ биграммасы жиі кездеседі (7-сынып), ал YA биграммасы мүлдем кездеспейді (0-сынып). Осы кестемен анықталған таңбаға шаққандағы ақпараттың орташа мөлшері 3,5 бит құрайды.
Мәтіндегі әріптің алдыңғыға тәуелділігінің сипатталған қасиеті бірінші ретті, ал әріптердің бір-бірінен тәуелсіздігі нөлдік марковизм деп аталады. Әрине, жоғары дәрежелі Марковтың қасиеттерін де қарастыруға болады, мысалы, екінші, әріп алдыңғы екіге байланысты болған кезде. Байланысқан мәтіндегі Марков ретін бағалау үшін алдымен жеке әріптердің ықтималдықтарын, содан кейін биграммаларды, триграммаларды және т.б. пайдалана отырып, кездейсоқ модельдеу жүргізуге болады. Марковтық тәртіпті ұлғайту кездейсоқ мәтін фрагментінің табиғиға ұқсастығын арттыратыны анық. Марковтық тәртіпті ұлғайту хабарламалардағы ақпарат көлемін нақтылауға мүмкіндік береді, бірақ бұл өте тайғақ тақырып және оған көптеген түрлі көзқарастар бар. Шынында да, Шеннон ақпарат өлшемі тұжырымдамасын енгізе отырып, біз мағына ұғымынан бас тарттық, таңбаларды буынға, буынды сөзге, сөзді сөйлемге, сөйлемді хабарға байланыстыратын. Балаға: «Сіз ботқа жеуіңіз керек!» деп айтудың іс жүзінде ешқандай айырмашылығы жоқ. немесе «Біз ботқа жеуіміз керек!», бірақ Шеннонның көзқарасы бұл хабарларды басқаша деп санайды. Демек, хабарламада қамтылған және жоғарыда келтірілген формулалар бойынша алынған ақпарат көлемін бағалау анық асыра бағаланады.
Қос ауыстыру шифрінің мысалын алыңыз. Бар болсын
4 4 кестеге сәйкес келетін AZUZHE SSHGGOOPER шифрлауы келесідей:
| 1 | 2 | 3 | 4 |
1 | А | З | Ю | ЖӘНЕ |
2 | Е | | МЕН | В |
3 | Г | Т | ТУРАЛЫ | ТУРАЛЫ |
4 | ЖӘНЕ | П | Е | П |
1063-БӨЛІМ
Әріптердің екіталай комбинациясын ескере отырып, бағандардың шынайы тізбегін табу оңай. Осылайша, шифрлаудың үшінші жолындағы GT комбинациясы екінші бағанның бірінші бағанға сәйкес келуі екіталай екенін көрсетеді. Қай баған біріншіден кейін келетінін статистикалық түрде есептеп көрейік. Ол үшін қосымшада келтірілген орыс тіліндегі мәтіннің диграммаларының ықтималдық логарифмдерінің кестесін қолданамыз. Бір бағаннан кейін екінші бағанның жүру ықтималдығы осы бағандардың жолдарындағы биграммалық коэффициенттердің қосындысына тең. Бірінші, екінші, үшінші және төртінші бағандардан кейінгі коэффициенттер үшін бізде өрнектер бар:
к(1-2) \u003d k (AZ) + k (E) + k (GT) + k (IP) \u003d 7 + 9 + 0 + 5 \u003d 21; k(1-3) = k(AYU) + k(EU) + k(GO) + k(IE) = 6 + 8 + 8 + 8 = 30; k(1-4) = k(AZH) + k(ESH) + k(GO) + k(NR) = 7 + 5 + 8 + 7 = 27.
-
Біздің жағдайда, ең алдымен, 1-бағаннан кейін 3-баған келеді.Бізде бар осындай шағын шифрлау кестесі үшін біз барлық ауыстыру опцияларын қарастыра аламыз - олардың тек 24-і бар.
-
Бағандар саны көп болған жағдайда, әртүрлі бағандардың комбинацияларының жұптарының ықтималдығын бағалау және жоғары ықтималдықпен табиғи мәтін фрагменттерін беретін бағандарды ауыстыруды көрсететін оңтайландыру мәселесін шешу ұсынылады. Біздің жағдайда ең жақсы нәтижеге бағандарды орналастыру арқылы қол жеткізіледі (2 4 1 3), бұл ықтималдық бойынша оған жақын орналасудан (4 1 3 2) ықтималдық бағалау тұрғысынан шамамен екі есе сенімді. Шифрлау бағандары реттелгеннен кейін оның жолдарын мәтін фрагменттерінің мағынасына сәйкес дұрыс орналастыру қиын болмайды:
| 2 | 4 | 1 | 3 |
1 | З | ЖӘНЕ | А | Ю |
2 | | В | Е | МЕН |
3 | Т | ТУРАЛЫ | Г | ТУРАЛЫ |
4 | П | П | ЖӘНЕ | Е |
Ондағы мәтін қазірдің өзінде оқылып жатыр және жолдарды ретімен орналастырып (4 1 2 3) біз МЕН АЛТЫНШЫ КЕЛЕДІ деген транскрипт аламыз.
Биграммаларды пайдаланып декодтаудың тағы бір мысалын келтіруге болады. Мәтінді ауыстыру әдісімен шифрлаймыз: