Сабақ жоспары №8 Сабақтың тақырыбы: Мұрағаттау бағдарламаларымен жұмыс

Мәліметтерді сығудың қайтымдылығы

жүктеу/скачать 451,34 Kb.

бет	2/5
Дата	25.05.2022
өлшемі	451,34 Kb.
	#144930
түрі	Сабақ

1 2 3 4 5

Байланысты:
План 7 ИКТ — копия

RLE алгоритмі: 0; 0; 0; 127; 127; 0; 255; 255; 255; 255
KWE алгоритмі

3. Мәліметтерді сығудың қайтымдылығы
Егер мәліметтердi сығу кезiнде олардың мазмұны өзгеретін болса, бұл тәсіл қайтымсыз болады да, сығылған мәліметтер толығынан алғашқы қалыпқа келмейді. Осындай тәсілдердi информацияны реттелген тәртіппен жоғалту тәсілдерi деп атайды. Бұл тәртіп мәлімет көлемін ойдағыдай кішірейтіп, көбіне суреттерді сығуда қолданылады. Бейненің аздап өзгергені көбіне байқалмайды. Мәтін үшін бұл әдіс қолданылмайды.
Информацияны аздап өзгерту арқылы сығатын бейнелік форматтар: .JPG (графикалық мәліметтер үшiн); .MPG (бейне суреттер үшiн); .MP3 (дыбыстық мәліметтер үшiн).

Мәліметтердi қысқанда, тек оның құрылымы ғана өзгерiске ұшыраса, онда бұл қайтымды тәсілге жатады. Мұндай тәсілде мәліметтің бастапқы нұсқасы толық қалпына келеді. Информацияны жоғалтпай сығу кез келген мәлімет түрлеріне қоланыла алады. Қайтымды тәсілмен сығылуға тән мәлімет форматтары:

.GIF, .TIF, .PCX және т.б. (графикалық мәліметтер типі үшін);
.AVI (бейне-суреттер үшiн);
.ZIP, .ARJ, .RAR, .LZH, .LH, .CAB және т.б. (мәліметтердiң мәтіндік немесе кез келген түрлерi үшiн).
Көптеген қысу алгоритмдері бар, олардың қолданылып жүргендерінің сипаттамалары:

RLE алгоритмі: 0; 0; 0; 127; 127; 0; 255; 255; 255; 255 тізбегі үшін қысқаша басқа тізбек 0;3; 127; 2; 255; 4 жазады(10 байт - 8 байт). Мұндағы К_с= 80% (8/10)
RLE алгоритмi қайталанатын мәліметтер тiркестерiн анықтап, оларды қайталау коэффициентi мен мәліметтер коды көрсетiлген қарапайым құрылыммен ауыстыруға негiзделеді.
KWE алгоритмі: жиі қайталанатын түйінді сөздер орнына қысқа код жазады да, соңына кодтар тізімін (токен) қосып береді. Үлкен мәтіндер үшін ғана тиімді. Қысқа мәтінді қайта ұзартады. Мысалы: мәлімет – 1, информация – 2, компьютер – 3, график – 4, т.с.с.
Бұл алгоритм бастапқы құжаттағы жиі ұшырайтын түйінді сөздерді (лексикалық бiрлiктердi) қысқартылған байттар тобымен кодтауға негiзделген. Құжатқа түйінді сөздерді кодтау кестесі бірге жазылады. Бұл тәсіл ағылшын тіліндегі мәтіндер үшін ыңғайлы, орыс, қазақ мәтіндері үшін – (предлогтары, жұрнақтары көп болғандықтан) онша ыңғайлы боп саналмайды.
Хафман алгоритмінде қолданылатын символдардың жиілігі есептеледі де, ең жиі қолданылатын символға 1 (А-1), одан кейінгіге 01 (О-01), сосын 11(Л-11), т.с.с. 001,010,011,111, 0001, 0010 ... болып кете береді, мұнда сирек қолданылатын символ ұзын кодқа, ал жиі кедесетін қысқа кодқа ие болады. Нәтижесінде мәтін көлеміне қарай бірнеше есе қысқарады.
Хафман алгоритмi негiзiнде символдардың кездесу жиіліктеріне қарай бит тобымен кодтау тәсілі жатыр. Берілген сөзде тек төрт символ а, b, с, d ғана болып, олардың кездесу жиіліктері, тиісінше, 1/2, 1/4, 1/8 және 1/8 болсын. Осы мысалдағы Хаффман тәсілі мынадай кестемен көрсетіледі:

ABBADACA деген сөз тіркесі берілген кодтау бойынша былай болады: 00 01 01 00 11 00 10 00, ал архивтеуден кейін: 0 1 1 0 11 0 10 0 , яғни алғашқы 16 бит архивтегі 10 битке түрлендірілді. Әрине, бұл мысал нақты мәтінге қатысты емес, тек түсіндіру үшін келтіріліген. Мұндағы K_c= 10/16 = 62,5%
Синтетикалық алгоритмдер. Жоғарыдағы алгоритмдер “таза күйінде” өмірде қолданылмайды, олардың тиімділігі бастапқы шарттарға байланысты болады. Осыған орай, қазіргі алгоритмдер бірнеше алгоритмдердің араласуынан шыққан күрделі синтетикалық алгоритмдерді пайдаланады. Оның негізгі принципі – мәліметті алдын ала қарап шығып, оның ерекшеліктерін талдау арқылы алгоритмдердің жеке түрлерін нақты нұсқада біріктіріп пайдалану болып табылады.

жүктеу/скачать 451,34 Kb.

Достарыңызбен бөлісу:

1 2 3 4 5