Алфавиттік ақпараттың құдіреті қандай. Мәтіннің ақпараттық көлемі және ақпараттың өлшем бірліктері. Электрондық түрдегі ақпаратты өлшеу әдістері

МӘСЕЛЕНІ ШЕШУ

Қолдану кезінде ақпаратты сақтау және беру техникалық құрылғыларақпаратты символдар – белгілер тізбегі (әріптер, сандар, кескін нүктелерінің түс кодтары және т.б.) ретінде қарастыру керек.

Белгілер жүйесінің (алфавиттің) таңбалар жиынтығын әртүрлі мүмкін күйлер (оқиғалар) ретінде қарастыруға болады.
Сонда хабардағы белгілердің пайда болуы бірдей ықтимал деп есептесек, мүмкін болатын оқиғалар саны Нретінде есептеуге болады N=2i
Хабарламадағы ақпарат саны Iтаңбалар санын көбейту арқылы есептеуге болады Қбір таңбаның ақпарат салмағына мен
Сонымен, бізде алфавиттік тәсілдегі ақпарат көлемін анықтау үшін қажетті формулалар бар:

Белгілі (Берілген) және ізделетін (Табу) шамалардың келесі комбинациясы мүмкін:

ТүрБерілгенТабуФормула
1 мен Н N=2i
2 Н мен
3 мен, Қ I I=K*i
4 мен, мен Қ
5 Мен, Қ мен
6 Н, Қ I Екі формула да
7 Н, И Қ
8 Мен, Қ Н

Бұл есептерге шамаларды екінің дәрежелері түрінде бейнелеу арқылы әртүрлі өлшем бірліктерімен жазылған шамалардың қатынасы бойынша тапсырмаларды қоссақ, есептің 9 түрі шығады.
Барлық түрлерге арналған тапсырмаларды қарастырайық. Бір ақпарат өлшем бірлігінен екінші өлшем бірлігіне ауысқанда біз мәндер тізбегін құрастырамыз деп келісейік. Сонда есептеу қателігінің ықтималдығы төмендейді.

Мәселе 1. Ақпарат көлемі 32 бит болатын хабарлама алынды. Бұл байттағы көлем қанша?

Шешуі: Бір байтта 8 бит бар. 32:8=4
Жауабы: 4 байт.

Мәселе 2. Ақпараттық хабарламаның көлемі килобайтпен және мегабайтпен көрсетілген 12582912 бит.

Шешуі: 1Кбайт=1024байт=1024*8 бит болғандықтан, 12582912:(1024*8)=1536 Кбайт және
бастап 1 МБ = 1024 КБ, содан кейін 1536: 1024 = 1,5 МБ
Жауабы: 1536 КБ және 1,5 МБ.

3-тапсырма.Компьютерде бар Жедел Жадтау Құрылғысы 512 Мб. Бұл мәнге сәйкес биттердің саны көбірек:

1) 10 000 000 000 бит 2) 8 000 000 000 бит 3) 6 000 000 000 бит 4) 4 000 000 000 бит Шешуі: 512*1024*1024*896 бит=2424 бит.
Жауабы: 4.

4-тапсырма.Сандар үшін тек 2 дәрежесін пайдаланып, екі мегабайттағы биттердің санын анықтаңыз.
Шешуі: 1 байт = 8 бит = 2 3 бит, ал 1 МБ = 2 10 КБ = 2 20 байт = 2 23 бит болғандықтан. Демек, 2 МБ = 2 24 бит.
Жауабы: 2 24 бит.

5-тапсырма. 2 23 биттік хабарламада қанша мегабайт ақпарат бар?
Шешуі: 1 байт = 8 бит = 2 3 бит болғандықтан
2 23 бит=2 23 *2 23 *2 3 бит=2 10 2 10 байт=2 10 КБ=1МБ.
Жауабы: 1 Мб

6-тапсырма.Алфавиттің бір таңбасының салмағы 4 битті құрайды. Бұл әліпбиде неше таңба бар?
Шешімі:
Берілген:


Жауабы: 16

7-тапсырма.Алфавиттің әрбір таңбасы екілік кодтың 8 цифры арқылы жазылады. Бұл әліпбиде неше таңба бар?
Шешімі:
Берілген:


Жауабы: 256

8-тапсырма.Орыс алфавиті кейде 32 әріпке бағаланады. Осындай қысқартылған орыс алфавитінің бір әріпінің ақпараттық салмағы қанша?
Шешімі:
Берілген:


Жауабы: 5

9-тапсырма.Әліпби 100 таңбадан тұрады. Бұл алфавиттің бір символы қанша ақпарат алып жүр?
Шешімі:
Берілген:


Жауабы: 5

Мәселе 10.Чичевок тайпасының алфавитінде 24 әріп және 8 цифр бар. Тыныс белгілері немесе арифметикалық белгілер жоқ. Барлық таңбаларды кодтау үшін екілік цифрлардың ең аз саны қанша болуы керек? Сөздерді бір-бірінен ажырату керек екенін ескеріңіз!
Шешімі:
Берілген:


Жауабы: 5

11-есеп.Компьютер арқылы терілген кітап 150 беттен тұрады. Әр бетте 40 жол, әр жолда 60 таңба бар. Кітапта қанша ақпарат бар? Жауабыңызды килобайт пен мегабайтпен беріңіз
Шешімі:
Берілген:


Жауап: 351 КБ немесе 0,4 МБ

12-есеп.Юникодтық кодтау арқылы компьютерде терілген кітап мәтінінің ақпараттық көлемі 128 килобайтты құрайды. Кітап мәтініндегі кейіпкерлер санын анықтаңыз.
Шешімі:
Берілген:


Жауабы: 65536

13-есеп. 1,5 КБ ақпараттық хабарламада 3072 таңба бар. Қолданылған әліпбидің бір таңбасының ақпараттық салмағын анықтаңыз
Шешімі:
Берілген:


Жауабы: 4

14-есеп. 64 таңбалы әліпбидің әріптерімен жазылған хабарламада 20 таңба бар. Ол қанша ақпаратты тасымалдайды?
Шешімі:
Берілген:


Жауабы: 120бит

15-есеп. 16 таңбалы алфавит арқылы жазылған хабарламаның өлшемі мегабайттың 1/16 бөлігін құраса, неше таңбадан тұрады?
Шешімі:
Берілген:


Жауабы: 131072

16 есеп. 2048 таңбадан тұратын хабарламаның өлшемі мегабайттың 1/512 бөлігін құрады. Хабарлама жазылған әліпбидің өлшемі қандай?
Шешімі:
Берілген:


Жауабы: 256

Тәуелсіз шешуге арналған тапсырмалар:

  1. Алфавиттің әрбір таңбасы екілік кодтың 4 цифрының көмегімен жазылады. Бұл әліпбиде неше таңба бар?
  2. Хабарлама жазу алфавиті 32 таңбадан тұрады, бір таңбаның ақпараттық салмағы қанша? Өлшем бірлігін көрсетуді ұмытпаңыз.
  3. Юникодты кодтау арқылы компьютерде терілген мәтіннің ақпараттық көлемі (әр таңба 16 битпен кодталған) 4 КБ құрайды. Мәтіндегі таңбалар санын анықтаңыз.
  4. Ақпараттық хабарламаның көлемі 8192 бит. Оны килобайтпен көрсетіңіз.
  5. 4 Мбайт хабарламада неше бит ақпарат бар? Жауабын 2 дәрежесімен көрсетіңіз.
  6. 256 таңбалы алфавиттегі әріптермен жазылған хабарлама 256 таңбадан тұрады. Ол килобайтта қанша ақпаратты тасымалдайды?
  7. Неше түрлілері бар? дыбыстық сигналдар, қысқа және ұзақ қоңыраулар тізбегінен тұрады. Әр сигналдың ұзақтығы - 6 қоңырау.
  8. Метеорологиялық станция ауаның ылғалдылығын бақылайды. Бір өлшемнің нәтижесі биттердің ең аз мүмкін санын пайдаланып жазылатын 20-дан 100%-ға дейінгі бүтін сан болып табылады. Станция 80 өлшеу жүргізді. Бақылаулар нәтижесінде ақпарат көлемін анықтаңыз.
  9. ADSL қосылымы арқылы деректерді беру жылдамдығы 512 000 бит/с құрайды. арқылы бұл байланысөлшемі 1500 КБ файлды тасымалдаңыз. Файлдарды тасымалдау уақытын секундтармен анықтаңыз.
  10. Модемнің жылдамдығын анықтаңыз, егер ол 640х480 пиксельдік растрлық кескінді 256 секундта жібере алады. Әр пиксел үшін 3 байт бар. Палитрада 16 миллион түс болса ше?
Алфавиттік тәсіл негізінде ақпарат көлемін анықтау тақырыбы Бірыңғай мемлекеттік емтихан тест материалдарының А1, А2, А3, А13, В5 тапсырмаларында қолданылады.

Ақпарат көлемін өлшеудің бірнеше жолы бар. Олардың бірі деп аталады алфавиттік.

Алфавиттік тәсілбелгілі бір әліпбидің таңбаларынан құралған мәтіндегі (символдық хабарлама) ақпарат көлемін өлшеуге мүмкіндік береді.

Әліпбиәріптер, белгілер, сандар, жақшалар және т.б. жиынтығы болып табылады.
Алфавиттегі таңбалар саны оның деп аталады қуат.

Алфавиттік тәсілмен мәтіндегі әрбір таңбаның өзіндік ерекшелігі бар деп есептеледі ақпарат салмағы. Таңбаның ақпараттық салмағы әліпбидің күшіне байланысты.

Ақпаратты жазу (кодтау) үшін қолданылатын алфавиттің ең аз қуаты қандай?



2, 3 және т.б. комбинациясын шақырайық. бит екілік код.

Екі битпен қанша таңбаны кодтауға болады?

Таңба реттік нөмірі

1

2

3

4

Екі таңбалы екілік код

00

01

10

11

4 таңба 2 бит.

Үш битпен қанша таңбаны кодтауға болады?

Таңба реттік нөмірі

1

2

3

4

5

6

7

8

Үш таңбалы екілік код

000

001

010

011

100

101

110

111


Бұдан шығатыны әліпбиде түбегейлі 8 таңбаәрбір кейіпкердің ақпараттық салмағы - 3 бит.

Сыйымдылығы бар әліпбиде деп қорытынды жасауға болады 16 таңбаәрбір кейіпкердің ақпараттық салмағы болады 4 бит.

Әліпбидің күшін әріппен белгілейік Н, ал таңбаның ақпараттық салмағы әріп болып табылады б.

Әліпбидің құдіреті арасындағы байланыс Нжәне таңбаның ақпараттық салмағы б.

Н

2

4

8

16

б

1 бит

Өлшеу ақпараты.

Ақпаратты өлшеудің алфавиттік тәсілі.

Бір хабарлама бір адамға көп ақпаратты алып жүруі мүмкін, ал екінші адамға мүлдем тасымалдамауы мүмкін. Бұл тәсілмен ақпарат көлемін бір мәнді түрде анықтау қиын.

Алфавиттік тәсіл қандай да бір тілде (табиғи немесе ресми) берілген хабарламаның мазмұнына қарамастан ақпарат көлемін өлшеуге мүмкіндік береді.

Кез келген шаманы сандық түрде көрсету үшін ең алдымен өлшем бірлігі қажет. Өлшеу өлшенетін шаманы өлшем бірлігімен салыстыру арқылы жүзеге асырылады. Өлшем бірлігінің өлшенетін шамаға қанша рет «сәйкес келетіні» өлшеу нәтижесі болып табылады.

Алфавиттік тәсілде белгілі бір хабардың әрбір таңбасының өзіндік ерекшелігі бар деп есептеледі ақпарат салмағы- тұрақты тасымалдайды ақпарат көлемі. Бір алфавиттің барлық таңбалары әліпбидің күшіне байланысты бірдей салмаққа ие. Екілік алфавит символының ақпараттық салмағы ақпараттың минималды бірлігі ретінде қабылданады және аталады 1 бит.

Ақпарат бірлігінің атауы «бит» ағылшын тіліндегі binary digit - «binary digit» сөзінен шыққанын ескеріңіз.

Ақпараттың ең аз бірлігі ретінде 1 бит алынады. Бұл екілік алфавит символының ақпараттық салмағы деп есептеледі.

1.6.2. Ерікті алфавит символының ақпараттық салмағы

Кез келген табиғи немесе ресми тілдің әліпбиін екілік алфавитпен алмастыруға болатынын бұған дейін білдік. Бұл жағдайда N түпнұсқа алфавитінің қуаты бастапқы алфавиттің барлық символдарын кодтау үшін қажетті i екілік кодының разрядтық сыйымдылығымен байланысты, қатынас: N = 2 i.

Алфавит таңбасының ақпараттық салмағы мен N әліпбиінің күші бір-бірімен қатынас бойынша: N = 2 i.

1-тапсырма.Пульти алфавиті 8 таңбадан тұрады. Бұл әліпбидің таңбасының ақпараттық салмағы қандай?

Шешім.Мәселенің шартын қысқаша баяндап көрейік.

i және N шамаларының арасындағы байланыс белгілі: N = 2 i.

Бастапқы деректерді ескере отырып: 8 = 2 i. Демек: i = 3.

Жазу кітапшасындағы толық шешім келесідей болуы мүмкін:

Жауабы: 3 бит.

1.6.3. Хабарламаның ақпарат көлемі

Ақпарат көлемітабиғи немесе ресми тілдің таңбаларымен бейнеленген хабарлама (хабарламадағы ақпарат көлемі), оны құрайтын белгілердің ақпараттық салмағынан тұрады.

I хабарламасының ақпараттық көлемі K хабарламадағы символдар саны мен i алфавиттік символының ақпараттық салмағының көбейтіндісіне тең: I = K * i.

Мәселе 2. 32 таңбалы алфавитпен жазылған хабарлама 140 таңбадан тұрады. Ол қанша ақпаратты тасымалдайды?

3-тапсырма.Көлемі 720 бит ақпараттық хабарлама 180 таңбадан тұрады. Бұл хабар жазылған әліпбидің құдіреті қандай?

1.6.4. Ақпарат бірліктері

Қазіргі уақытта мәтінді дайындау негізінен компьютердің көмегімен жүзеге асырылады. Біз келесі таңбаларды қамтитын «компьютерлік алфавит» туралы айтуға болады: кіші және үлкен орыс және әріптер, сандар, тыныс белгілері, арифметикалық белгілер, жақшалар және т.б. Бұл әліпбиде 256 таңба бар. 256 = 28 болғандықтан, бұл алфавиттегі әрбір таңбаның ақпараттық салмағы 8 бит. Сегіз битке тең мән байт деп аталады. 1 байт – 256 сыйымдылығы бар әліпби таңбасының ақпараттық салмағы.

1 байт = 8 бит

Бит пен байт – «кіші» өлшем бірліктері. Тәжірибеде ақпарат көлемін өлшеу үшін үлкен өлшем бірліктері қолданылады:

1 килобайт = 1 КБ = 1024 байт = 210 байт

1 мегабайт = 1 МБ = 1024 КБ = 210 КБ = 220 байт

1 гигабайт = 1 ГБ = 1024 МБ = 210 МБ = 220 КБ = 230 байт

1 терабайт = 1 ТБ = 1024 ГБ = 210 ГБ = 220 МБ = 230 КБ = 240 байт

4-тапсырма. 4 КБ ақпараттық хабарлама 4096 таңбадан тұрады. Қолданылатын әліпби таңбасының ақпараттық салмағы қандай? Бұл хабарлама жазылған алфавит неше таңбадан тұрады?

Мәселе 5. Циклокроссқа 128 спортшы қатысуда. Арнайы құрылғы әрбір қатысушының аралық мәреден өтуін тіркейді, оның нөмірін әрбір спортшы үшін бірдей нөлдер мен ең аз ұзындықтардың бір тізбегіне жазады. 80 велосипедші аралық финишті аяқтағаннан кейін құрылғымен жазылған хабарламаның ақпарат көлемі қандай болады?

Шешім. 128 қатысушының нөмірлері екілік алфавит арқылы кодталған. Екілік кодтың қажетті бит тереңдігі (тізбек ұзындығы) 7, өйткені 128 = 27. Басқаша айтқанда, бір велосипедшінің аралық фиништен өткені туралы құрылғы жазып алған хабарлама 7 бит ақпарат береді. 80 спортшы аралық финишті аяқтағанда, құрылғы 80 7 = 560 бит немесе 70 байт ақпаратты жазады.

Ақпаратты анықтауға субъективті көзқарас тұрғысынан алғанда, ақпарат адамның әртүрлі көздерден алатын хабарламаларының мазмұнын еске түсірейік. Бір хабарлама бір адамға көп ақпаратты алып жүруі мүмкін, ал екінші адамға мүлдем тасымалдамауы мүмкін. Бұл тәсілмен ақпарат көлемін бір мәнді түрде анықтау қиын.

Алфавиттік тәсіл қандай да бір тілде (табиғи немесе ресми) берілген хабарламаның мазмұнына қарамастан ақпарат көлемін өлшеуге мүмкіндік береді.

Кез келген шаманы сандық түрде көрсету үшін ең алдымен өлшем бірлігі қажет. Өлшеу өлшенетін шаманы өлшем бірлігімен салыстыру арқылы жүзеге асырылады. Өлшем бірлігінің өлшенетін шамаға қанша рет «сәйкес келетіні» өлшеу нәтижесі болып табылады.

Алфавиттік тәсілмен хабарламаның әрбір символы белгілі бір ақпараттық салмаққа ие деп есептеледі - ол белгілі бір ақпарат көлемін тасымалдайды. Бір алфавиттің барлық таңбалары әліпбидің күшіне байланысты бірдей салмаққа ие. Екілік алфавит символының ақпараттық салмағы ақпараттың ең аз бірлігі ретінде қабылданады және 1 бит деп аталады. Ақпарат бірлігінің атауы «бит» ағылшын тіліндегі «binary digit» сөзінен шыққанын ескеріңіз.

1.4.2. Ерікті алфавит символының ақпараттық салмағы

Кез келген табиғи немесе ресми тілдің әліпбиін екілік алфавитпен алмастыруға болатынын бұған дейін білдік. Бұл жағдайда N түпнұсқа алфавитінің қуаты бастапқы алфавиттің барлық символдарын кодтау үшін қажетті i екілік кодының разрядтық сыйымдылығымен байланысты, қатынас: N = 2 i.

Мәселе 1. Пульти алфавиті 8 таңбадан тұрады. Бұл әліпбидің таңбасының ақпараттық салмағы қандай?

Шешім. Мәселенің шартын қысқаша баяндап көрейік.

i және N шамаларының арасындағы байланыс белгілі: N = 2 i.

Бастапқы деректерді ескере отырып: 8 = 2 i. Демек: i = 3.

Жазу кітапшасындағы толық шешім келесідей болуы мүмкін:

Жауабы: 3 бит

1.4.3. Хабарламаның ақпарат көлемі

Табиғи немесе ресми тілдің таңбаларымен бейнеленген хабарламаның ақпараттық көлемі (хабарламадағы ақпарат көлемі), оны құрайтын белгілердің ақпараттық салмағынан тұрады.

Мәселе 2. 32 таңбалы алфавитпен жазылған хабарлама 140 таңбадан тұрады. Ол қанша ақпаратты тасымалдайды?

Шешім.

Жауап»: 700 бит.

Мәселе 3. Көлемі 720 бит ақпараттық хабарлама 180 таңбадан тұрады. Бұл хабар жазылған әліпбидің құдіреті қандай?

Шешім.

Жауабы: 16 таңба.

1.4.4. Ақпарат бірліктері

Қазіргі уақытта мәтінді дайындау негізінен компьютердің көмегімен жүзеге асырылады. Біз келесі таңбаларды қамтитын «компьютер алфавиті» туралы айтуға болады: орыс және латынның кіші және бас әріптері, сандар, тыныс белгілері, арифметикалық амалдар белгілері, жақшалар және т.б. Бұл алфавит 256 таңбадан тұрады. 256 = 2 8 болғандықтан, бұл алфавиттегі әрбір таңбаның ақпараттық салмағы 8 бит. Сегіз битке тең мән байт деп аталады. 1 байт – 256 сыйымдылығы бар әліпби таңбасының ақпараттық салмағы.

Мәселе 4. 4 КБ ақпараттық хабарлама 4096 таңбадан тұрады. Бұл хабарламаның таңбасының ақпараттық салмағы қандай? Бұл хабарлама жазылған алфавит неше таңбадан тұрады? Шешім.

Жауабы: 256 таңба.

Ең бастысы

Алфавиттік тәсілмен белгілі бір хабарламаның әрбір символы белгілі бір ақпараттық салмаққа ие деп есептеледі - ол белгілі бір ақпарат көлемін алып жүреді.

1 бит – ақпараттың ең аз бірлігі.

Алфавит таңбасының ақпараттық салмағы i және алфавиттің N дәрежесі өзара қатынас бойынша: N = 2 i . Хабарламаның I ақпараттық көлемі әліпбидің i символының ақпараттық салмағына хабарламадағы таңбалар санының К көбейтіндісіне тең: I = K i.

1 байт = 8 бит.

Байт, килобайт, мегабайт, гигабайт, терабайт ақпараттың өлшем бірліктері. Әрбір келесі бірлік алдыңғысынан 1024 (2 10) есе үлкен.

Сұрақтар мен тапсырмалар


Информатикада әліпби – ақпараттық хабарламаны жеткізу үшін қолданылатын белгілер жүйесі. Бұл анықтаманың мәнін түсіну үшін кейбір қосымша теориялық фактілер келтірілген:

  1. Кез келген хабарлама әліпбиден тұрады. Мысалы, бұл мақала хабарлама болып табылады. Содан кейін ол орыс алфавитіндегі таңбалардан тұрады.
  2. Таңба арқылы біз әліпбидің ең аз маңызды бөлігін түсіне аламыз. Бөлінбейтін бөлшектерді атомдар деп те атайды. Орыс алфавитіндегі таңбалар «а», содан кейін «б», «в» және т.б.
  3. Теориялық тұрғыдан алфавитті қандай да бір жолмен кодтау қажет емес. Мысалы, баспа кітапта әліпбидің таңбалары өздерін білдіреді, яғни оларда кодтау жоқ.

Бірақ іс жүзінде бізде мыналар бар: компьютер әріптердің не екенін түсінбейді. Сондықтан ақпараттық хабарламаны жіберу үшін оны алдымен компьютер түсінетін тілде кодтау керек. Әрі қарай жылжу үшін қосымша терминдер енгізу қажет.

Әліппенің құдіреті қандай

Әліпбидің күші деп ондағы таңбалардың жалпы санын айтамыз. Әліпбидің қаншалықты күшті екенін білу үшін ондағы таңбалардың санын санау жеткілікті. Оны анықтап көрейік. Орыс алфавиті үшін әліпбидің күші 33 немесе «ё» қолданбасаңыз 32 таңбаны құрайды.

Біздің әліпбидегі барлық таңбалар бірдей ықтималдықпен кездеседі делік. Бұл болжамды келесідей түсінуге болады: бізде таңбаланған текшелердің қапшығы бар делік. Ондағы текшелердің саны шексіз және әрқайсысы бір ғана таңбамен белгіленеді. Содан кейін біркелкі үлестіру арқылы қаптан қанша текше алсақ та, таңбалары әртүрлі текшелер саны бірдей болады немесе қаптан шығаратын текшелер саны көбейген сайын осыған бейім болады.

Ақпараттық хабарламалардың салмағын бағалау

Жүз жылдай бұрын американдық инженер Ральф Хартли хабарламадағы ақпарат көлемін бағалауға болатын формуланы ойлап тапты. Оның формуласы бірдей ықтимал оқиғалар үшін жұмыс істейді және келесідей болады:

i = log 2 M

Мұндағы «i» - хабарламадағы бөлінбейтін ақпарат атомдарының (бит) саны, «М» - әліпбидің күші. Әрі қарай жүрейік. Математикалық түрлендірулерді пайдалана отырып, біз әліпбидің қуатын келесідей есептеуге болатынын анықтай аламыз:

Бұл формула жалпы алғанда бірдей ықтимал оқиғалардың саны «M» мен «i» ақпарат мөлшері арасындағы байланысты анықтайды.

Қуатты есептеу

Фон Нейман архитектурасына негізделген заманауи есептеуіш жүйелер екілік ақпаратты кодтау жүйесін пайдаланатынын мектептегі информатика курсынан білетін боларсыз. Бағдарламалар да, деректер де осылай кодталады.

Есептеу жүйесінде мәтінді көрсету үшін сегіз саннан тұратын біркелкі код қолданылады. Код біркелкі болып саналады, себебі ол элементтердің бекітілген жиынын қамтиды - 0 және 1. Мұндай кодтағы мәндер осы элементтердің белгілі бір ретімен көрсетіледі. Сегіз разрядты кодты пайдалана отырып, біз салмағы 256 бит болатын хабарламаларды кодтай аламыз, өйткені Хартли формуласы бойынша: M 8 = 2 8 = 256 бит ақпарат.

Екілік таңбаларды кодтаумен бұл жағдай тарихи түрде дамыды. Бірақ теориялық тұрғыдан біз деректерді көрсету үшін басқа алфавиттерді пайдалана аламыз. Мәселен, мысалы, төрт таңбалы әліпбиде әрбір таңбаның салмағы бір емес, екі бит, сегіз таңбалы алфавитте - 3 бит және т.б. Бұл жоғарыда келтірілген екілік логарифм арқылы есептеледі ( i = log 2 M).

256 бит қуаты бар алфавитте бір таңбаны белгілеу үшін сегіз екілік цифр бөлінгендіктен, ақпараттың қосымша өлшемі - байт енгізу туралы шешім қабылданды. Бір байт бір ASCII таңбасын қамтиды және сегіз биттен тұрады.

Ақпарат қалай өлшенеді

Сегіз разрядты кодтау мәтіндік хабарлар ASCII таңбалар кестесінде қолданылатын , орналастыруға мүмкіндік береді негізгі жиынтығыЛатын және кириллицаның бас және кіші әріптері, сандар, тыныс белгілері және басқа да негізгі таңбалар.

Деректердің үлкен көлемін өлшеу үшін байт және бит сөздеріне арнайы префикстер қолданылады. Мұндай префикстер төмендегі кестеде көрсетілген:

Физиканы зерттеген көптеген адамдар ақпарат бірліктерін (мысалы, кило- және мега-) белгілеу үшін классикалық префикстерді пайдалану ұтымды болар еді деп даулайды, бірақ шын мәнінде бұл мүлдем дұрыс емес, өйткені шамаға мұндай префикстер бір немесе санға көбейтуді білдіреді. он санының тағы бір күші, бұл кезде информатикада екілік өлшеу жүйесі барлық жерде қолданылады.

Деректер бірліктерінің дұрыс атаулары

Дәлсіздіктер мен ыңғайсыздықтарды жою үшін 1999 жылы наурызда Электротехника саласындағы халықаралық комиссия электрондық форматтағы ақпарат көлемін анықтау үшін қолданылатын бірліктерге жаңа префикстерді бекітті. компьютерлік технология. Бұл префикстер «меби», «киби», «гиби», «теби», «эксби», «пети» болды. Бұл қондырғылар әлі тамыр жайған жоқ, сондықтан бұл стандартты енгізу және кеңінен қолдануды бастау үшін уақыт қажет болуы мүмкін. Классикалық бірліктерден жаңадан бекітілгендерге өтуді келесі кесте арқылы анықтауға болады:

Бізде K символы бар мәтін бар деп есептейік. Содан кейін алфавиттік тәсілді қолдана отырып, біз оның құрамындағы V ақпараттың көлемін есептей аламыз. Ол әліпби қуаты мен ондағы бір таңбаның ақпараттық салмағының көбейтіндісіне тең болады.

Хартли формуласын пайдалана отырып, біз екілік логарифм арқылы ақпарат көлемін қалай есептеу керектігін білеміз. Алфавит таңбаларының саны N, ал ақпараттық хабарлама жазбасындағы символдар саны K деп есептесек, хабарламаның ақпараттық көлемін есептеу үшін келесі формуланы аламыз:

V = K ⋅ log 2 N

Алфавиттік тәсіл ақпарат көлемі тек алфавит қуатына және хабарламалардың көлеміне (яғни ондағы таңбалар санына) байланысты болады, бірақ адам үшін семантикалық мазмұнмен ешқандай байланыста болмайтынын көрсетеді. .

Қуатты есептеу мысалдары

Информатика сабақтарында олар көбінесе әліпбидің күшін, хабарламаның ұзындығын немесе ақпарат көлемін табуға есептер береді. Міне, осындай тапсырмалардың бірі:

"Мәтіндік файл дискідегі 11 КБ орынды алады және 11264 таңбадан тұрады. Осы мәтіндік файлдың алфавиттік сыйымдылығын анықтаңыз."

Шешім қандай болатынын төмендегі суреттен көруге болады.

Сонымен, сыйымдылығы 256 таңбадан тұратын алфавит тек 8 бит ақпаратты тасымалдайды, оны информатикада бір байт деп атайды. Байт ASCII кестесінің 1 таңбасын сипаттайды, егер сіз бұл туралы ойласаңыз, бұл мүлдем көп емес.

Бір байт көп пе, әлде аз ба?

Google және Facebook деректер орталықтары сияқты заманауи деректер қоймаларында ондаған петабайттан кем емес ақпарат бар. Дегенмен, деректердің нақты көлемін тіпті олар үшін де есептеу қиын болады, өйткені серверлердегі барлық процестерді тоқтатып, пайдаланушыларға жеке мәліметтерін жазуға және өңдеуге рұқсат бермеу керек болады.

Бірақ мұндай керемет көлемдегі деректерді елестету үшін бәрі ұсақ бөлшектерден тұратынын анық түсіну керек. Әліпбидің күші қандай екенін (256) және 1 байт ақпарат қанша биттен тұратынын (есіңізде болса, 8) түсіну керек.




Жоғарғы