Која е моќта на азбучните информации. Информативен волумен на текстот и единици за мерење на информации. Методи за мерење на информации во електронска форма

РЕШАВАЊЕ НА ПРОБЛЕМ

Кога складирате и пренесувате информации користејќи технички уредиинформациите треба да се сметаат како низа од симболи - знаци (букви, бројки, шифри на бои на точките на сликата итн.).

Збир на симболи на знаковен систем (азбука) може да се смета за различни можни состојби (настани).
Потоа, ако претпоставиме дека појавата на симболи во пораката е подеднакво веројатна, бројот на можни настани Нможе да се пресмета како N=2 i
Количина на информации во порака Јасможе да се пресмета со множење на бројот на знаци Кпо тежина на информации од еден знак јас
Значи, ги имаме формулите потребни за да се одреди количината на информации во азбучниот пристап:

Можни се следните комбинации на познати (дадени) и барани (Најди) количини:

ТипСо оглед наНајдетеФормула
1 јас Н N=2 i
2 Н јас
3 јас, К Јас I=K*i
4 јас, јас К
5 Јас, К јас
6 Н, К Јас Двете формули
7 Н, И К
8 Јас, К Н

Ако на овие проблеми се додадат задачи за односот на величините запишани во различни мерни единици, користејќи го приказот на величините во форма на сили од два, добиваме 9 типа задачи.
Ајде да ги разгледаме задачите од сите видови. Ајде да се договориме дека кога се движиме од една единица за мерење информации во друга, ќе изградиме синџир на вредности. Тогаш веројатноста за грешка во пресметката се намалува.

Проблем 1. Примена е порака со информативен волумен од 32 бита. Колку е овој волумен во бајти?

Решение: има 8 бита во еден бајт. 32:8=4
Одговор: 4 бајти.

Проблем 2. Волуменот на информативната порака е 12582912 бита, изразен во килобајти и мегабајти.

Решение: бидејќи 1Кбајт=1024 бајти=1024*8 бита, тогаш 12582912:(1024*8)=1536 Кбајти и
бидејќи 1 MB = 1024 KB, потоа 1536: 1024 = 1,5 MB
Одговор: 1536KB и 1,5MB.

Задача 3.Компјутерот има RAM меморија 512 MB. Бројот на битови што одговараат на оваа вредност е поголем:

1) 10 000 000 000 бити 2) 8 000 000 000 бити 3) 6 000 000 000 бити 4) 4 000 000 000 бити Решение: 512 * 1024 * 1024 * 4 битови = 1024 * 8 битови.
Одговор: 4.

Задача 4.Одреди го бројот на битови во два мегабајти, користејќи само моќи од 2 за броеви.
Решение: Бидејќи 1 бајт = 8 бита = 2 3 бита, и 1 MB = 2 10 KB = 2 20 бајти = 2 23 бита. Оттука, 2MB = 2 24 бита.
Одговор: 2 24 бита.

Задача 5.Колку мегабајти информации содржи 2 23 битна порака?
Решение: Бидејќи 1 бајт = 8 бита = 2 3 бита, тогаш
2 23 бита=2 23 *2 23 *2 3 бита=2 10 2 10 бајти=2 10 KB=1MB.
Одговор: 1MB

Задача 6.Еден знак од азбуката „тежи“ 4 бита. Колку знаци има во оваа азбука?
Решение:
Со оглед на:


Одговор: 16

Задача 7.Секој знак од азбуката е напишан со 8 цифри од бинарен код. Колку знаци има во оваа азбука?
Решение:
Со оглед на:


Одговор: 256

Задача 8.Руската азбука понекогаш се проценува на 32 букви. Која е информациската тежина на една буква од таква скратена руска азбука?
Решение:
Со оглед на:


Одговор: 5

Задача 9.Азбуката се состои од 100 знаци. Колку информации носи еден знак од оваа азбука?
Решение:
Со оглед на:


Одговор: 5

Проблем 10.Племето Чичевок во својата азбука има 24 букви и 8 бројки. Нема интерпункциски знаци или аритметички знаци. Кој е минималниот број на бинарни цифри што им се потребни за да ги кодираат сите знаци? Ве молиме имајте предвид дека зборовите мора да бидат одделени еден од друг!
Решение:
Со оглед на:


Одговор: 5

Задача 11.Книгата, напишана со помош на компјутер, содржи 150 страници. Секоја страница има 40 линии, секоја линија има 60 знаци. Колку информации има во книгата? Дајте го вашиот одговор во килобајти и мегабајти
Решение:
Со оглед на:


Одговор: 351KB или 0,4MB

Задача 12.Обемот на информации на текстот на книгата, внесен на компјутер со кодирање на Уникод, е 128 килобајти. Одреди го бројот на знаци во текстот на книгата.
Решение:
Со оглед на:


Одговор: 65536

Задача 13.Информативната порака од 1,5 KB содржи 3072 знаци. Одредете ја информациската тежина на еден знак од користената азбука
Решение:
Со оглед на:


Одговор: 4

Задача 14.Пораката, напишана со букви од азбуката од 64 знаци, содржи 20 знаци. Колку информации носи?
Решение:
Со оглед на:


Одговор: 120 бита

Задача 15.Колку знаци содржи порака напишана со азбука од 16 знаци ако нејзината големина е 1/16 од мегабајт?
Решение:
Со оглед на:


Одговор: 131072

Задача 16.Големината на пораката, која содржи 2048 знаци, беше 1/512 од мегабајт. Која е големината на азбуката во која е напишана пораката?
Решение:
Со оглед на:


Одговор: 256

Задачи за независно решение:

  1. Секој знак од азбуката е напишан со 4 цифри од бинарен код. Колку знаци има во оваа азбука?
  2. Азбуката за пишување пораки се состои од 32 знаци; колкава е тежината на информациите на еден знак? Не заборавајте да ја наведете мерната единица.
  3. Обемот на информации на текстот напишан на компјутер со користење на Unicode кодирање (секој знак е кодиран со 16 бита) е 4 KB. Одреди го бројот на знаци во текстот.
  4. Волуменот на информативната порака е 8192 бита. Изрази го во килобајти.
  5. Колку битови информации содржи порака од 4 MB? Наведете го одговорот во моќност од 2.
  6. Пораката напишана со букви од азбуката од 256 знаци содржи 256 знаци. Колку информации носи во килобајти?
  7. Колку различни има? звучни сигнали, кој се состои од секвенци на кратки и долги повици. Должината на секој сигнал е 6 повици.
  8. Метеоролошката станица ја следи влажноста на воздухот. Резултатот од едно мерење е цел број од 20 до 100%, кој се пишува со користење на најмал можен број на битови. Станицата направи 80 мерења. Одредете го обемот на информации како резултат на набљудувања.
  9. Брзината на пренос на податоци преку ADSL конекција е 512.000 bps. Преку оваа врскапрефрлете датотека од 1500 KB во големина. Одредете го времето за пренос на датотеки во секунди.
  10. Одредете ја брзината на модемот ако може да пренесе растерска слика од 640x480 пиксели за 256 секунди. Има 3 бајти за секој пиксел. Што ако има 16 милиони бои во палетата?
Темата за одредување на количината на информации врз основа на азбучен пристап се користи во задачите А1, А2, А3, А13, Б5 од материјалите за тестирање на Обединетиот државен испит.

Постојат неколку начини за мерење на количината на информации. Еден од нив се вика азбучен.

Азбучен пристапви овозможува да ја измерите количината на информации во текст (симболична порака) составен од знаци од одредена азбука.

Азбукае збир на букви, знаци, бројки, загради итн.
Бројот на знаци во азбуката се нарекува негов моќ.

Со азбучниот пристап, се верува дека секој знак од текстот има специфичен информациска тежина. Информативната тежина на симболот зависи од моќта на азбуката.

Која е минималната моќност на азбуката што може да се користи за снимање (шифрирање) на информации?



Да ја наречеме комбинацијата од 2, 3 итн. малку бинарен код.

Колку знаци може да се кодираат со два бита?

Број на низа на симболи

1

2

3

4

Двоцифрен бинарен код

00

01

10

11

4 карактери 2 бита.

Колку знаци може да се кодираат со три бита?

Број на низа на симболи

1

2

3

4

5

6

7

8

Трицифрен бинарен код

000

001

010

011

100

101

110

111


Следи дека во азбуката со кардиналност 8 знациинформациска тежина на секој лик - 3 бита.

Можеме да заклучиме дека во азбуката со капацитет 16 карактериинформациската тежина на секој знак ќе биде 4 бита.

Да ја означиме моќта на азбуката со буквата Н, а информациската тежина на симболот е буквата б.

Односот помеѓу моќта на азбуката Ни информациската тежина на симболот б.

Н

2

4

8

16

б

1 бит

Информации за мерење.

Азбучен пристап кон мерењето на информациите.

Истата порака може да носи многу информации за една личност и воопшто да не ја носи за друга личност. Со овој пристап, тешко е недвосмислено да се одреди количината на информации.

Азбучниот пристап ни овозможува да го измериме обемот на информации на порака претставена на некој јазик (природен или формален), без оглед на нејзината содржина.

За квантитативно изразување на која било големина, пред сè, потребна е мерна единица. Мерењето се врши со споредување на измерената вредност со мерна единица. Бројот на пати кога една мерна единица „се вклопува“ во измерената вредност е резултат на мерењето.

Во азбучниот пристап, се верува дека секој знак од одредена порака има специфичен информациска тежина- носи фиксна количина на информации. Сите знаци од иста азбука имаат иста тежина, во зависност од моќта на азбуката. Информациската тежина на симболот на бинарната азбука се зема како минимална единица на информации и се нарекува 1 бит.

Забележете дека името на единицата за информации „бит“ доаѓа од англиската фраза бинарна цифра - „бинарна цифра“.

1 бит се зема како минимална единица на информации. Се верува дека ова е информациската тежина на симболот на бинарната азбука.

1.6.2. Информативна тежина на знак од произволна азбука

Претходно дознавме дека азбуката на кој било природен или формален јазик може да се замени со бинарна азбука. Во овој случај, моќта на оригиналната азбука N е поврзана со битниот капацитет на бинарниот код i потребен за кодирање на сите знаци од оригиналната азбука, релацијата: N = 2 i.

Информациската тежина на азбучниот симбол i и моќта на азбуката N се поврзани една со друга со релацијата: N = 2 i.

Задача 1.Азбуката Пулти содржи 8 знаци. Која е информациската тежина на симболот на оваа азбука?

Решение.Ајде да дадеме кратка изјава за условите на проблемот.

Позната е врската помеѓу величините i и N: N = 2 i.

Земајќи ги предвид првичните податоци: 8 = 2 i. Оттука: i = 3.

Целосното решение во тетратка може да изгледа вака:

Одговор: 3 бита.

1.6.3. Информативен волумен на пораката

Обем на информациипорака (количината на информации во пораката), претставена со симболи на природен или формален јазик, се состои од информациската тежина на нејзините составни симболи.

Информацискиот волумен на пораката I е еднаков на производот од бројот на знаци во пораката K и информациската тежина на азбучниот знак i: I = K * i.

Проблем 2. Пораката, напишана со азбука од 32 знаци, содржи 140 знаци. Колку информации носи?

Задача 3.Информативната порака со волумен од 720 бита се состои од 180 знаци. Која е моќта на азбуката во која е напишана оваа порака?

1.6.4. Единици на информации

Во денешно време, подготовката на текст главно се врши со помош на компјутери. Можеме да зборуваме за „компјутерска азбука“, која ги вклучува следните знаци: мали и големи руски и писма, броеви, интерпункциски знаци, аритметички симболи, загради итн. Оваа азбука содржи 256 знаци. Бидејќи 256 = 28, информациската тежина на секој знак во оваа азбука е 8 бита. Вредноста еднаква на осум бита се нарекува бајт. 1 бајт е информациска тежина на азбучен симбол со капацитет од 256.

1 бајт = 8 бита

Бит и бајт се „мали“ мерни единици. Во пракса, поголеми единици се користат за мерење на обемот на информации:

1 килобајт = 1 KB = 1024 бајти = 210 бајти

1 мегабајт = 1 MB = 1024 KB = 210 KB = 220 бајти

1 гигабајт = 1 GB = 1024 MB = 210 MB = 220 KB = 230 бајти

1 терабајт = 1 TB = 1024 GB = 210 GB = 220 MB = 230 KB = 240 бајти

Задача 4.Информативната порака од 4 KB се состои од 4096 знаци. Која е информациската тежина на користениот симбол на азбуката? Колку знаци содржи азбуката со која е напишана оваа порака?

Проблем 5. Во циклокрос учествуваат 128 спортисти. Посебен уред го регистрира поминувањето на средниот финиш на секој учесник, запишувајќи го неговиот број во синџир од нули и оние со минимална должина, исти за секој спортист. Колкав ќе биде обемот на информации на пораката снимена од уредот откако 80 велосипедисти ќе ја завршат средната завршница?

Решение. Броевите на 128 учесници се кодирани со помош на бинарната азбука. Потребната длабочина на бит на бинарниот код (должина на синџирот) е 7, бидејќи 128 = 27. Со други зборови, пораката снимена од уредот дека еден велосипедист ја поминал средната завршница носи 7 бита информации. Кога 80 спортисти ќе ја завршат средната завршница, уредот ќе сними 80 7 = 560 бита, или 70 бајти информации.

Да се ​​потсетиме дека, од гледна точка на субјективен пристап кон дефинирањето на информациите, информацијата е содржината на пораките што едно лице ги добива од различни извори. Истата порака може да носи многу информации за една личност и воопшто да не ја носи за друга личност. Со овој пристап, тешко е недвосмислено да се одреди количината на информации.

Азбучниот пристап ни овозможува да го измериме обемот на информации на порака претставена на некој јазик (природен или формален), без оглед на нејзината содржина.

За квантитативно изразување на која било големина, пред сè, потребна е мерна единица. Мерењето се врши со споредување на измерената вредност со мерна единица. Бројот на пати кога една мерна единица „се вклопува“ во измерената вредност е резултат на мерењето.

Со азбучен пристап, се верува дека секој знак од пораката има одредена информациска тежина - носи фиксна количина на информации. Сите знаци од иста азбука имаат иста тежина, во зависност од моќта на азбуката. Информативната тежина на симболот на бинарната азбука се зема како минимална единица на информации и се нарекува 1 бит. Имајте предвид дека името на единицата за информации „бит“ доаѓа од англиската фраза „бинарна цифра“.

1.4.2. Информативна тежина на знак од произволна азбука

Претходно дознавме дека азбуката на кој било природен или формален јазик може да се замени со бинарна азбука. Во овој случај, моќта на оригиналната азбука N е поврзана со битниот капацитет на бинарниот код i потребен за кодирање на сите знаци од оригиналната азбука, релацијата: N = 2 i.

Проблем 1. Азбуката Пулти содржи 8 знаци. Која е информациската тежина на симболот на оваа азбука?

Решение. Ајде да дадеме кратка изјава за условите на проблемот.

Позната е врската помеѓу величините i и N: N = 2 i.

Земајќи ги предвид првичните податоци: 8 = 2 i. Оттука: i = 3.

Целосното решение во тетратка може да изгледа вака:

Одговор: 3 бита

1.4.3. Информативен волумен на пораката

Обемот на информации на пораката (количината на информации во пораката), претставена со симболи на природен или формален јазик, се состои од информациската тежина на нејзините составни симболи.

Проблем 2. Пораката, напишана со азбука од 32 знаци, содржи 140 знаци. Колку информации носи?

Решение.

Одговор“: 700 бита.

Проблем 3. Информативната порака со волумен од 720 бита се состои од 180 знаци. Која е моќта на азбуката во која е напишана оваа порака?

Решение.

Одговор: 16 знаци.

1.4.4. Единици на информации

Во денешно време, подготовката на текст главно се врши со помош на компјутери. Можеме да зборуваме за „компјутерска азбука“ која ги вклучува следните знаци: мали и големи руски и латински букви, бројки, интерпункциски знаци, знаци за аритметички операции, загради итн. Оваа азбука содржи 256 знаци. Бидејќи 256 = 2 8, информациската тежина на секој знак во оваа азбука е 8 бита. Вредноста еднаква на осум бита се нарекува бајт. 1 бајт е информациска тежина на азбучен симбол со капацитет од 256.

Проблем 4. Информативната порака од 4 KB се состои од 4096 знаци. Која е информативната тежина на симболот на оваа порака? Колку знаци содржи азбуката со која е напишана оваа порака? Решение.

Одговор: 256 знаци.

Најважниот

Со азбучен пристап, се верува дека секој знак од одредена порака има одредена информациска тежина - носи фиксна количина на информации.

1 бит е минималната единица на информации.

Информациската тежина i на симболот на азбуката и моќта N на азбуката се поврзани една со друга со релацијата: N = 2 i . Информацискиот волумен I на пораката е еднаков на производот од бројот K на знаците во пораката со информациската тежина на знакот i од азбуката: I = K i.

1 бајт = 8 бита.

Бајт, килобајт, мегабајт, гигабајт, терабајт се единици за мерење на информации. Секоја следна единица е 1024 (2 10) пати поголема од претходната.

Прашања и задачи


Во компјутерската наука, азбуката е систем на знаци што може да се користи за да се пренесе информативна порака. За да се разбере суштината на оваа дефиниција, еве неколку дополнителни теоретски факти:

  1. Секоја порака се состои од азбука. На пример, оваа статија е порака. Потоа се состои од знаци од руската азбука.
  2. По симболот можеме да ја разбереме минимално значајната честичка на азбуката. Неделивите честички се нарекуваат и атоми. Ликовите во руската азбука се „а“, потоа „б“, „в“ и така натаму.
  3. Во теорија, азбуката не треба да биде кодирана на кој било начин. На пример, во печатена книга, знаците од азбуката значат самите себе, што значи дека немаат никакво кодирање.

Но, во пракса го имаме следново: компјутерот не разбира што се букви. Затоа, за да се пренесе информативна порака, таа прво мора да биде кодирана на јазик што компјутерот може да го разбере. За да се придвижи понатаму, потребно е да се воведат дополнителни термини.

Која е моќта на азбуката

Под моќност на азбуката го мислиме вкупниот број на знаци во неа. За да дознаете колку е моќна азбуката, само треба да го изброите бројот на знаци во неа. Ајде да го сфатиме. За руската азбука, моќта на азбуката е 33 или 32 знаци ако не користите „ё“.

Да претпоставиме дека сите знаци во нашата азбука се појавуваат со еднаква веројатност. Оваа претпоставка може да се разбере на следниов начин: да речеме дека имаме вреќа со означени коцки. Бројот на коцки во него е бесконечен, а секоја е потпишана само со еден симбол. Потоа, со рамномерна распределба, без разлика колку коцки ќе извадиме од кесата, бројот на коцки со различни симболи ќе биде ист или ќе се стреми кон тоа како што се зголемува бројот на коцки што ги вадиме од кесата.

Проценка на тежината на информативните пораки

Пред речиси сто години, американскиот инженер Ралф Хартли разви формула која може да се користи за да се процени количината на информации во пораката. Неговата формула работи за подеднакво веројатни настани и изгледа вака:

i = лог 2 М

Каде што „i“ е бројот на неделиви информациски атоми (битови) во пораката, „М“ е моќта на азбуката. Ајде да продолжиме. Користејќи математички трансформации, можеме да утврдиме дека моќта на азбуката може да се пресмета на следниов начин:

Оваа формула генерално ја дефинира врската помеѓу бројот на подеднакво веројатни настани „М“ и количината на информации „i“.

Пресметувачка моќност

Најверојатно, веќе знаете од курсот за компјутерски науки во вашето училиште дека современите компјутерски системи изградени на архитектурата на фон Нојман користат бинарен систем за кодирање на информации. Така се кодираат и програмите и податоците.

За да се претстави текстот во компјутерски систем, се користи единствен код од осум цифри. Шифрата се смета за униформа затоа што содржи фиксен сет на елементи - 0 и 1. Вредностите во таков код се специфицирани со одреден редослед на овие елементи. Со помош на осум-битен код, можеме да шифрираме пораки со тежина од 256 бита, бидејќи според формулата на Хартли: M 8 = 2 8 = 256 бита информации.

Оваа ситуација со кодирање на бинарни знаци се разви историски. Но, теоретски би можеле да користиме други азбуки за да ги претставиме податоците. Така, на пример, во азбука со четири знаци, секој знак би имал тежина не од еден, туку два бита, во азбука со осум знаци - 3 бита итн. Ова се пресметува со користење на бинарниот логаритам што беше даден погоре ( i = лог 2 М).

Бидејќи во азбука со моќност од 256 бита се доделуваат осум бинарни цифри за означување на еден знак, беше одлучено да се воведе дополнителна мерка на информации - бајт. Еден бајт содржи еден знак ASCII и содржи осум бита.

Како се мерат информациите

Осумбитно кодирање текстуални пораки, кој се користи во табелата со знаци ASCII, ви овозможува да приспособите основен сетЛатински и кирилични знаци со големи и мали букви, бројки, интерпункциски симболи и други основни знаци.

За да се измерат поголеми количини на податоци, се користат специјални префикси за зборовите бајт и бит. Таквите префикси се прикажани во табелата подолу:

Многу луѓе кои студирале физика ќе тврдат дека би било рационално да се користат класични префикси за означување единици на информации (како кило- и мега-), но всушност тоа не е сосема точно, бидејќи таквите префикси на количините означуваат множење со еден или уште една моќност на бројот десет, кога во компјутерската наука секаде се користи бинарниот систем за мерење.

Точни имиња на податочни единици

Со цел да се елиминираат неточностите и непријатностите, во март 1999 година, Меѓународната комисија од областа на електротехниката одобри нови префикси на единиците што се користат за одредување на количината на информации во електронските компјутерска технологија. Овие префикси беа „меби“, „киби“, „гиби“, „теби“, „ексби“, „пети“. Овие единици сè уште не се вкорениле, така што најверојатно ќе биде потребно време да се воведе овој стандард и да се започне со широка употреба. Можете да одредите како да направите премин од класични единици на новоодобрени користејќи ја следната табела:

Да претпоставиме дека имаме текст кој содржи K знаци. Потоа, користејќи го азбучниот пристап, можеме да ја пресметаме количината на информации V што ги содржи. Тоа ќе биде еднакво на производот на моќта на азбуката и информациската тежина на еден знак во неа.

Користејќи ја формулата на Хартли, знаеме како да ја пресметаме количината на информации преку бинарниот логаритам. Претпоставувајќи дека бројот на азбучните знаци е N и бројот на знаци во записот на информативната порака е K, ја добиваме следната формула за пресметување на обемот на информации на пораката:

V = K ⋅ log 2 N

Азбучниот пристап покажува дека обемот на информации ќе зависи само од моќта на азбуката и големината на пораките (односно, бројот на знаци во неа), но нема да биде поврзан на кој било начин со семантичката содржина за една личност. .

Примери за пресметување на моќноста

На часовите по компјутерски науки, тие често даваат проблеми за да ја пронајдат моќта на азбуката, должината на пораката или обемот на информации. Еве една таква задача:

"Текстуалната датотека зафаќа 11 KB простор на дискот и содржи 11264 знаци. Одредете го капацитетот на азбуката на оваа текстуална датотека."

Какво ќе биде решението може да се види на сликата подолу.

Така, азбуката со капацитет од 256 знаци носи само 8 бита информации, кои во компјутерската наука се нарекуваат еден бајт. Еден бајт опишува 1 знак од табелата ASCII, што, ако размислите добро, воопшто не е многу.

Дали еден бајт е многу или малку?

Современите складишта за податоци како Google и Facebook дата центрите содржат не помалку од десетици петабајти информации. Точниот износ на податоци, сепак, ќе биде тешко да се пресмета дури и за нив, бидејќи тогаш ќе биде неопходно да се запрат сите процеси на серверите и да се оневозможи пристапот на корисниците за снимање и уредување на нивните лични информации.

Но, за да замислите такви неверојатни количини на податоци, треба јасно да разберете дека сè е составено од мали детали. Неопходно е да се разбере каква е моќта на азбуката (256) и колку битови содржи 1 бајт информации (како што се сеќавате, 8).




Врв