Која е моќта на азбучните информации. Обемот на информации на текстот и единиците за мерење на информациите. Методи за мерење на информации во електронска форма

РЕШАВАЊЕ НА ПРОБЛЕМ

Кога складирате и пренесувате информации користејќи технички уредиинформациите треба да се сметаат како низа од симболи - знаци (букви, бројки, шифри на бои на точките на сликата итн.).

Збирот на знаци на знаковен систем (азбука) може да се гледа како различни можни состојби (настани).
Потоа, ако претпоставиме дека појавата на знаци во пораката е подеднакво веројатна, бројот на можни настани Нможе да се пресмета како N=2 i
Количината на информации во пораката Јасможе да се пресмета со множење на бројот на знаци Кпо информативна тежина на еден лик јас
Значи, ги имаме формулите потребни за да се одреди количината на информации во азбучниот пристап:

Можни се следните комбинации на познати (дадени) и потребни (најди) вредности:

ТипСо оглед наНајдетеФормула
1 јас Н N=2 i
2 Н јас
3 јас, К Јас I=K*i
4 јас, јас К
5 Јас, К јас
6 Н, К Јас Двете формули
7 Н, И К
8 Јас, К Н

Ако на овие задачи се додадат задачи за односот на величините запишани во различни мерни единици, користејќи го приказот на величините во форма на сили од два, ќе добиеме 9 типа задачи.
Размислете за задачи за сите видови. Да се ​​договориме дека при преминот од една единица за мерење на информации во друга, ќе изградиме синџир на вредности. Тогаш веројатноста за грешка во пресметката се намалува.

Задача 1. Примена е порака со големина на податоци од 32 бита. колку е оваа големина во бајти?

Решение: има 8 бита во еден бајт. 32:8=4
Одговор: 4 бајти.

Задача 2. Обемот на информативната порака е 12582912 бита изразен во килобајти и мегабајти.

Решение: бидејќи 1KB=1024 бајти=1024*8 бита, тогаш 12582912:(1024*8)=1536KB и
бидејќи 1MB = 1024 KB, потоа 1536:1024 = 1,5 MB
Одговор: 1536KB и 1,5MB.

Задача 3.Компјутерот има RAM меморија 512 MB. Бројот на битови што одговараат на оваа вредност е поголем:

1) 10.000.000.000 бита 2) 8.000.000.000 бита 3) 6.000.000.000 бити 4) 4.000.000.000 бита Решение: 512*1024*1024*49 бити=1024*49 бита.
Одговор: 4.

Задача 4.Одреди го бројот на битови во два мегабајти, користејќи само моќи од 2 за броеви.
Решение: Бидејќи 1бајт=8бита=2 3 бита и 1МБ=2 10Кбајти=2 20 бајти=2 23 бита. Оттука, 2MB = 2 24 бита.
Одговор: 2 24 бита.

Задача 5.Колку мегабајти информации содржи 2 23 битна порака?
Решение: Бидејќи 1 бајт = 8 бита = 2 3 бита, тогаш
2 23 бита=2 23 *2 23 *2 3 бита=2 10 2 10 бајти=2 10 KB=1MB.
Одговор: 1MB

Задача 6.Еден знак од азбуката „тежи“ 4 бита. Колку знаци има во оваа азбука?
Решение:
Со оглед на:


Одговор: 16

Задача 7.Секој знак од азбуката е напишан со 8 цифри од бинарен код. Колку знаци има во оваа азбука?
Решение:
Со оглед на:


Одговор: 256

Задача 8.Руската азбука понекогаш се проценува на 32 букви. Која е информациската тежина на една буква од таква скратена руска азбука?
Решение:
Со оглед на:


Одговор: 5

Задача 9.Азбуката се состои од 100 знаци. Колку информации носи еден знак од оваа азбука?
Решение:
Со оглед на:


Одговор: 5

Задача 10.Племето Чичевок има 24 букви и 8 бројки во азбуката. Нема интерпункциски знаци или аритметички знаци. Кој е минималниот број на битови што им се потребни за да ги кодираат сите знаци? Забележете дека зборовите мора да бидат одвоени еден од друг!
Решение:
Со оглед на:


Одговор: 5

Задача 11.Книгата, напишана со помош на компјутер, содржи 150 страници. Секоја страница има 40 линии, секоја линија има 60 знаци. Колку информации има во книгата? Дајте го вашиот одговор во килобајти и мегабајти.
Решение:
Со оглед на:


Одговор: 351KB или 0,4MB

Задача 12.Обемот на информации на текстот на книгата напишан на компјутер со кодирање на Уникод е 128 килобајти. Одреди го бројот на знаци во текстот на книгата.
Решение:
Со оглед на:


Одговор: 65536

Задача 13.Информативна порака од 1,5 Kb содржи 3072 знаци. Одредете ја информациската тежина на еден знак од употребената азбука
Решение:
Со оглед на:


Одговор: 4

Задача 14.Порака напишана со букви од азбуката од 64 знаци содржи 20 знаци. Колку информации носи?
Решение:
Со оглед на:


Одговор: 120 бита

Задача 15.Колку знаци содржи порака напишана со азбука од 16 знаци ако нејзиниот волумен бил 1/16 од мегабајт?
Решение:
Со оглед на:


Одговор: 131072

Задача 16.Обемот на пораката што содржи 2048 знаци беше 1/512 од мегабајт. Која е големината на азбуката со која е напишана пораката?
Решение:
Со оглед на:


Одговор: 256

Задачи за независно решение:

  1. Секој знак од азбуката е напишан со 4 бинарни цифри. Колку знаци има во оваа азбука?
  2. Азбуката за пишување пораки се состои од 32 знаци, колкава е информативната тежина на еден знак? Не заборавајте да ја наведете единицата мерка.
  3. Обемот на информации на текстот напишан на компјутер со користење на кодирање Unicode (секој знак е кодиран во 16 бита) е 4 KB. Одреди го бројот на знаци во текстот.
  4. Големината на информативната порака е 8192 бита. Изрази го во килобајти.
  5. Колку битови информации содржи порака од 4 MB? Дајте го вашиот одговор во моќност од 2.
  6. Порака напишана со букви од азбука од 256 знаци содржи 256 знаци. Колку информации носи во килобајти?
  7. Колку различни звучни сигнали, кој се состои од секвенци на кратки и долги повици. Должината на секој сигнал е 6 прстени.
  8. Метеоролошката станица ја следи влажноста на воздухот. Резултатот од едно мерење е цел број од 20 до 100%, кој се пишува со користење на минималниот можен број на битови. Станицата направи 80 мерења. Определете го обемот на информации на резултатот од набљудувањето.
  9. Брзината на пренос на податоци преку ADSL конекција е 512.000 bps. Преку ова соединениеиспрати датотека од 1500 KB. Наведете го времето за пренос на датотеки во секунди.
  10. Одредете ја брзината на модемот дали може да пренесе битмапа од 640x480 пиксели за 256 секунди. Има 3 бајти по пиксел. И ако има 16 милиони бои во палетата?
Темата за одредување на количината на информации врз основа на азбучен пристап се користи во задачите A1, A2, A3, A13, B5 од USE тестот и мерните материјали.

Постојат неколку начини за мерење на количината на информации. Еден од нив се нарекува азбучен.

Азбучен пристапви овозможува да ја измерите количината на информации во текст (симболична порака) составен од знаци од некоја азбука.

Азбукае збир на букви, знаци, бројки, загради итн.
Бројот на знаци во азбуката се нарекува негов моќ.

Во азбучниот пристап се смета дека секој знак од текстот има одреден информациска тежина. Информативната тежина на симболот зависи од моќта на азбуката.

Која е минималната кардиналност на азбуката што може да се користи за пишување (шифрирање) информации?



Да ја наречеме комбинацијата од 2, 3 итн. малку бинарен код.

Колку знаци може да се кодираат со два бита?

Број на низа на симболи

1

2

3

4

Двоцифрен бинарен код

00

01

10

11

4 карактери 2 бита.

Колку знаци може да се кодираат со три бита?

Број на низа на симболи

1

2

3

4

5

6

7

8

Трицифрен бинарен код

000

001

010

011

100

101

110

111


Од ова произлегува дека во азбуката на кардиналноста 8 знациинформативна тежина на секој лик - 3 бита.

Може да се заклучи дека во азбуката со моќ 16 карактериинформациската тежина на секој знак ќе биде 4 бита.

Означете ја кардиналноста на азбуката со буквата Н, а информативната тежина на симболот е буквата б.

Односот помеѓу моќта на азбуката Ни тежина на информации за симболот б.

Н

2

4

8

16

б

1 бит

Мерење на информации.

Азбучен пристап за мерење информации.

Истата порака може да носи многу информации за една личност и воопшто да не ја носи за друга личност. Со овој пристап, тешко е недвосмислено да се одреди количината на информации.

Азбучниот пристап овозможува мерење на обемот на информации на порака претставена на одреден јазик (природен или формален), без оглед на нејзината содржина.

За квантитативно изразување на која било вредност, пред сè, потребна е мерна единица. Мерењето се врши со споредување на измерената вредност со мерната единица. Колку пати мерната единица „се вклопува“ во измерената вредност, таков е резултатот од мерењето.

Во азбучниот пристап се смета дека секој знак од одредена порака има одредена информациска тежина- носи фиксна количина на информации. Сите знаци од иста азбука имаат иста тежина, во зависност од кардиналноста на азбуката. Информациската тежина на знакот од бинарна азбука се зема како минимална единица на информации и се нарекува 1 бит

Ве молиме имајте предвид дека името на единицата за информации „бит“ (бит) доаѓа од англиската фраза бинарна цифра - „бинарна цифра“.

Како минимална единица за мерење на информациите се зема 1 бит. Се верува дека ова е информативната тежина на симболот на бинарната азбука.

1.6.2. Информативна тежина на произволен азбучен знак

Претходно дознавме дека азбуката на кој било природен или формален јазик може да се замени со бинарна азбука. Во овој случај, моќта на оригиналната азбука N е поврзана со длабочината на битот на бинарниот код i, потребна за кодирање на сите знаци од оригиналната азбука, со релацијата: N = 2 i.

Информациската тежина на ликот на азбуката i и моќта на азбуката N се поврзани со релацијата: N = 2 i.

Задача 1.Азбуката на племето Пулти содржи 8 знаци. Која е информативната тежина на знакот во оваа азбука?

Решение.Ајде да направиме краток запис за состојбата на проблемот.

Позната е релација која ги поврзува вредностите на i и N: N = 2 i.

Земајќи ги предвид првичните податоци: 8 = 2 i. Оттука: i = 3.

Целосниот запис за решението во тетратка може да изгледа вака:

Одговор: 3 бита.

1.6.3. Информативен волумен на пораката

Обем на информациипораката (количината на информации во пораката) претставена со симболите на природен или формален јазик е составена од информативните тежини на нејзините составни симболи.

Информацискиот волумен на пораката I е еднаков на производот од бројот на знаци во пораката K и информациската тежина на азбучниот знак i: I = K * i.

Задача 2. Пораката напишана со азбука од 32 знаци содржи 140 знаци. Колку информации носи?

Задача 3.Информативната порака од 720 бита се состои од 180 знаци. Која е моќта на азбуката со која е напишана оваа порака?

1.6.4. Информативни единици

Во денешно време подготовката на текстови главно се врши со помош на компјутери. Можеме да зборуваме за „компјутерска азбука“ која ги вклучува следните знаци: мали и големи руски и писма, броеви, интерпункциски знаци, знаци на аритметички операции, загради итн. Оваа азбука содржи 256 знаци. Бидејќи 256 = 28, информациската тежина на секој знак во оваа азбука е 8 бита. Вредноста еднаква на осум бита се нарекува бајт. 1 бајт - информативна тежина на азбучен знак со капацитет од 256.

1 бајт = 8 бита

Бит и бајт се „мали“ мерни единици. Во пракса, поголеми единици се користат за мерење на обемот на информации:

1 килобајт = 1 KB = 1024 бајти = 210 бајти

1 мегабајт = 1 MB = 1024 KB = 210 KB = 220 бајти

1 гигабајт = 1 GB = 1024 MB = 210 MB = 220 KB = 230 бајти

1 терабајт = 1 TB = 1024 GB = 210 GB = 220 MB = 230 KB = 240 бајти

Задача 4.Информативна порака со волумен од 4 KB се состои од 4096 знаци. Која е информативната тежина на знакот во азбуката што се користи? Колку знаци има во азбуката со која е напишана оваа порака?

Задача 5. Во циклокрос учествуваат 128 спортисти. Посебен уред го регистрира поминувањето на секој од учесниците во средното завршување, запишувајќи го неговиот број како синџир од нули и единици со минимална должина, исти за секој спортист. Колкав ќе биде обемот на информации на пораката снимена од уредот откако 80 велосипедисти ќе ја поминат средната целна линија?

Решение. Броевите на 128 учесници се кодирани со помош на бинарната азбука. Потребната длабочина на бит на бинарниот код (должина на синџирот) е 7, бидејќи 128 = 27. Со други зборови, пораката снимена од уредот дека еден велосипедист ја поминал средната завршница носи 7 бита информации. Кога 80 спортисти ќе ја поминат средната завршница, уредот ќе сними 80 7 = 560 бита, или 70 бајти информации.

Потсетиме дека, од гледна точка на субјективен пристап кон дефинирањето на информациите, информацијата е содржината на пораките што едно лице ги добива од различни извори. Истата порака може да носи многу информации за една личност и воопшто да не ја носи за друга личност. Со овој пристап, тешко е недвосмислено да се одреди количината на информации.

Азбучниот пристап овозможува мерење на обемот на информации на порака претставена на одреден јазик (природен или формален), без оглед на нејзината содржина.

За квантитативно изразување на која било вредност, пред сè, потребна е мерна единица. Мерењето се врши со споредување на измерената вредност со мерната единица. Колку пати мерната единица „се вклопува“ во измерената вредност, таков е резултатот од мерењето.

Во азбучниот пристап се смета дека секој симбол на одредена порака има одредена информативна тежина - носи фиксна количина на информации. Сите знаци од иста азбука имаат иста тежина, во зависност од кардиналноста на азбуката. Информациската тежина на симболот на бинарната азбука се зема како минимална единица за мерење на информациите и се нарекува 1 бит. Ве молиме имајте предвид дека името на единицата за информации „бит“ (бит) доаѓа од англиската фраза „бинарна цифра“ - „бинарна цифра“.

1.4.2. Информативна тежина на произволен азбучен знак

Претходно дознавме дека азбуката на кој било природен или формален јазик може да се замени со бинарна азбука. Во овој случај, моќта на оригиналната азбука N е поврзана со длабочината на битот на бинарниот код i, потребна за кодирање на сите знаци од оригиналната азбука, со релацијата: N = 2 i .

Задача 1. Азбуката на племето Пулти содржи 8 знаци. Која е информативната тежина на знакот во оваа азбука?

Решение. Ајде да направиме краток запис за состојбата на проблемот.

Позната е релација која ги поврзува вредностите на i и N: N = 2 i .

Со оглед на почетните податоци: 8 = 2 i . Оттука: i = 3.

Целосниот запис за решението во тетратка може да изгледа вака:

Одговор: 3 бита

1.4.3. Информативен волумен на пораката

Обемот на информации на пораката (количината на информации во пораката) претставена со симболите на природен или формален јазик е збирот на информациската тежина на нејзините составни симболи.

Задача 2. Пораката напишана со азбука од 32 знаци содржи 140 знаци. Колку информации носи?

Решение.

Одговор“: 700 бита.

Задача 3. Информативната порака од 720 бита се состои од 180 знаци. Која е моќта на азбуката со која е напишана оваа порака?

Решение.

Одговор: 16 знаци.

1.4.4. Информативни единици

Во денешно време подготовката на текстови главно се врши со помош на компјутери. Можеме да зборуваме за „компјутерска азбука“ која ги вклучува следните знаци: мали и големи руски и латински букви, бројки, интерпункциски знаци, аритметички симболи, загради итн. Оваа азбука содржи 256 знаци. Бидејќи 256 = 2 8, информациската тежина на секој знак во оваа азбука е 8 бита. Вредноста еднаква на осум бита се нарекува бајт. 1 бајт - информативна тежина на азбучен знак со капацитет од 256.

Задача 4. Информативна порака со волумен од 4 KB се состои од 4096 знаци. Која е информативната тежина на карактерот на оваа порака? Колку знаци има во азбуката со која е напишана оваа порака? Решение.

Одговор: 256 знаци.

Најважниот

Со азбучниот пристап, се смета дека секој симбол на порака има одредена информативна тежина - носи фиксна количина на информации.

1 бит е минималната единица на информации.

Информативната тежина на знакот i од азбуката и моќта N на азбуката се поврзани со релацијата: N = 2 i . Информацискиот волумен I на пораката е еднаков на производот од бројот K на знаците во пораката и информациската тежина i од азбучниот знак: I = K i.

1 бајт = 8 бита.

Бајти, килобајти, мегабајти, гигабајти, терабајти - единици на информации. Секоја следна единица е 1024 (2 10) пати поголема од претходната.

Прашања и задачи


Азбуката во компјутерската наука е систем на знаци со кои можете да испратите информативна порака. За да се разбере суштината на оваа дефиниција, еве неколку дополнителни теоретски факти:

  1. Секоја порака се состои од азбука. На пример, оваа статија е порака. Потоа се состои од симболи на руската азбука.
  2. Под симболот можеме да ја разбереме минималната значајна честичка од азбуката. Неделивите честички се нарекуваат и атоми. Ликовите во руската азбука се „а“, потоа „б“, „в“ и така натаму.
  3. Теоретски, азбуката не треба да се шифрира на кој било начин. На пример, во печатена книга, знаците од азбуката значат самите себе, што значи дека немаат никакво кодирање.

Но, во пракса го имаме следново: компјутерот не разбира што се букви. Затоа, за да се пренесе информативна порака, таа прво мора да биде кодирана на јазик разбирлив за компјутерот. За да се оди напред, мора да се воведат дополнителни термини.

Која е моќта на азбуката

Под кардиналност на азбуката го мислиме вкупниот број на знаци во неа. За да дознаете која е моќта на азбуката, само треба да го изброите бројот на знаци во неа. Ајде да го сфатиме. За руската азбука, моќта на азбуката е 33 или 32 знаци ако не се користи „ё“.

Да претпоставиме дека сите знаци во нашата азбука се појавуваат со еднаква веројатност. Оваа претпоставка може да се разбере на следниов начин: да речеме дека имаме вреќа со потпишани коцки. Бројот на коцки во него е бесконечен, а секоја е потпишана само со еден симбол. Потоа, со униформа дистрибуција, без разлика колку коцки ќе извадиме од кесата, бројот на коцки со различни симболи ќе биде ист или ќе се стреми кон тоа со зголемување на бројот на коцки што ќе ги извадиме од торба.

Проценка на тежината на информативните пораки

Пред речиси сто години, американскиот инженер Ралф Хартли разви формула со која може да се процени количината на информации во пораката. Неговата формула работи за изедначени настани и изгледа вака:

i = лог 2 М

Каде што „i“ е бројот на неделиви информациски атоми (битови) во пораката, „М“ е моќта на азбуката. Следиме понатаму. Со помош на математички трансформации, можеме да утврдиме дека моќта на азбуката може да се пресмета на следниов начин:

Оваа формула генерално ја дефинира врската помеѓу бројот на подеднакво веројатни настани „М“ и количината на информации „i“.

Ја пресметуваме моќноста

Најверојатно, веќе знаете од училишен курс по компјутерски науки дека современите компјутерски системи изградени на архитектурата на фон Нојман користат бинарен систем за кодирање на информации. Вака се кодираат програмите и податоците.

За да се претстави текстот во компјутерски систем, се користи единствен код од осум бита. Кодот се смета за униформа затоа што содржи фиксен сет на елементи - 0 и 1. Вредностите во таков код се дадени по одреден редослед на овие елементи. Со помош на осумбитен код, можеме да шифрираме пораки со тежина од 256 бита, бидејќи според формулата Хартли: M 8 \u003d 2 8 \u003d 256 бита информации.

Оваа ситуација со кодирање на знаци во бинарен код се развила историски. Но, теоретски, би можеле да користиме други азбуки за да ги претставиме податоците. Така, на пример, во азбука со четири знаци, секој знак би имал тежина не од еден, туку два бита, во азбука со осум знаци - 3 бита итн. Ова се пресметува со користење на бинарниот логаритам што беше даден погоре ( i = лог 2 М).

Бидејќи во азбука со капацитет од 256 бита се доделуваат осум бинарни цифри за да се назначи еден знак, беше одлучено да се воведе дополнителна мерка на информации - бајт. Еден бајт содржи еден знак од табелата со ASCII код и содржи осум бита.

Како се мерат информациите

8 битно кодирање текстуални пораки, кој се користи во табелата со кодови ASCII, ви овозможува да се вклопите основен сетЛатински и кирилични знаци со големи и мали букви, бројки, интерпункциски знаци и други основни знаци.

За да се измерат поголеми количини на податоци, се користат специјални префикси за зборовите бајти и битови. Таквите префикси се прикажани во табелата подолу:

Многу луѓе кои студирале физика ќе се спротивстават дека би било рационално да се користат класични префикси за означување единици на информации (како кило- и мега-), но всушност тоа не е сосема точно, бидејќи таквите префикси на количините означуваат множење со еден или уште една моќност од десет кога бинарниот систем на мерења се користи насекаде во компјутерската наука.

Точни имиња на податочни единици

Со цел да се елиминираат неправилноста и непријатностите, во март 1999 година, Меѓународната комисија во областа на електротехниката одобри нови префикси на единиците што се користат за одредување на количината на информации во електронските Компјутерски науки. Такви префикси беа „меби“, „киби“, „гиби“, „теби“, „ексби“, „пети“. Иако овие единици сè уште не се вкорениле, така што, најверојатно, ќе биде потребно време за воведување на овој стандард и почеток на широка употреба. Како да направите премин од класични единици на новоодобрени, можете да го одредите од следната табела:

Да претпоставиме дека имаме текст кој содржи K знаци. Потоа, користејќи го азбучниот пристап, можеме да ја пресметаме количината на информации V што ги содржи. Тоа ќе биде еднакво на производот на моќта на азбуката и информативната тежина на еден знак во неа.

Според формулата Хартли, знаеме како да ја пресметаме количината на информации во однос на бинарниот логаритам. Под претпоставка дека бројот на знаци во азбуката е N и бројот на знаци во записот за информативната порака е K, ја добиваме следната формула за пресметување на информациската содржина на пораката:

V = K ⋅ log 2 N

Азбучниот пристап сугерира дека обемот на информации ќе зависи само од моќта на азбуката и големината на пораките (односно, бројот на знаци во неа), но нема да биде поврзан со семантичката содржина за една личност.

Примери за пресметување на моќноста

На часовите по компјутерски науки, тие често даваат задачи за да ја пронајдат моќта на азбуката, должината на пораката или обемот на информациите. Еве една од тие задачи:

"Текстуалната датотека зафаќа 11 KB простор на дискот и содржи 11264 знаци. Одредете ја кардиналноста на азбуката на оваа текстуална датотека."

Кое ќе биде решението, можете да видите на сликата подолу.

Така, азбуката со капацитет од 256 знаци носи само 8 бита информации, кои во компјутерската наука се нарекуваат еден бајт. Бајт опишува 1 знак од табелата ASCII, што, ако размислите добро, воопшто не е многу.

Дали еден бајт е многу или малку?

Современите складишта за податоци како центрите за податоци на Google и Facebook содржат не помалку од десетици петабајти информации. Точниот износ на податоци, сепак, ќе биде тешко да се пресмета дури и сами, бидејќи тогаш ќе биде неопходно да се запрат сите процеси на серверите и да се оневозможи пристап на корисниците до снимање и уредување на нивните лични информации.

Но, за да се замислат такви незамисливи количини на податоци, неопходно е јасно да се разбере дека сè е составено од мали детали. Неопходно е да се разбере каква е моќта на азбуката (256) и колку битови содржат 1 бајт информации (како што се сеќавате, 8).




Врв