Що таке потужність інформації алфавіту. Інформаційний обсяг тексту та одиниці виміру інформації. Методи вимірювання інформації в електронному вигляді

ВИРІШЕННЯ ЗАДАЧ

При зберіганні та передачі інформації за допомогою технічних пристроївінформацію слід розглядати як послідовність символів – знаків (літер, цифр, кодів кольорів точок зображення тощо).

Набір символів знакової системи (алфавіту) можна розглядати як різні можливі стани (події).
Тоді, якщо вважати, що поява символів у повідомленні є рівноймовірною, кількість можливих подій Nможна вирахувати як N=2 i
Кількість інформації у повідомленні Iможна підрахувати помноживши кількість символів Kна інформаційну вагу одного символу i
Отже, ми маємо формули, необхідні визначення кількості інформації в алфавітному підході:

Можливі наступні поєднання відомих (Дано) та шуканих (Знайти) величин:

ТипДаноЗнайтиФормула
1 i N N=2 i
2 N i
3 i,K I I=K*i
4 i,I K
5 I, K i
6 N, K I Обидві формули
7 N, I K
8 I, K N

Якщо до цих завдань додати задачі на співвідношення величин, записаних у різних одиницях виміру, з використанням уявлення величин у вигляді ступенів двійки ми отримаємо 9 типів задач.
Розглянемо завдання попри всі типи. Домовимося, що з переході від одних одиниць виміру інформації до іншим будуватимемо ланцюжок значень. Тоді зменшується ймовірність обчислювальної помилки.

Завдання 1. Отримано повідомлення, інформаційний обсяг якого дорівнює 32 бітам. Чому дорівнює цей обсяг у байтах?

Рішення: В одному байті 8 біт. 32: 8 = 4
Відповідь: 4 байти.

Завдання 2. Обсяг інформаційного повідомлення 12582912 біт виразити в кілобайтах та мегабайтах.

Рішення: Оскільки 1Кбайт = 1024 байт = 1024 * 8 біт, то 12582912: (1024 * 8) = 1536 Кбайт і
оскільки 1Мбайт = 1024 Кбайт, то 1536: 1024 = 1,5 Мбайт
Відповідь: 1536Кбайт та 1,5Мбайт.

Завдання 3.Комп'ютер має оперативну пам'ять 512 Мб. Кількість відповідних цій величині біт більше:

1) 10 000 000 000 біт 2) 8 000 000 000 біт 3) 6 000 000 000 біт 4) 4 000 000 000 біт Рішення: 512 * 1024 * 1024 * 8 біт = 429
Відповідь: 4.

Завдання 4.Визначити кількість бітів у двох мегабайтах, використовуючи для чисел лише ступеня 2.
Рішення: Оскільки 1байт = 8біт = 23 біт, а 1Мбайт = 210 Кбайт = 220 байт = 223 біт. Звідси, 2Мбайт = 2 24 біт.
Відповідь: 2 24 біт.

Завдання 5.Скільки мегабайт інформації містить повідомлення обсягом 223 біт?
Рішення: Оскільки 1байт = 8біт = 2 3 біт, то
2 23 біт = 2 23 * 2 23 * 2 3 біт = 2 10 2 10 байт = 2 10 Кбайт = 1Мбайт.
Відповідь: 1Мбайт

Завдання 6.Один символ алфавіту "важить" 4 біти. Скільки символів у цьому алфавіті?
Рішення:
Дано:


Відповідь: 16

Завдання 7.Кожен символ алфавіту записано за допомогою 8 цифр двійкового коду. Скільки символів у цьому алфавіті?
Рішення:
Дано:


Відповідь: 256

Завдання 8.Алфавіт російської іноді оцінюють в 32 літери. Якою є інформаційна вага однієї літери такого скороченого російського алфавіту?
Рішення:
Дано:


Відповідь: 5

Завдання 9.Алфавіт складається із 100 символів. Яка кількість інформації містить один символ цього алфавіту?
Рішення:
Дано:


Відповідь: 5

Завдання 10.У племені "чичевоків" в алфавіті 24 літери та 8 цифр. Розділових знаків і арифметичних знаків немає. Яка мінімальна кількість двійкових розрядів їм потрібна для кодування всіх символів? Врахуйте, що слова треба відокремлювати одне від одного!
Рішення:
Дано:


Відповідь: 5

Завдання 11.Книга, набрана за допомогою комп'ютера, містить 150 сторінок. На кожній сторінці – 40 рядків, у кожному рядку – 60 символів. Який обсяг інформації у книзі? Відповідь дайте в кілобайтах та мегабайтах
Рішення:
Дано:


Відповідь: 351Кбайт чи 0,4Мбайт

Завдання 12.Інформаційний обсяг тексту книги, набраної на комп'ютері з використанням кодування Unicode, – 128 кілобайт. Визначити кількість символів у тексті книги.
Рішення:
Дано:


Відповідь: 65536

Завдання 13.Інформаційне повідомлення об'ємом 1,5 Кб містить 3072 символи. Визначити інформаційну вагу одного символу використаного алфавіту
Рішення:
Дано:


Відповідь: 4

Завдання 14.Повідомлення, записане літерами із 64-символьного алфавіту, містить 20 символів. Який обсяг інформації вона має?
Рішення:
Дано:


Відповідь: 120біт

Завдання 15.Скільки символів містить повідомлення, записане за допомогою 16-символьного алфавіту, якщо його обсяг становив 1/16 мегабайта?
Рішення:
Дано:


Відповідь: 131072

Завдання 16.Обсяг повідомлення, що містить 2048 символів, становив 1/512 частину мегабайта. Яким є розмір алфавіту, за допомогою якого записано повідомлення?
Рішення:
Дано:


Відповідь: 256

Завдання для самостійного вирішення:

  1. Кожен символ алфавіту записується за допомогою 4 цифр двійкового коду. Скільки символів у цьому алфавіті?
  2. Алфавіт для запису повідомлень складається з 32 символів, якою є інформаційна вага одного символу? Не забудьте вказати одиницю виміру.
  3. Інформаційний обсяг тексту, набраного на комп'ютері з використанням кодування Unicode (кожен символ кодується 16 бітами), - 4 Кб. Визначити кількість символів у тексті.
  4. Обсяг інформаційного повідомлення складає 8192 біти. Виразити його у кілобайтах.
  5. Скільки біт інформації містить повідомлення обсягом 4 Мб? Відповідь дати у ступенях 2.
  6. Повідомлення, записане літерами з 256-символьного алфавіту, містить 256 символів. Який обсяг інформації воно несе у кілобайтах?
  7. Скільки існує різних звукових сигналів, Що складаються з послідовностей коротких та довгих дзвінків. Довжина кожного сигналу – 6 дзвінків.
  8. Метеорологічна станція проводить спостереження за вологістю повітря. Результатом одного виміру є ціле число від 20 до 100%, яке записується за допомогою мінімально можливої ​​кількості біт. Станція зробила 80 вимірів. Визначте інформаційний обсяг результатів спостережень.
  9. Швидкість передачі через ADSL-з'єднання дорівнює 512000 біт/с. Через дане з'єднанняпередають файл розміром 1500 Кб. Визначте час передачі файлу за секунди.
  10. Визначте швидкість роботи модему, якщо за 256 секунд він може передати растрове зображення розміром 640х480 пікселів. На кожен піксель припадає 3 байти. А якщо на палітрі 16 мільйонів кольорів?
Тема визначення кількості інформації на основі алфавітного підходу використовується у завданнях А1, А2, А3, А13, В5 контрольно-вимірювальних матеріалів ЄДІ.

Існує кілька способів вимірювання кількості інформації. Один із них називається алфавітний.

Алфавітний підхіддозволяє вимірювати кількість інформації у тексті (символьному повідомленні), складеному із символів деякого алфавіту.

Алфавіт– це набір букв, знаків, цифр, дужок тощо.
Кількість символів в алфавіті називається його потужністю.

При алфавітному підході вважається, що кожен символ має певний інформаційна вага. Інформаційна вага символу залежить від потужності алфавіту.

Якою є мінімальна потужність алфавіту, за допомогою якого можна записувати (кодувати) інформацію?



Назвемо комбінацію із 2-х, 3-х і т.д. біт двійковим кодом.

Скільки символів можна закодувати двома бітами?

Порядковий номер символу

1

2

3

4

Двозначний двійковий код

00

01

10

11

4 символи 2 біти.

Скільки символів можна закодувати трьома бітами?

Порядковий номер символу

1

2

3

4

5

6

7

8

Тризначний двійковий код

000

001

010

011

100

101

110

111


Звідси випливає, що в алфавіті потужністю 8 символівінформаційна вага кожного символу - 3 біти.

Можна дійти невтішного висновку, що у алфавіті потужністю 16 символівінформаційна вага кожного символу буде 4 біта.

Позначимо потужність алфавіту буквою N, а інформаційна вага символу буквою b.

Залежність між потужністю алфавіту Nта інформаційною вагою символу b.

N

2

4

8

16

b

1 біт

Вимірювання інформації.

Алфавітний підхід до виміру інформації.

Те саме повідомлення може нести багато інформації для однієї людини і не нести її зовсім для іншої людини. За такого підходу кількість інформації визначити однозначно важко.

Алфавітний підхід дозволяє виміряти інформаційний обсяг повідомлення, представленого деякою мовою (природною чи формальною), незалежно від його змісту.

Для кількісного виразу будь-якої величини необхідна насамперед одиниця виміру. Вимір здійснюється шляхом зіставлення вимірюваної величини з одиницею виміру. Скільки разів одиниця виміру «укладається» у вимірюваній величині, такий і результат виміру.

При алфавітному підході вважається, що кожен символ деякого повідомлення має певний інформаційна вага- несе фіксоване кількість інформації. Усі символи одного алфавіту мають однакову вагу, що залежить від потужності алфавіту. Інформаційна вага символу двійкового алфавіту прийнята за мінімальну одиницю вимірювання інформації та називається 1 біт.

Зверніть увагу, що назва одиниці виміру інформації «біт» (bit) походить від англійського словосполучення binary digit – «двійкова цифра».

За мінімальну одиницю виміру інформації прийнято 1 біт. Вважається, що такою є інформаційна вага символу двійкового алфавіту.

1.6.2. Інформаційна вага символу довільного алфавіту

Раніше ми з'ясували, що алфавіт будь-якої природної чи формальної мови можна замінити на двійковий алфавіт. У цьому потужність вихідного алфавіту N пов'язані з розрядністю двійкового коду i, необхідної кодування всіх символів вихідного алфавіту, співвідношенням: N = 2 i.

Інформаційна вага символу алфавіту i та потужність алфавіту N пов'язані між собою співвідношенням: N = 2 i.

Завдання 1.Алфавіту племені Пульті містить 8 символів. Якою є інформаційна вага символу цього алфавіту?

Рішення.Складемо короткий запис умови завдання.

Відоме співвідношення, що зв'язує величини i N: N = 2 i.

З урахуванням вихідних даних: 8 = 2 i. Звідси: i = 3.

Повний запис рішення у зошит може виглядати так:

Відповідь: 3 біти.

1.6.3. Інформаційний обсяг повідомлення

Інформаційний обсягповідомлення (кількість інформації в повідомленні), представленого символами природної або формальної мови, складається з інформаційних ваг символів, що його складають.

Інформаційний обсяг повідомлення I дорівнює добутку кількості символів у повідомленні на інформаційну вагу символу алфавіту i: I = K * i.

Завдання 2. Повідомлення, записане літерами 32-символьного алфавіту, містить 140 символів. Яка кількість інформації вона несе?

Завдання 3.Інформаційне повідомлення обсягом 720 біт складається з 180 символів. Яка потужність алфавіту, за допомогою якого записано це повідомлення?

1.6.4. Одиниці виміру інформації

Нині підготовка текстів переважно здійснюється з допомогою комп'ютерів. Можна говорити про «комп'ютерний алфавіт», що включає такі символи: малі і великі росіяни і Латинські букви, цифри, розділові знаки, знаки арифметичних операцій, дужки та ін. Такий алфавіт містить 256 символів. Оскільки 256 = 28, інформаційна вага кожного символу цього алфавіту дорівнює 8 біт. Величина, що дорівнює восьми бітам, називається байтом. 1 байт – інформаційна вага символу алфавіту потужністю 256.

1 байт = 8 бітів

Біт і байт – «дрібні» одиниці виміру. На практиці для вимірювання інформаційних обсягів використовуються більші одиниці:

1 кілобайт = 1 Кб = 1024 байта = 210 байтів

1 мегабайт = 1 Мб = 1024 Кб = 210 Кб = 220 байтів

1 гігабайт = 1 Гб = 1024 Мб = 210 Мб = 220 Кб = 230 байтів

1 терабайт = 1 Тб = 1024 Гб = 210 Гб = 220 Мб = 230 Кб = 240 байтів

Завдання 4.Інформаційне повідомлення об'ємом 4 Кбайт складається з 4096 символів. Яка інформаційна вага символу алфавіту, що використовується? Скільки символів містить алфавіт, за допомогою якого записано це повідомлення?

Завдання 5. У велокросі беруть участь 128 спортсменів. Спеціальний пристрій реєструє проходження кожним із учасників проміжного фінішу, записуючи його номер ланцюжком з нулів та одиниць мінімальної довжини, однакового для кожного спортсмена. Яким буде інформаційний обсяг повідомлення, записаного пристроєм після того, як проміжний фініш пройдуть 80 велосипедистів?

Рішення. Номери 128 учасників кодуються за допомогою алфавіту. Необхідна розрядність двійкового коду (довжина ланцюжка) дорівнює 7, оскільки 128 = 27. Інакше висловлюючись, зафіксоване пристроєм повідомлення у тому, що проміжний фініш пройшов один велосипедист, несе 7 бітів інформації. Коли проміжний фініш пройдуть 80 спортсменів, пристрій запише 807 = 560 бітів, або 70 байтів інформації.

Згадаймо, що, з погляду суб'єктивного підходу до визначення інформації, інформація - це зміст повідомлень, які людина отримує з різних джерел. Те саме повідомлення може нести багато інформації для однієї людини і не нести її зовсім для іншої людини. За такого підходу кількість інформації визначити однозначно важко.

Алфавітний підхід дозволяє виміряти інформаційний обсяг повідомлення, представленого деякою мовою (природною чи формальною), незалежно від його змісту.

Для кількісного виразу будь-якої величини необхідна насамперед одиниця виміру. Вимір здійснюється шляхом зіставлення вимірюваної величини з одиницею виміру. Скільки разів одиниця виміру «укладається» у вимірюваній величині, такий і результат виміру.

При алфавітному підході вважається, що кожен символ деякого повідомлення має певну інформаційну вагу – несе фіксовану кількість інформації. Усі символи одного алфавіту мають однакову вагу, що залежить від потужності алфавіту. Інформаційна вага символу двійкового алфавіту прийнята за мінімальну одиницю вимірювання інформації та називається 1 біт. Зверніть увагу, що назва одиниці виміру інформації "біт" (bit) походить від англійського словосполучення "binary digit" - "двійкова цифра".

1.4.2. Інформаційна вага символу довільного алфавіту

Раніше ми з'ясували, що алфавіт будь-якої природної чи формальної мови можна замінити на двійковий алфавіт. У цьому потужність вихідного алфавіту N пов'язані з розрядністю двійкового коду i, необхідної кодування всіх символів вихідного алфавіту, співвідношенням: N = 2 i .

Завдання 1. Алфавіту племені Пульті містить 8 символів. Якою є інформаційна вага символу цього алфавіту?

Рішення. Складемо короткий запис умови завдання.

Відомо співвідношення, що зв'язує величини i N: N = 2 i .

З урахуванням вихідних даних: 8 = 2 i. Звідси: i = 3.

Повний запис рішення у зошит може виглядати так:

Відповідь: 3 біта

1.4.3. Інформаційний обсяг повідомлення

Інформаційний обсяг повідомлення (кількість інформації в повідомленні), представленого символами природної або формальної мови, складається з інформаційних ваг складових його символів.

Завдання 2. Повідомлення, записане літерами 32-символьного алфавіту, містить 140 символів. Яка кількість інформації вона несе?

Рішення.

Відповідь": 700 бітів.

Завдання 3. Інформаційне повідомлення обсягом 720 біт складається з 180 символів. Яка потужність алфавіту, за допомогою якого записано це повідомлення?

Рішення.

Відповідь: 16 символів.

1.4.4. Одиниці виміру інформації

Нині підготовка текстів переважно здійснюється з допомогою комп'ютерів. Можна говорити про «комп'ютерний алфавіт», що включає такі символи: малі та великі російські та латинські літери, цифри, розділові знаки, знаки арифметичних операцій, дужки та ін. Такий алфавіт містить 256 символів. Оскільки 256 = 2 8 інформаційна вага кожного символу цього алфавіту дорівнює 8 бітам. Розмір, рівна восьми бітам, називається байтом. 1 байт – інформаційна вага символу алфавіту потужністю 256.

Завдання 4. Інформаційне повідомлення об'ємом 4 Кбайт складається з 4096 символів. Яка інформаційна вага символу цього повідомлення? Скільки символів містить алфавіт, за допомогою якого записано це повідомлення? Рішення.

Відповідь: 256 символів.

Найголовніше

При алфавітному підході вважається, що кожен символ деякого повідомлення має певну інформаційну вагу - несе фіксовану кількість інформації.

1 біт – мінімальна одиниця виміру інформації.

Інформаційна вага i символу алфавіту та потужність N алфавіту пов'язані між собою співвідношенням: N = 2 i . Інформаційний обсяг I повідомлення дорівнює добутку кількості символів у повідомленні на інформаційну вагу i символу алфавіту: I = K i.

1 байт = 8 бітів.

Байт, кілобайт, мегабайт, гігабайт, терабайт – одиниці виміру інформації. Кожна наступна одиниця більша за попередню в 1024 (2 10) рази.

Запитання та завдання


Алфавітом в інформатиці називається система знаків, за допомогою якої можна подати інформаційне повідомлення. Щоб зрозуміти сутність цього визначення, наведемо трохи додаткових теоретичних фактів:

  1. Будь-які повідомлення складаються з алфавіту. Наприклад, ця стаття - повідомлення. Тоді вона складається із символів російського алфавіту.
  2. Під символом ми можемо розуміти мінімально значиму частину алфавіту. Також неподільні частки називають атомами. Символами в російському алфавіті є "а", потім "б", "в" і так далі.
  3. Теоретично, алфавіту необов'язково бути закодованим як-небудь. Наприклад, у друкованій книзі символи алфавіту означають самі себе, отже, не мають кодування.

Але на практиці ми маємо таке: комп'ютер не розуміє, що таке літери. Тому для передачі інформаційного повідомлення спочатку потрібно закодувати зрозумілою комп'ютеру мовою. Для того, щоб рухатися далі, необхідно ввести додаткові терміни.

Що таке потужність алфавіту

Під потужністю алфавіту ми маємо на увазі загальну кількість символів у ньому. Щоб дізнатися, яка потужність алфавіту, необхідно просто порахувати кількість символів у ньому. Давайте розумітися. Для російського алфавіту потужність алфавіту дорівнює 33 або 32 символам, якщо не використовувати "е".

Припустимо, що всі символи в нашому алфавіті зустрічаються з рівною ймовірністю. Це припущення можна розуміти так: припустимо, у нас є мішок із підписаними кубиками. Число кубиків у ньому нескінченно, і кожен підписаний лише одним символом. Тоді при рівномірному розподілі, скільки б ми кубиків не діставали з мішка, кількість кубиків з різними символами буде однаково, або буде прагнути цього при зростанні числа кубиків, які ми дістаємо з мішка.

Оцінка ваги інформаційних повідомлень

Майже сто років тому американський інженер Ральф Хартлі вивів формулу за допомогою якої можна оцінювати кількість інформації в повідомленні. Його формула працює для рівноймовірних подій і виглядає так:

i = log 2 M

Де "i" - кількість неподільних інформаційних атомів (бітів) у повідомленні, "M" - потужність алфавіту. Слідуємо далі. За допомогою математичних перетворень можемо визначити, що потужність алфавіту можна обчислювати так:

Ця формула загалом задає зв'язок між кількістю рівноймовірних подій "M" і кількістю інформації "i".

Розраховуємо потужність

Швидше за все, ви вже знаєте зі шкільного курсу інформатики, що в сучасних обчислювальних системах, побудованих на архітектурі фон Неймана, використовується двійкова система кодування інформації. Так кодуються як програми, і дані.

Для того щоб подати текст у обчислювальній системі, використовують рівномірний код із восьми розрядів. Рівномірним код вважається тому, що містить фіксований набір елементів - 0 і 1. Значення такого коду задаються певним порядком цих елементів. За допомогою восьмирозрядного коду ми можемо закодувати повідомлення вагою 256 біт, адже за формулою Хартлі: M 8 =2 8 = 256 біт інформації.

Така ситуація із кодуванням символів двійковим кодом склалася історично. Але теоретично ми могли б використовувати інші алфавіти для представлення даних. Так, наприклад, у чотиризнаковому алфавіті у кожного символу була б вага не один, а два біти, у восьмизнаковому - 3 біти і так далі. Це розраховується за допомогою двійкового логарифму, який був наведений вище ( i = log 2 M).

Так як в алфавіті потужністю 256 біт для позначення одного символу приділяється вісім двійкових розрядів, було вирішено ввести додатковий захід інформації - байт. Один байт містить один символ кодової таблиці ASCII і містить у собі вісім біт.

Як вимірюють інформацію

Восьмибітне кодування текстових повідомлень, яка використовується в кодовій таблиці ASCII, дозволяє вмістити базовий набірсимволів латиниці та кирилиці у великому та рядковому варіанті, цифри, символи розділових знаків та інші базові символи.

Для того щоб вимірювати більші обсяги даних, використовують спеціальні приставки до слів байт та біт. Такі приставки наведені у таблиці нижче:

Багато людей, які вивчали фізику, заперечать, що раціонально було б використовувати класичні приставки для позначення одиниць інформації (на кшталт кіло- і мега-), але насправді це не зовсім коректно, адже такі префікси до величин позначають множення на той чи інший ступінь числа десять. коли в інформатиці скрізь використовується двійкова система вимірювань.

Правильні назви одиниць виміру даних

Для того, щоб усунути некоректності та незручності, у березні 1999 року Міжнародною комісією в галузі електротехніки було затверджено нові приставки до одиниць, які використовуються для визначення обсягу інформації в електронній обчислювальної техніки. Такими приставками стали "мебі", "кібі", "гибі", "тебі", "ексбі", "петі". Поки ці одиниці ще не прижилися, тож, швидше за все, потрібен час для запровадження цього стандарту та початку широкого застосування. Як здійснювати перехід від класичних одиниць до новозатверджених, можна визначити за наступною таблицею:

Припустимо, що маємо текст, який містить K символів. Тоді, використовуючи алфавітний підхід, можна обчислити обсяг інформації V, який міститься. Він дорівнюватиме твору потужності алфавіту на інформаційну вагу одного символу в ньому.

За формулою Хартлі ми знаємо, як вирахувати обсяг інформації через двійковий логарифм. Припустивши, що кількість знаків алфавіту дорівнює N і кількість знаків запису інформаційного повідомлення дорівнює K, отримаємо таку формулу для обчислення інформаційного обсягу повідомлення:

V = K ⋅ log 2 N

Алфавітний підхід свідчить про те, що інформаційний обсяг залежатиме лише від потужності алфавіту та розміру повідомлень (тобто кількості символів у ньому), але ніяк не буде пов'язаний із змістом для людини.

Приклади розрахунку потужності

На уроках інформатики часто дають завдання знаходження потужності алфавіту, довжини повідомлення чи інформаційного обсягу. Ось одне з таких завдань:

"Текстовий файл займає 11 Кбайт дискового простору і містить 11264 символи. Визначте потужність алфавіту даного текстового файлу".

Яким буде рішення, можна побачити на малюнку нижче.

Таким чином, алфавіт потужністю 256 символів несе в собі лише 8 біт інформації, що в інформатиці називають одним байтом. Байт визначає один символ таблиці ASCII, що, якщо задуматися, дуже мало.

Один байт – це багато чи мало?

Сучасні сховища даних на кшталт дата-центрів Google і Facebook містять не менше десятків петабайт інформації. Точну кількість даних, втім, важко буде підрахувати навіть їм самим, адже тоді потрібно буде зупинити всі процеси на серверах та закрити користувачам доступ до запису та редагування їхньої особистої інформації.

Але щоб уявити такі немислимі обсяги даних, необхідно чітко розуміти, що все складається з дрібних деталей. Необхідно розуміти, чому дорівнює потужність алфавіту (256) і скільки біт містить 1 байт інформації (як пам'ятаєте, 8).




Top