Kāds ir alfabēta informācijas spēks. Teksta informācijas apjoms un informācijas mērvienības. Metodes informācijas mērīšanai elektroniskā formā

PROBLĒMU RISINĀŠANA

Uzglabājot un pārsūtot informāciju, izmantojot tehniskās ierīces informācija jāuzskata par simbolu - zīmju (burtu, ciparu, attēla punktu krāsu kodi utt.) secību.

Zīmju sistēmas (alfabēta) simbolu kopu var uzskatīt par dažādiem iespējamiem stāvokļiem (notikumiem).
Tad, ja pieņemam, ka simbolu parādīšanās ziņojumā ir vienlīdz iespējama, iespējamo notikumu skaits N var aprēķināt kā N=2 i
Informācijas daudzums ziņojumā es var aprēķināt, reizinot rakstzīmju skaitu K uz vienas rakstzīmes informācijas svaru i
Tātad, mums ir formulas, kas nepieciešamas, lai alfabētiskā pieejā noteiktu informācijas daudzumu:

Ir iespējamas šādas zināmo (Dotais) un meklēto (Atrast) daudzumu kombinācijas:

TipsŅemot vērāAtrastFormula
1 i N N=2 i
2 N i
3 es, K es I=K*i
4 es, es K
5 Es, K i
6 N, K es Abas formulas
7 N, I K
8 Es, K N

Ja šīm problēmām pievieno uzdevumus par dažādās mērvienībās uzrakstīto lielumu attiecību, izmantojot lielumu attēlojumu pakāpju formā divi, iegūstam 9 uzdevumu veidus.
Apskatīsim visu veidu uzdevumus. Vienosimies, ka, pārejot no vienas informācijas mērvienības uz citu, mēs veidosim vērtību ķēdi. Tad skaitļošanas kļūdas iespējamība samazinās.

1. problēma. Ir saņemts ziņojums ar informācijas apjomu 32 biti. Kāds ir šis apjoms baitos?

Risinājums: vienā baitā ir 8 biti. 32:8=4
Atbilde: 4 baiti.

2. problēma. Informācijas ziņojuma apjoms ir 12582912 biti, kas izteikti kilobaitos un megabaitos.

Risinājums: tā kā 1Kbyte=1024 baiti=1024*8 biti, tad 12582912:(1024*8)=1536 Kbaiti un
jo 1 MB = 1024 KB, tad 1536: 1024 = 1,5 MB
Atbilde: 1536 KB un 1,5 MB.

3. uzdevums. Datoram ir RAM 512 MB. Bitu skaits, kas atbilst šai vērtībai, ir lielāks:

1) 10 000 000 000 biti 2) 8 000 000 000 biti 3) 6 000 000 000 biti 4) 4 000 000 000 biti Risinājums: 512 * 1024 * 1024 * 8 biti 9 biti.
Atbilde: 4.

4. uzdevums. Nosakiet bitu skaitu divos megabaitos, skaitļiem izmantojot tikai pakāpes 2.
Risinājums: tā kā 1 baits = 8 biti = 2 3 biti un 1 MB = 2 10 KB = 2 20 baiti = 2 23 biti. Tādējādi 2 MB = 2 24 biti.
Atbilde: 2 24 biti.

5. uzdevums. Cik megabaitu informācijas satur 2 23 bitu ziņojums?
Risinājums: Tā kā 1 baits = 8 biti = 2 3 biti, tad
2 23 biti = 2 23 * 2 23 * 2 3 biti = 2 10 2 10 baiti = 2 10 KB = 1 MB.
Atbilde: 1 MB

6. uzdevums. Viena alfabēta rakstzīme “sver” 4 bitus. Cik rakstzīmju ir šajā alfabētā?
Risinājums:
Ņemot vērā:


Atbilde: 16

7. uzdevums. Katra alfabēta rakstzīme ir rakstīta, izmantojot binārā koda 8 ciparus. Cik rakstzīmju ir šajā alfabētā?
Risinājums:
Ņemot vērā:


Atbilde: 256

8. uzdevums. Krievu alfabēts dažkārt tiek lēsts ar 32 burtiem. Kāds ir šāda saīsinātā krievu alfabēta viena burta informatīvais svars?
Risinājums:
Ņemot vērā:


Atbilde: 5

9. uzdevums. Alfabēts sastāv no 100 rakstzīmēm. Cik daudz informācijas nes viena šī alfabēta rakstzīme?
Risinājums:
Ņemot vērā:


Atbilde: 5

10. problēma.Čičevoku cilts alfabētā ir 24 burti un 8 cipari. Nav pieturzīmju vai aritmētisko zīmju. Kāds ir minimālais bināro ciparu skaits, kas tiem nepieciešams, lai kodētu visas rakstzīmes? Lūdzu, ņemiet vērā, ka vārdi ir jāatdala viens no otra!
Risinājums:
Ņemot vērā:


Atbilde: 5

11. problēma. Grāmatā, kas drukāta ar datoru, ir 150 lappuses. Katrā lapā ir 40 rindiņas, katrā rindiņā ir 60 rakstzīmes. Cik daudz informācijas ir grāmatā? Sniedziet atbildi kilobaitos un megabaitos
Risinājums:
Ņemot vērā:


Atbilde: 351 KB vai 0,4 MB

12. problēma. Grāmatas teksta informācijas apjoms, kas drukāts datorā, izmantojot Unicode kodējumu, ir 128 kilobaiti. Nosakiet rakstzīmju skaitu grāmatas tekstā.
Risinājums:
Ņemot vērā:


Atbilde: 65536

13. problēma. 1,5 KB informācijas ziņojumā ir 3072 rakstzīmes. Nosakiet viena izmantotā alfabēta rakstzīmes informācijas svaru
Risinājums:
Ņemot vērā:


Atbilde: 4

14. problēma. Ziņojumā, kas rakstīts ar burtiem no 64 rakstzīmju alfabēta, ir 20 rakstzīmes. Cik daudz informācijas tas satur?
Risinājums:
Ņemot vērā:


Atbilde: 120 biti

15. problēma. Cik rakstzīmju ir ziņojumā, kas rakstīts, izmantojot 16 rakstzīmju alfabētu, ja tā izmērs ir 1/16 megabaita?
Risinājums:
Ņemot vērā:


Atbilde: 131072

16. problēma. Ziņojuma lielums, kas satur 2048 rakstzīmes, bija 1/512 no megabaita. Kāds ir alfabēta lielums, kurā rakstīts ziņojums?
Risinājums:
Ņemot vērā:


Atbilde: 256

Uzdevumi patstāvīgam risinājumam:

  1. Katra alfabēta rakstzīme ir rakstīta, izmantojot binārā koda 4 ciparus. Cik rakstzīmju ir šajā alfabētā?
  2. Ziņojumu rakstīšanas alfabēts sastāv no 32 rakstzīmēm; kāds ir vienas rakstzīmes informācijas svars? Neaizmirstiet norādīt mērvienību.
  3. Datorā ievadītā teksta informācijas apjoms, izmantojot Unicode kodējumu (katra rakstzīme ir kodēta ar 16 bitiem), ir 4 KB. Nosakiet rakstzīmju skaitu tekstā.
  4. Informācijas ziņojuma apjoms ir 8192 biti. Izsakiet to kilobaitos.
  5. Cik informācijas bitu satur 4 MB ziņojums? Sniedziet atbildi 2 pakāpēs.
  6. Ziņojumā, kas rakstīts ar burtiem no 256 rakstzīmju alfabēta, ir 256 rakstzīmes. Cik daudz informācijas tajā ir kilobaitos?
  7. Cik daudz dažādu ir? skaņas signālus, kas sastāv no īsu un garu zvanu secībām. Katra signāla garums ir 6 zvani.
  8. Meteoroloģiskā stacija uzrauga gaisa mitrumu. Viena mērījuma rezultāts ir vesels skaitlis no 20 līdz 100%, kas tiek uzrakstīts, izmantojot mazāko iespējamo bitu skaitu. Stacija veica 80 mērījumus. Noteikt informācijas apjomu novērojumu rezultātā.
  9. Datu pārraides ātrums, izmantojot ADSL savienojumu, ir 512 000 bps. Caur šo savienojumu pārsūtīt 1500 KB lielu failu. Nosakiet faila pārsūtīšanas laiku sekundēs.
  10. Nosakiet modema ātrumu, ja tas var pārraidīt 640x480 pikseļu rastra attēlu 256 sekundēs. Katram pikselim ir 3 baiti. Ko darīt, ja paletē ir 16 miljoni krāsu?
Tēma par informācijas apjoma noteikšanu pēc alfabētiskās pieejas izmantota Vienotā valsts pārbaudījuma pārbaudes materiālu A1, A2, A3, A13, B5 uzdevumos.

Ir vairāki veidi, kā izmērīt informācijas apjomu. Viens no tiem saucas alfabētiskā secībā.

Alfabētiskā pieejaļauj izmērīt informācijas daudzumu tekstā (simboliskā ziņojumā), kas sastāv no noteikta alfabēta rakstzīmēm.

Alfabēts ir burtu, zīmju, ciparu, iekavas utt. kopa.
Rakstzīmju skaitu alfabētā sauc par tā jauda.

Izmantojot alfabētisko pieeju, tiek uzskatīts, ka katram teksta varonim ir sava specifika informācijas svars. Simbola informācijas svars ir atkarīgs no alfabēta jaudas.

Kāda ir minimālā alfabēta jauda, ​​ko var izmantot informācijas ierakstīšanai (kodēšanai)?



Sauksim kombināciju 2, 3 utt. mazliet binārais kods.

Cik rakstzīmju var kodēt ar diviem bitiem?

Simbola kārtas numurs

1

2

3

4

Divciparu binārais kods

00

01

10

11

4 rakstzīmes 2 biti.

Cik rakstzīmju var kodēt ar trim bitiem?

Simbola kārtas numurs

1

2

3

4

5

6

7

8

Trīsciparu binārais kods

000

001

010

011

100

101

110

111


No tā izriet, ka alfabētā ar kardināli 8 rakstzīmes katras rakstzīmes informācijas svars - 3 biti.

Varam secināt, ka alfabētā ar ietilpību 16 rakstzīmes katras rakstzīmes informācijas svars būs 4 biti.

Apzīmēsim alfabēta spēku ar burtu N, un simbola informācijas svars ir burts b.

Attiecības starp alfabēta spēku N un simbola informācijas svars b.

N

2

4

8

16

b

1 bits

Mērīšanas informācija.

Alfabētiskā pieeja informācijas mērīšanai.

Viens un tas pats ziņojums vienam cilvēkam var nest daudz informācijas, bet citam to vispār nenest. Izmantojot šo pieeju, ir grūti viennozīmīgi noteikt informācijas apjomu.

Alfabētiskā pieeja ļauj izmērīt kādā valodā (dabiskā vai formālā) sniegtā ziņojuma informācijas apjomu neatkarīgi no tā satura.

Lai kvantitatīvi izteiktu jebkuru daudzumu, pirmkārt, ir nepieciešama mērvienība. Mērījumu veic, salīdzinot izmērīto vērtību ar mērvienību. Skaits, cik reižu mērvienība “iekļaujas” izmērītajā vērtībā, ir mērījuma rezultāts.

Alfabētiskā pieejā tiek uzskatīts, ka katram noteikta ziņojuma raksturam ir sava specifika informācijas svars- nes fiksētu informācijas apjoms. Visām viena un tā paša alfabēta rakstzīmēm ir vienāds svars atkarībā no alfabēta jaudas. Binārā alfabēta simbola informācijas svars tiek ņemts par minimālo informācijas vienību un tiek izsaukts 1 bits.

Lūdzu, ņemiet vērā, ka informācijas vienības nosaukums “bit” cēlies no angļu valodas frāzes binary digit - “binary digit”.

1 bits tiek ņemts par minimālo informācijas vienību. Tiek uzskatīts, ka tas ir binārā alfabēta simbola informācijas svars.

1.6.2. Patvaļīgas alfabēta rakstzīmes informācijas svars

Iepriekš mēs noskaidrojām, ka jebkuras dabiskās vai formālās valodas alfabētu var aizstāt ar bināro alfabētu. Šajā gadījumā sākotnējā alfabēta N jauda ir saistīta ar binārā koda i bitu ietilpību, kas nepieciešama, lai kodētu visas sākotnējā alfabēta rakstzīmes, attiecība: N = 2 i.

Alfabēta simbola i informācijas svars un alfabēta N jauda ir savstarpēji saistīti ar sakarību: N = 2 i.

1. uzdevums. Pulti alfabēts satur 8 rakstzīmes. Kāds ir šī alfabēta simbola informācijas svars?

Risinājums.Īsi izklāstīsim problēmas apstākļus.

Sakarība starp lielumiem i un N ir zināma: N = 2 i.

Ņemot vērā sākotnējos datus: 8 = 2 i. Tātad: i = 3.

Pilns risinājums piezīmjdatorā varētu izskatīties šādi:

Atbilde: 3 biti.

1.6.3. Ziņojuma informācijas apjoms

Informācijas apjoms ziņojums (informācijas apjoms ziņojumā), kas attēlots ar dabiskās vai formālās valodas simboliem, sastāv no to veidojošo simbolu informācijas svariem.

I ziņojuma informācijas apjoms ir vienāds ar ziņojuma K rakstzīmju skaita un alfabēta rakstzīmes i informācijas svara reizinājumu: I = K * i.

2. problēma. Ziņojumā, kas rakstīts ar 32 rakstzīmju alfabētu, ir 140 rakstzīmes. Cik daudz informācijas tas satur?

3. uzdevums. Informācijas ziņojums ar tilpumu 720 biti sastāv no 180 rakstzīmēm. Kāds ir alfabēta spēks, kurā rakstīts šis ziņojums?

1.6.4. Informācijas vienības

Mūsdienās teksta sagatavošana galvenokārt tiek veikta, izmantojot datorus. Mēs varam runāt par "datora alfabētu", kas ietver šādas rakstzīmes: mazie un lielie krievu un vēstules, cipari, pieturzīmes, aritmētiskie simboli, iekavas utt. Šajā alfabētā ir 256 rakstzīmes. Tā kā 256 = 28, katras rakstzīmes informācijas svars šajā alfabētā ir 8 biti. Vērtību, kas vienāda ar astoņiem bitiem, sauc par baitu. 1 baits ir informācijas svars alfabēta simbolam ar ietilpību 256.

1 baits = 8 biti

Bits un baits ir “mazas” mērvienības. Praksē informācijas apjomu mērīšanai izmanto lielākas vienības:

1 kilobaits = 1 KB = 1024 baiti = 210 baiti

1 megabaits = 1 MB = 1024 KB = 210 KB = 220 baiti

1 gigabaits = 1 GB = 1024 MB = 210 MB = 220 KB = 230 baiti

1 terabaits = 1 TB = 1024 GB = 210 GB = 220 MB = 230 KB = 240 baiti

4. uzdevums. 4 KB informācijas ziņojums sastāv no 4096 rakstzīmēm. Kāds ir izmantotā alfabēta simbola informācijas svars? Cik rakstzīmju ir alfabētā, ar kuru ir uzrakstīts šis ziņojums?

5. problēma. Ciklokrosā piedalās 128 sportisti. Speciāla ierīce reģistrē katra dalībnieka starpfiniša nokārtošanu, ierakstot tā numuru nulles un vieninieku ķēdē ar minimālo garumu, katram sportistam vienādi. Kāds būs ierīces ierakstītā ziņojuma informatīvais apjoms pēc tam, kad starpfinišu būs veikuši 80 riteņbraucēji?

Risinājums. 128 dalībnieku numuri ir kodēti, izmantojot bināro alfabētu. Nepieciešamais binārā koda bitu dziļums (ķēdes garums) ir 7, jo 128 = 27. Citiem vārdiem sakot, ierīces ierakstītais ziņojums, ka viens velosipēdists ir izturējis starpfinišu, nes 7 bitus informācijas. Kad 80 sportisti pabeigs starpfinišu, ierīce ierakstīs 80 7 = 560 bitus jeb 70 baitus informācijas.

Atcerēsimies, ka no subjektīvās pieejas informācijas definēšanai viedokļa informācija ir ziņojumu saturs, ko cilvēks saņem no dažādiem avotiem. Viens un tas pats ziņojums vienam cilvēkam var nest daudz informācijas, bet citam to vispār nenest. Izmantojot šo pieeju, ir grūti viennozīmīgi noteikt informācijas apjomu.

Alfabētiskā pieeja ļauj izmērīt kādā valodā (dabiskā vai formālā) sniegtā ziņojuma informācijas apjomu neatkarīgi no tā satura.

Lai kvantitatīvi izteiktu jebkuru daudzumu, pirmkārt, ir nepieciešama mērvienība. Mērījumu veic, salīdzinot izmērīto vērtību ar mērvienību. Skaits, cik reižu mērvienība “iekļaujas” izmērītajā vērtībā, ir mērījuma rezultāts.

Izmantojot alfabētisko pieeju, tiek uzskatīts, ka katrai ziņojuma rakstzīmei ir noteikts informācijas svars - tas nes noteiktu informācijas daudzumu. Visām viena un tā paša alfabēta rakstzīmēm ir vienāds svars atkarībā no alfabēta jaudas. Binārā alfabēta simbola informācijas svars tiek ņemts par minimālo informācijas vienību un tiek saukts par 1 bitu. Lūdzu, ņemiet vērā, ka informācijas vienības nosaukums “bit” cēlies no angļu valodas frāzes “binary digit”.

1.4.2. Patvaļīgas alfabēta rakstzīmes informācijas svars

Iepriekš mēs noskaidrojām, ka jebkuras dabiskās vai formālās valodas alfabētu var aizstāt ar bināro alfabētu. Šajā gadījumā sākotnējā alfabēta N jauda ir saistīta ar binārā koda i bitu ietilpību, kas nepieciešama, lai kodētu visas sākotnējā alfabēta rakstzīmes, attiecība: N = 2 i.

1. problēma. Pulti alfabēts satur 8 rakstzīmes. Kāds ir šī alfabēta simbola informācijas svars?

Risinājums. Īsi izklāstīsim problēmas apstākļus.

Sakarība starp lielumiem i un N ir zināma: N = 2 i.

Ņemot vērā sākotnējos datus: 8 = 2 i. Tātad: i = 3.

Pilns risinājums piezīmjdatorā varētu izskatīties šādi:

Atbilde: 3 biti

1.4.3. Ziņojuma informācijas apjoms

Ziņojuma informācijas apjoms (informācijas apjoms ziņojumā), kas attēlots ar dabiskās vai formālās valodas simboliem, sastāv no to veidojošo simbolu informācijas svariem.

2. problēma. Ziņojumā, kas rakstīts ar 32 rakstzīmju alfabētu, ir 140 rakstzīmes. Cik daudz informācijas tas satur?

Risinājums.

Atbilde": 700 biti.

3. problēma. Informācijas ziņojums ar tilpumu 720 biti sastāv no 180 rakstzīmēm. Kāds ir alfabēta spēks, kurā rakstīts šis ziņojums?

Risinājums.

Atbilde: 16 rakstzīmes.

1.4.4. Informācijas vienības

Mūsdienās teksta sagatavošana galvenokārt tiek veikta, izmantojot datorus. Mēs varam runāt par “datora alfabētu”, kurā ir iekļautas šādas rakstzīmes: mazie un lielie krievu un latīņu burti, cipari, pieturzīmes, aritmētisko darbību zīmes, iekavas uc Šajā alfabētā ir 256 rakstzīmes. Tā kā 256 = 2 8 , katras rakstzīmes informācijas svars šajā alfabētā ir 8 biti. Vērtību, kas vienāda ar astoņiem bitiem, sauc par baitu. 1 baits ir informācijas svars alfabēta simbolam ar ietilpību 256.

4. problēma. 4 KB informācijas ziņojums sastāv no 4096 rakstzīmēm. Kāds ir šī ziņojuma simbola informatīvais svars? Cik rakstzīmju ir alfabētā, ar kuru ir uzrakstīts šis ziņojums? Risinājums.

Atbilde: 256 rakstzīmes.

Svarīgākā

Izmantojot alfabētisko pieeju, tiek uzskatīts, ka katrai noteikta ziņojuma rakstzīmei ir noteikts informācijas svars - tas nes noteiktu informācijas daudzumu.

1 bits ir minimālā informācijas vienība.

Alfabēta simbola informācijas svars i un alfabēta jauda N ir savstarpēji saistīti ar sakarību: N = 2 i . Ziņojuma informācijas apjoms I ir vienāds ar ziņojumā esošo zīmju skaita K reizinājumu ar alfabēta i rakstzīmes informācijas svaru: I = K i.

1 baits = 8 biti.

Baits, kilobaits, megabaits, gigabaits, terabaits ir informācijas mērvienības. Katra nākamā vienība ir 1024 (2 10) reizes lielāka nekā iepriekšējā.

Jautājumi un uzdevumi


Datorzinātnē alfabēts ir zīmju sistēma, ko var izmantot informācijas ziņojuma nodošanai. Lai saprastu šīs definīcijas būtību, šeit ir daži papildu teorētiskie fakti:

  1. Jebkurš ziņojums sastāv no alfabēta. Piemēram, šis raksts ir vēstījums. Tad tas sastāv no krievu alfabēta rakstzīmēm.
  2. Ar simbolu mēs varam saprast minimāli nozīmīgo alfabēta daļiņu. Nedalāmās daļiņas sauc arī par atomiem. Krievu alfabēta rakstzīmes ir “a”, pēc tam “b”, “c” un tā tālāk.
  3. Teorētiski alfabēts nekādā veidā nav jākodē. Piemēram, drukātā grāmatā alfabēta rakstzīmes apzīmē sevi, kas nozīmē, ka tām nav nekāda kodējuma.

Bet praksē mums ir šādi: dators nesaprot, kas ir burti. Tāpēc, lai pārsūtītu informatīvo ziņojumu, tas vispirms ir jāiekodē datoram saprotamā valodā. Lai virzītos tālāk, nepieciešams ieviest papildu noteikumus.

Kāds ir alfabēta spēks

Ar alfabēta jaudu mēs saprotam kopējo rakstzīmju skaitu tajā. Lai uzzinātu, cik spēcīgs ir alfabēts, jums vienkārši jāsaskaita tajā esošo rakstzīmju skaits. Izdomāsim. Krievu alfabētam alfabēta jauda ir 33 vai 32 rakstzīmes, ja nelietojat “ё”.

Pieņemsim, ka visas mūsu alfabēta rakstzīmes sastopamas ar vienādu varbūtību. Šo pieņēmumu var saprast šādi: pieņemsim, ka mums ir maisiņš ar marķētiem kubiņiem. Kubu skaits tajā ir bezgalīgs, un katrs ir parakstīts tikai ar vienu simbolu. Tad ar vienmērīgu sadalījumu neatkarīgi no tā, cik daudz kubu mēs izņemam no maisa, kubu skaits ar dažādiem simboliem būs vienāds vai arī tas būs tendence, palielinoties kubu skaitam, ko mēs izņemam no maisa.

Informācijas ziņojumu svara novērtējums

Gandrīz pirms simts gadiem amerikāņu inženieris Ralfs Hārtlijs izstrādāja formulu, ar kuras palīdzību var novērtēt ziņojumā ietvertās informācijas apjomu. Viņa formula darbojas tikpat iespējamiem notikumiem un izskatās šādi:

i = log 2 M

Kur "i" ir nedalāmo informācijas atomu (bitu) skaits ziņojumā, "M" ir alfabēta jauda. Ejam tālāk. Izmantojot matemātiskās transformācijas, varam noteikt, ka alfabēta jaudu var aprēķināt šādi:

Šī formula kopumā definē sakarību starp vienādi iespējamo notikumu skaitu “M” un informācijas daudzumu “i”.

Jaudas aprēķināšana

Visticamāk, jūs jau no savas skolas datorzinātņu kursa zināt, ka modernās skaitļošanas sistēmas, kas veidotas uz fon Neimaņa arhitektūras, izmanto bināro informācijas kodēšanas sistēmu. Šādi tiek kodētas gan programmas, gan dati.

Lai attēlotu tekstu skaitļošanas sistēmā, tiek izmantots vienots astoņu ciparu kods. Kods tiek uzskatīts par vienotu, jo tajā ir fiksēta elementu kopa - 0 un 1. Vērtības šādā kodā tiek norādītas noteiktā šo elementu secībā. Izmantojot astoņu bitu kodu, mēs varam kodēt ziņojumus, kas sver 256 bitus, jo saskaņā ar Hārtlija formulu: M 8 = 2 8 = 256 biti informācijas.

Šī situācija ar bināro rakstzīmju kodējumu ir izveidojusies vēsturiski. Bet teorētiski datu attēlošanai mēs varētu izmantot citus alfabētus. Tā, piemēram, četru zīmju alfabētā katrai rakstzīmei būtu nevis viens, bet divi biti, astoņu zīmju alfabētā - 3 biti utt. To aprēķina, izmantojot bināro logaritmu, kas tika norādīts iepriekš ( i = log 2 M).

Tā kā alfabētā ar jaudu 256 biti vienas rakstzīmes apzīmēšanai ir piešķirti astoņi binārie cipari, tika nolemts ieviest papildu informācijas mēru - baitu. Viens baits satur vienu ASCII rakstzīmi un astoņus bitus.

Kā tiek mērīta informācija

Astoņu bitu kodējums isziņas, kas tiek izmantots ASCII rakstzīmju tabulā, ļauj uzņemt pamata komplekts Latīņu un kirilicas rakstzīmes ar lielajiem un mazajiem burtiem, cipari, pieturzīmju simboli un citas pamata rakstzīmes.

Lai izmērītu lielāku datu apjomu, vārdiem baits un bits tiek izmantoti īpaši prefiksi. Šādi prefiksi ir parādīti tabulā:

Daudzi cilvēki, kas ir studējuši fiziku, iebildīs, ka būtu racionāli izmantot klasiskos prefiksus, lai apzīmētu informācijas vienības (piemēram, kilo- un mega-), taču patiesībā tas nav pilnīgi pareizi, jo šādi lieluma prefiksi apzīmē reizināšanu ar vienu vai vēl viena skaitļa desmit pakāpe, kad datorzinātnēs visur tiek izmantota binārā mērīšanas sistēma.

Pareizi datu vienību nosaukumi

Lai novērstu neprecizitātes un neērtības, Starptautiskā elektrotehnikas komisija 1999. gada martā apstiprināja jaunus prefiksus mērvienībām, kas tiek izmantotas informācijas apjoma noteikšanai elektroniskajā. datortehnoloģijas. Šie prefiksi bija “mebi”, “kibi”, “gibi”, “tebi”, “exbi”, “peti”. Šīs vienības vēl nav iesakņojušās, tāpēc, visticamāk, būs vajadzīgs laiks, lai ieviestu šo standartu un sāktu plašu izmantošanu. Varat noteikt, kā veikt pāreju no klasiskajām vienībām uz nesen apstiprinātajām vienībām, izmantojot šo tabulu:

Pieņemsim, ka mums ir teksts, kurā ir K rakstzīmes. Pēc tam, izmantojot alfabētisko pieeju, mēs varam aprēķināt tajā ietvertās informācijas daudzumu V. Tas būs vienāds ar alfabēta jaudas un vienas rakstzīmes informācijas svara reizinājumu tajā.

Izmantojot Hārtlija formulu, mēs zinām, kā aprēķināt informācijas daudzumu, izmantojot bināro logaritmu. Pieņemot, ka alfabēta rakstzīmju skaits ir N un rakstzīmju skaits informācijas ziņojuma ierakstā ir K, mēs iegūstam šādu formulu ziņojuma informācijas apjoma aprēķināšanai:

V = K ⋅ log 2 N

Alfabētiskā pieeja norāda, ka informācijas apjoms būs atkarīgs tikai no alfabēta jaudas un ziņojumu lieluma (tas ir, no rakstzīmju skaita tajā), taču tas nekādā veidā nebūs saistīts ar personas semantisko saturu. .

Jaudas aprēķinu piemēri

Datorzinātņu stundās tie bieži rada problēmas atrast alfabēta spēku, ziņojuma garumu vai informācijas apjomu. Šeit ir viens šāds uzdevums:

"Teksta fails aizņem 11 KB diska vietas un satur 11264 rakstzīmes. Nosakiet šī teksta faila alfabēta ietilpību."

Kāds būs risinājums, var redzēt zemāk esošajā attēlā.

Tādējādi alfabēts, kura ietilpība ir 256 rakstzīmes, nes tikai 8 informācijas bitus, ko datorzinātnēs sauc par vienu baitu. Baits apraksta 1 ASCII tabulas rakstzīmi, kas, ja tā padomā, nemaz nav daudz.

Vai viens baits ir daudz vai maz?

Mūsdienu datu noliktavas, piemēram, Google un Facebook datu centri, satur ne mazāk kā desmitiem petabaitu informācijas. Precīzu datu apjomu gan būs grūti aprēķināt pat viņiem, jo ​​tad vajadzēs apturēt visus procesus serveros un liegt lietotājiem pieeju savas personīgās informācijas ierakstīšanai un rediģēšanai.

Bet, lai iedomāties tik neticami lielu datu apjomu, jums skaidri jāsaprot, ka viss sastāv no mazām detaļām. Ir jāsaprot, kāds ir alfabēta spēks (256) un cik bitu satur 1 baits informācijas (kā atceraties, 8).




Tops