Mikä on aakkostiedon voima. Tekstin tietomäärä ja tiedon mittayksiköt. Menetelmät tiedon mittaamiseksi sähköisessä muodossa

ONGELMANRATKAISU

Kun tallennat ja siirrät tietoja käyttämällä tekniset laitteet Tietoa tulee pitää merkkijonona - merkkinä (kirjaimet, numerot, kuvapisteiden värikoodit jne.).

Merkkijärjestelmän (aakkoset) merkistöä voidaan tarkastella erilaisina mahdollisina tiloina (tapahtumina).
Sitten, jos oletetaan, että merkkien esiintyminen viestissä on yhtä todennäköinen, mahdollisten tapahtumien määrä N voidaan laskea mm N = 2 i
Viestin tiedon määrä minä voidaan laskea kertomalla merkkien määrä K yhden merkin tietopainoa kohti i
Joten meillä on kaavat, joita tarvitaan tietojen määrän määrittämiseen aakkosjärjestyksessä:

Seuraavat tunnettujen (annettu) ja vaadittujen (Find) arvojen yhdistelmät ovat mahdollisia:

TyyppiAnnettulöytöKaava
1 i N N = 2 i
2 N i
3 minä, K minä I=K*i
4 minä, minä K
5 Minä, K i
6 N, K minä Molemmat kaavat
7 N,I K
8 Minä, K N

Jos näihin tehtäviin lisätään tehtäviä eri mittayksiköissä kirjoitettujen suureiden suhteesta käyttämällä suureiden esitysta kahden potenssien muodossa, saadaan 9 tyyppistä tehtävää.
Harkitse kaikentyyppisiä tehtäviä. Sovitaan, että siirryttäessä tiedon mittayksiköstä toiseen rakennamme arvoketjun. Tällöin laskentavirheen todennäköisyys pienenee.

Tehtävä 1. On vastaanotettu viesti, jonka datakoko on 32 bittiä. mikä tämä koko on tavuina?

Ratkaisu: Yhdessä tavussa on 8 bittiä. 32:8=4
Vastaus: 4 tavua.

Tehtävä 2. Tietosanoman määrä on kilotavuina ja megatavuina ilmaistuna 12582912 bittiä.

Ratkaisu: Koska 1KB = 1024 tavua = 1024*8 bittiä, sitten 12582912:(1024*8) = 1536 kt ja
koska 1 Mt = 1024 kt, sitten 1536:1024 = 1,5 Mt
Vastaus: 1536 kt ja 1,5 megatavua.

Tehtävä 3. Tietokoneessa on RAM 512 Mt. Tätä arvoa vastaavien bittien määrä on suurempi:

1) 10 000 000 000 bittiä 2) 8 000 000 000 bittiä 3) 6 000 000 000 bittiä 4) 4 000 000 000 bittiä Ratkaisu: 512 * 1024 * 1024 * 8 bittiä 9 = 9 bittiä.
Vastaus: 4.

Tehtävä 4. Määritä bittien määrä kahdessa megatavussa käyttämällä vain 2:n potenssia numeroille.
Ratkaisu: Koska 1 tavu = 8 bittiä = 2 3 bittiä ja 1 Mt = 2 10 kt = 2 20 tavua = 2 23 bittiä. Näin ollen 2MB = 224 bittiä.
Vastaus: 224 bittiä.

Tehtävä 5. Kuinka monta megatavua tietoa 2 23 bitin viesti sisältää?
Ratkaisu: Koska 1 tavu = 8 bittiä = 2 3 bittiä, niin
2 23 bittiä = 2 23 * 2 23 * 2 3 bittiä = 2 10 2 10 tavua = 2 10 kt = 1 Mt.
Vastaus: 1MB

Tehtävä 6. Yksi aakkosten merkki "painottaa" 4 bittiä. Kuinka monta merkkiä tässä aakkosessa on?
Päätös:
Annettu:


Vastaus: 16

Tehtävä 7. Jokainen aakkosten merkki on kirjoitettu käyttämällä binäärikoodin 8 numeroa. Kuinka monta merkkiä tässä aakkosessa on?
Päätös:
Annettu:


Vastaus: 256

Tehtävä 8. Venäjän aakkosten arvioidaan joskus olevan 32 kirjainta. Mikä on tällaisen lyhennetyn venäläisen aakkoston yhden kirjaimen informaatiopaino?
Päätös:
Annettu:


Vastaus: 5

Tehtävä 9. Aakkoset koostuvat 100 merkistä. Kuinka paljon tietoa tämän aakkoston yksi merkki sisältää?
Päätös:
Annettu:


Vastaus: 5

Tehtävä 10. Chichevok-heimossa on 24 kirjainta ja 8 numeroa aakkosissa. Ei välimerkkejä tai aritmeettisia merkkejä. Kuinka monta bittiä he tarvitsevat kaikkien merkkien koodaamiseen? Huomaa, että sanat on erotettava toisistaan!
Päätös:
Annettu:


Vastaus: 5

Tehtävä 11. Tietokoneella kirjoitettu kirja sisältää 150 sivua. Jokaisella sivulla on 40 riviä, jokaisella rivillä on 60 merkkiä. Kuinka paljon tietoa kirjassa on? Anna vastauksesi kilotavuina ja megatavuina.
Päätös:
Annettu:


Vastaus: 351 kt tai 0,4 megatavua

Tehtävä 12. Tietokoneella Unicode-koodauksella kirjoitetun kirjan tekstin tietomäärä on 128 kilotavua. Määritä kirjan tekstin merkkien määrä.
Päätös:
Annettu:


Vastaus: 65536

Tehtävä 13. 1,5 kb:n tietosanoma sisältää 3072 merkkiä. Määritä käytetyn aakkoston yhden merkin informaatiopaino
Päätös:
Annettu:


Vastaus: 4

Tehtävä 14. Viesti, joka on kirjoitettu 64 merkin aakkosten kirjaimilla, sisältää 20 merkkiä. Kuinka paljon tietoa se sisältää?
Päätös:
Annettu:


Vastaus: 120 bittiä

Tehtävä 15. Kuinka monta merkkiä 16 merkin aakkosilla kirjoitettu viesti sisältää, jos sen tilavuus on 1/16 megatavua?
Päätös:
Annettu:


Vastaus: 131072

Tehtävä 16. 2048 merkkiä sisältävän viestin tilavuus oli 1/512 megatavua. Minkä kokoinen on aakkoset, joilla viesti kirjoitetaan?
Päätös:
Annettu:


Vastaus: 256

Tehtävät itsenäiseen ratkaisuun:

  1. Jokainen aakkosten merkki on kirjoitettu käyttämällä 4 binäärinumeroa. Kuinka monta merkkiä tässä aakkosessa on?
  2. Viestien kirjoittamisen aakkoset koostuvat 32 merkistä, mikä on yhden merkin informaatiopaino? Muista määrittää mittayksikkö.
  3. Tietokoneella Unicode-koodauksella kirjoitetun tekstin tietomäärä (jokainen merkki on koodattu 16 bittiä) on 4 kilotavua. Määritä tekstin merkkien määrä.
  4. Tietosanoman koko on 8192 bittiä. Ilmaise se kilotavuina.
  5. Kuinka monta bittiä tietoa 4 Mt:n viesti sisältää? Anna vastauksesi teholla 2.
  6. Viesti, joka on kirjoitettu kirjaimilla 256 merkin pituisesta aakkosesta, sisältää 256 merkkiä. Kuinka paljon tietoa se kuljettaa kilotavuina?
  7. Kuinka monta erilaista äänisignaaleja, joka koostuu lyhyiden ja pitkien puhelujen sarjoista. Jokaisen signaalin pituus on 6 soittoa.
  8. Sääasema valvoo ilmankosteutta. Yhden mittauksen tulos on kokonaisluku 20 - 100 %, joka kirjoitetaan mahdollisimman pienellä bittimäärällä. Asema teki 80 mittausta. Määritä havaintotuloksen tietomäärä.
  9. Tiedonsiirtonopeus ADSL-yhteydellä on 512 000 bps. Kautta tämä yhdiste lähetä 1500 kt tiedosto. Määritä tiedoston siirtoaika sekunneissa.
  10. Määritä modeemin nopeus, jos se pystyy lähettämään 640x480 pikselin bittikartan 256 sekunnissa. Pikseliä kohden on 3 tavua. Ja jos paletissa on 16 miljoonaa väriä?
Aihetta tiedon määrän määrittämisestä aakkosjärjestyksen perusteella käytetään USE-testin ja mittausmateriaalin tehtävissä A1, A2, A3, A13, B5.

On olemassa useita tapoja mitata tiedon määrää. Yksi niistä on ns aakkosjärjestyksessä.

Aakkosellinen lähestymistapa voit mitata tiedon määrää tekstissä (symbolinen viesti), joka koostuu joidenkin aakkosten merkeistä.

Aakkoset on joukko kirjaimia, merkkejä, numeroita, sulkeita jne.
Aakkosten merkkien lukumäärää kutsutaan nimellä tehoa.

Aakkosellisessa lähestymistavassa katsotaan, että jokaisella tekstin hahmolla on tietty tiedon paino. Symbolin informaatiopaino riippuu aakkosten voimakkuudesta.

Mikä on aakkosten pienin kardinaliteetti, jota voidaan käyttää tietojen kirjoittamiseen (koodaukseen)?



Kutsutaan yhdistelmäksi 2, 3 jne. bitti binäärikoodi.

Kuinka monta merkkiä voidaan koodata kahdella bitillä?

Symbolin järjestysnumero

1

2

3

4

Kaksinumeroinen binäärikoodi

00

01

10

11

4 merkkiä 2 bittiä.

Kuinka monta merkkiä voidaan koodata kolmella bitillä?

Symbolin järjestysnumero

1

2

3

4

5

6

7

8

Kolminumeroinen binäärikoodi

000

001

010

011

100

101

110

111


Tästä seuraa, että kardinaalisuuden aakkosissa 8 merkkiä kunkin merkin tietopaino - 3 bittiä.

Voidaan päätellä, että aakkosissa voimalla 16 merkkiä kunkin merkin tietopaino on 4 bittiä.

Merkitse aakkosten kardinaalisuutta kirjaimella N, ja symbolin informaatiopaino on kirjain b.

Aakkosten voiman suhde N ja symbolitietojen paino b.

N

2

4

8

16

b

1 bittiä

Tiedon mittaaminen.

Aakkosellinen lähestymistapa tiedon mittaamiseen.

Sama viesti voi kuljettaa paljon tietoa yhdelle henkilölle, mutta ei kuljettaa sitä ollenkaan toiselle henkilölle. Tällä lähestymistavalla tiedon määrää on vaikea määrittää yksiselitteisesti.

Aakkosellinen lähestymistapa mahdollistaa tietyllä kielellä (luonnollisella tai muodollisella) esitetyn viestin tietomäärän mittaamisen sen sisällöstä riippumatta.

Minkä tahansa arvon kvantitatiiviseen ilmaisemiseen tarvitaan ensinnäkin mittayksikkö. Mittaus suoritetaan vertaamalla mitattua arvoa mittayksikköön. Kuinka monta kertaa mittayksikkö "sopii" mitattuun arvoon, sellainen on mittauksen tulos.

Aakkosellisessa lähestymistavassa katsotaan, että tietyn viestin jokaisella merkillä on tietty tiedon paino- kantaa kiinteää tiedon määrä. Kaikilla saman aakkosten merkeillä on sama paino aakkosten kardinaalisuudesta riippuen. Binääriaakkosmerkin informaatiopaino otetaan informaation vähimmäisyksikkönä ja sitä kutsutaan 1 bittiä

Huomaa, että tietoyksikön nimi "bit" (bit) tulee englanninkielisestä lauseesta binary digit - "binary digit".

1 bittiä pidetään tiedon minimimittayksikkönä. Uskotaan, että tämä on binääriaakkosten symbolin tietopaino.

1.6.2. Mielivaltaisen aakkoston merkin tietopaino

Aiemmin selvisimme, että minkä tahansa luonnollisen tai muodollisen kielen aakkoset voidaan korvata binääriaakkosilla. Tässä tapauksessa alkuperäisen aakkoston N teho on suhteessa binäärikoodin i bittisyvyyteen, joka tarvitaan koodaamaan kaikki alkuperäisen aakkoston merkit, suhteella: N = 2 i.

Aakkoston i merkin informaatiopaino ja aakkosten N teho liittyvät toisiinsa suhteella: N = 2 i.

Tehtävä 1. Pulti-heimon aakkosissa on 8 merkkiä. Mikä on merkin informatiivinen paino tässä aakkostossa?

Päätös. Tehdään lyhyt muistio ongelman tilasta.

Tunnetaan suhde, joka yhdistää i:n ja N:n arvot: N = 2 i.

Alkutiedot huomioon ottaen: 8 = 2 i. Näin ollen: i = 3.

Täydellinen muistiinpano ratkaisusta muistikirjassa voi näyttää tältä:

Vastaus: 3 bittiä.

1.6.3. Viestin tietomäärä

Tietomäärä luonnollisen tai muodollisen kielen symboleilla esitettävä viesti (viestin informaation määrä) muodostuu sen muodostavien symbolien informaatiopainoista.

Viestin I tietomäärä on yhtä suuri kuin sanoman K merkkien lukumäärän ja aakkosten merkin i informaatiopainon tulo: I = K * i.

Tehtävä 2. 32-merkkisillä aakkosilla kirjoitettu viesti sisältää 140 merkkiä. Kuinka paljon tietoa se sisältää?

Tehtävä 3. 720 bitin tietosanoma koostuu 180 merkistä. Mikä on aakkosten voima, jolla tämä viesti on kirjoitettu?

1.6.4. Tietoyksiköt

Nykyään tekstien valmistelu tapahtuu pääasiassa tietokoneiden avulla. Voimme puhua "tietokoneaakkosesta", joka sisältää seuraavat merkit: pienet ja isot venäjän ja kirjaimet, numerot, välimerkit, aritmeettisten operaatioiden merkit, hakasulkeet jne. Tämä aakkosto sisältää 256 merkkiä. Koska 256 = 28, kunkin merkin informaatiopaino tässä aakkostossa on 8 bittiä. Kahdeksan bitin arvoa kutsutaan tavuksi. 1 tavu - aakkosmerkin tietopaino, jonka kapasiteetti on 256.

1 tavu = 8 bittiä

Bitti ja tavu ovat "pieniä" mittayksiköitä. Käytännössä tietomäärien mittaamiseen käytetään suurempia yksiköitä:

1 kilotavu = 1 kt = 1024 tavua = 210 tavua

1 megatavu = 1 megatavu = 1024 kt = 210 kt = 220 tavua

1 gigatavu = 1 gigatavu = 1024 megatavua = 210 megatavua = 220 kt = 230 tavua

1 teratavu = 1 Tt = 1024 Gt = 210 Gt = 220 Mt = 230 kt = 240 tavua

Tehtävä 4. Tietosanoma, jonka tilavuus on 4 kt, koostuu 4096 merkistä. Mikä on käytetyn aakkoston merkin informatiivinen paino? Kuinka monta merkkiä on aakkosissa, joilla tämä viesti on kirjoitettu?

Tehtävä 5. Syklocrossiin osallistuu 128 urheilijaa. Erityinen laite rekisteröi jokaisen välimaalin osallistujan kulun ja kirjoittaa sen numeron minimipituisten nollien ja ykkösten ketjuna, joka on sama jokaiselle urheilijalle. Mikä on laitteen tallentaman viestin tietomäärä sen jälkeen, kun 80 pyöräilijää on ohittanut välimaalin?

Päätös. 128 osallistujan numerot on koodattu binääriaakkosilla. Binäärikoodin vaadittu bittisyvyys (ketjun pituus) on 7, koska 128 = 27. Toisin sanoen laitteen tallentama viesti, että yksi pyöräilijä ohitti välimaalin, sisältää 7 bittiä tietoa. Kun 80 urheilijaa läpäisee välimaalin, laite tallentaa 80 7 = 560 bittiä eli 70 tavua tietoa.

Muista, että tiedon määritelmän subjektiivisen lähestymistavan näkökulmasta tieto on viestien sisältöä, jonka henkilö saa eri lähteistä. Sama viesti voi kuljettaa paljon tietoa yhdelle henkilölle, mutta ei kuljettaa sitä ollenkaan toiselle henkilölle. Tällä lähestymistavalla tiedon määrää on vaikea määrittää yksiselitteisesti.

Aakkosellinen lähestymistapa mahdollistaa tietyllä kielellä (luonnollisella tai muodollisella) esitetyn viestin tietomäärän mittaamisen sen sisällöstä riippumatta.

Minkä tahansa arvon kvantitatiiviseen ilmaisemiseen tarvitaan ensinnäkin mittayksikkö. Mittaus suoritetaan vertaamalla mitattua arvoa mittayksikköön. Kuinka monta kertaa mittayksikkö "sopii" mitattuun arvoon, sellainen on mittauksen tulos.

Aakkosellisessa lähestymistavassa katsotaan, että tietyn viestin jokaisella symbolilla on tietty informaatiopaino - se kuljettaa kiinteän määrän tietoa. Kaikilla saman aakkosten merkeillä on sama paino aakkosten kardinaalisuudesta riippuen. Binääriaakkoston symbolin informaatiopaino otetaan informaation minimimittayksiköksi ja sitä kutsutaan 1 bitiksi. Huomaa, että tietoyksikön nimi "bit" (bit) tulee englanninkielisestä lauseesta "binary digit" - "binary digit".

1.4.2. Mielivaltaisen aakkoston merkin tietopaino

Aiemmin selvisimme, että minkä tahansa luonnollisen tai muodollisen kielen aakkoset voidaan korvata binääriaakkosilla. Tässä tapauksessa alkuperäisen aakkoston teho N suhteutetaan binäärikoodin i bittisyvyyteen, joka tarvitaan koodaamaan kaikki alkuperäisen aakkoston merkit, suhteella: N = 2 i .

Tehtävä 1. Pulti-heimon aakkosissa on 8 merkkiä. Mikä on merkin informatiivinen paino tässä aakkostossa?

Päätös. Tehdään lyhyt muistio ongelman tilasta.

Tunnetaan suhde, joka yhdistää i:n ja N:n arvot: N = 2 i .

Alkutiedot: 8 = 2 i . Näin ollen: i = 3.

Täydellinen muistiinpano ratkaisusta muistikirjassa voi näyttää tältä:

Vastaus: 3 bittiä

1.4.3. Viestin tietomäärä

Viestin informaatiomäärä (viestin informaation määrä) luonnollisen tai muodollisen kielen symboleilla on sen muodostavien symbolien informaatiopainojen summa.

Tehtävä 2. 32-merkkisillä aakkosilla kirjoitettu viesti sisältää 140 merkkiä. Kuinka paljon tietoa se sisältää?

Päätös.

Vastaus": 700 bittiä.

Tehtävä 3. 720 bitin tietosanoma koostuu 180 merkistä. Mikä on aakkosten voima, jolla tämä viesti on kirjoitettu?

Päätös.

Vastaus: 16 merkkiä.

1.4.4. Tietoyksiköt

Nykyään tekstien valmistelu tapahtuu pääasiassa tietokoneiden avulla. Voimme puhua "tietokoneaakkosesta", joka sisältää seuraavat merkit: pienet ja isot venäläiset ja latinalaiset kirjaimet, numerot, välimerkit, aritmeettiset symbolit, hakasulkeet jne. Tämä aakkosto sisältää 256 merkkiä. Koska 256 = 2 8 , kunkin merkin informaatiopaino tässä aakkostossa on 8 bittiä. Kahdeksan bitin arvoa kutsutaan tavuksi. 1 tavu - aakkosmerkin tietopaino, jonka kapasiteetti on 256.

Tehtävä 4. Tietosanoma, jonka tilavuus on 4 kt, koostuu 4096 merkistä. Mikä on tämän viestin luonteen informaatiopaino? Kuinka monta merkkiä on aakkosissa, joilla tämä viesti on kirjoitettu? Päätös.

Vastaus: 256 merkkiä.

Tärkein

Aakkosjärjestyksessä katsotaan, että jokaisella viestin symbolilla on tietty informaatiopaino - se kuljettaa kiinteän määrän tietoa.

1 bitti on tiedon vähimmäisyksikkö.

Aakkosten i-merkin informaatiopaino ja aakkosten teho N liittyvät toisiinsa suhteella: N = 2 i . Viestin informaatiotilavuus I on yhtä suuri kuin sanoman merkkien lukumäärän K ja aakkosten merkin tietopainon i tulo: I = K i.

1 tavu = 8 bittiä.

Tavut, kilotavut, megatavut, gigatavut, teratavut - tietoyksiköt. Jokainen seuraava yksikkö on 1024 (2 10) kertaa suurempi kuin edellinen.

Kysymyksiä ja tehtäviä


Tietojenkäsittelytieteen aakkoset ovat merkkijärjestelmä, jolla voit lähettää tiedotusviestin. Tämän määritelmän olemuksen ymmärtämiseksi tässä on joitain muita teoreettisia faktoja:

  1. Kaikki viestit koostuvat aakkosista. Esimerkiksi tämä artikkeli on viesti. Sitten se koostuu venäjän aakkosten symboleista.
  2. Symbolin alla voimme ymmärtää aakkosten pienimmän merkitsevän hiukkasen. Jakamattomia hiukkasia kutsutaan myös atomeiksi. Venäjän aakkosten merkit ovat "a", sitten "b", "c" ja niin edelleen.
  3. Teoriassa aakkosia ei tarvitse koodata millään tavalla. Esimerkiksi painetussa kirjassa aakkosten merkit tarkoittavat itseään, mikä tarkoittaa, että niillä ei ole koodausta.

Mutta käytännössä meillä on seuraava: tietokone ei ymmärrä mitä kirjaimet ovat. Tietosanoman lähettämiseksi se on siksi ensin koodattava kielellä, jota tietokone ymmärtää. Eteenpäin pääsemiseksi on otettava käyttöön lisäehtoja.

Mikä on aakkosten voima

Aakkosten kardinaaluudella tarkoitamme siinä olevien merkkien kokonaismäärää. Saadaksesi selville, mikä on aakkosten voima, sinun tarvitsee vain laskea siinä olevien merkkien määrä. Selvitetään se. Venäjän aakkosissa aakkosten teho on 33 tai 32 merkkiä, jos "ё" ei ole käytössä.

Oletetaan, että kaikki aakkosemme merkit esiintyvät yhtä suurella todennäköisyydellä. Tämä oletus voidaan ymmärtää seuraavasti: Oletetaan, että meillä on pussi signeerattuja noppaa. Kuutioiden määrä siinä on ääretön, ja jokainen on merkitty vain yhdellä symbolilla. Silloin tasaisella jakautumisella, riippumatta siitä kuinka monta kuutiota otamme pussista, eri symboleilla varustettujen kuutioiden määrä on sama, tai yleensä tämä lisääntyy pussista otettavien kuutioiden määrässä. laukku.

Tietoviestien painon arvioiminen

Lähes sata vuotta sitten amerikkalainen insinööri Ralph Hartley kehitti kaavan, jonka avulla voidaan arvioida viestin sisältämän tiedon määrä. Hänen kaavansa toimii yhtäläisille tapahtumille ja näyttää tältä:

i = log 2 M

Missä "i" on jakamattomien informaatioatomien (bittien) lukumäärä viestissä, "M" on aakkosten teho. Seuraamme edelleen. Matemaattisten muunnosten avulla voimme määrittää, että aakkosten teho voidaan laskea seuraavasti:

Tämä kaava määrittelee yleensä suhteen yhtä todennäköisten tapahtumien määrän "M" ja tiedon määrän "i" välillä.

Laskemme tehon

Todennäköisesti tiedät jo koulun tietojenkäsittelytieteen kurssilta, että nykyaikaiset von Neumann -arkkitehtuuriin rakennetut laskentajärjestelmät käyttävät binaarista tiedon koodausjärjestelmää. Näin ohjelmat ja tiedot koodataan.

Tekstin esittämiseksi tietokonejärjestelmässä käytetään yhtenäistä kahdeksan bitin koodia. Koodia pidetään yhtenäisenä, koska se sisältää kiinteän joukon elementtejä - 0 ja 1. Tällaisen koodin arvot annetaan näiden elementtien tietyssä järjestyksessä. Kahdeksan bitin koodin avulla voimme koodata 256 bitin painoisia viestejä, koska Hartley-kaavan mukaan: M 8 \u003d 2 8 \u003d 256 bittiä tietoa.

Tämä binäärikoodin merkkikoodauksen tilanne on kehittynyt historiallisesti. Mutta teoriassa voisimme käyttää muita aakkosia tietojen esittämiseen. Joten esimerkiksi neljän merkin aakkosissa jokaisen merkin paino ei olisi yksi, vaan kaksi bittiä, kahdeksanmerkkisessä aakkosessa - 3 bittiä ja niin edelleen. Tämä lasketaan käyttämällä yllä annettua binaarilogaritmia ( i = log 2 M).

Koska aakkosessa, jonka kapasiteetti on 256 bittiä, kahdeksan binäärinumeroa on varattu yhden merkin osoittamiseen, päätettiin ottaa käyttöön lisätieto - tavu. Yksi tavu sisältää yhden ASCII-kooditaulukon merkin ja sisältää kahdeksan bittiä.

Miten tietoa mitataan

8-bittinen koodaus tekstiviestit, jota käytetään ASCII-kooditaulukossa, mahdollistaa sovituksen perus setti Latinalaiset ja kyrilliset kirjaimet isoilla ja pienillä kirjaimilla, numerot, välimerkit ja muut perusmerkit.

Suurempien tietomäärien mittaamiseksi käytetään erityisiä etuliitteitä sanoille tavut ja bitit. Tällaiset etuliitteet on esitetty alla olevassa taulukossa:

Monet fysiikkaa opiskelleet vastustavat sitä, että olisi järkevää käyttää klassisia etuliitteitä merkitsemään informaatioyksiköitä (kuten kilo- ja mega-), mutta itse asiassa tämä ei ole täysin oikein, koska tällaiset suureiden etuliitteet tarkoittavat kertomista yhdellä tai toinen kymmenen potenssi, kun binäärimittausjärjestelmää käytetään kaikkialla tietojenkäsittelytieteessä.

Tietoyksiköiden oikeat nimet

Virheiden ja haittojen poistamiseksi maaliskuussa 1999 kansainvälinen sähkötekniikan komissio hyväksyi uudet etuliitteet yksiköihin, joita käytetään elektronisen tiedon määrän määrittämiseen. tietokone Tiede. Tällaisia ​​etuliitteitä olivat "mebi", "kibi", "gibi", "tebi", "exbi", "peti". Vaikka nämä yksiköt eivät ole vielä juurtuneet, tämän standardin käyttöönotto ja laajan käytön alkaminen vie todennäköisesti aikaa. Kuinka siirtyä klassisista yksiköistä äskettäin hyväksyttyihin yksiköihin, voit määrittää seuraavasta taulukosta:

Oletetaan, että meillä on teksti, joka sisältää K merkkiä. Sitten aakkosjärjestyksen avulla voimme laskea sen sisältämän informaation määrän V. Se on yhtä suuri kuin aakkosten tehon ja siinä olevan yhden merkin tietopainon tulo.

Hartley-kaavan mukaan osaamme laskea tiedon määrän binäärilogaritmin avulla. Olettaen, että aakkosten merkkien määrä on N ja tietosanomatietueen merkkien määrä K, saadaan seuraava kaava viestin tietosisällön laskemiseksi:

V = K ⋅ log 2 N

Aakkosellinen lähestymistapa viittaa siihen, että tiedon määrä riippuu vain aakkosten tehosta ja viestien koosta (eli siinä olevien merkkien määrästä), mutta se ei liity henkilön semanttiseen sisältöön.

Esimerkkejä teholaskennasta

Tietojenkäsittelyn tunneilla he usein antavat tehtäviä löytääkseen aakkosten voiman, viestin pituuden tai tietomäärän. Tässä yksi näistä tehtävistä:

"Tekstitiedosto vie 11 kt levytilaa ja sisältää 11 264 merkkiä. Määritä tämän tekstitiedoston aakkosten kardinaalisuus."

Mikä on ratkaisu, näet alla olevasta kuvasta.

Siten aakkoset, joiden kapasiteetti on 256 merkkiä, kuljettavat vain 8 bittiä tietoa, jota tietojenkäsittelytieteessä kutsutaan yhdeksi tavuksi. Tavu kuvaa yhtä ASCII-taulukon merkkiä, mikä, jos ajattelee sitä, ei ole ollenkaan paljon.

Onko yksi tavu paljon vai vähän?

Nykyaikaiset tietovarastot, kuten Googlen ja Facebookin datakeskukset, sisältävät peräti kymmeniä petatavuja tietoa. Tarkkaa datamäärää on kuitenkin vaikea laskea edes itse, koska silloin on tarpeen pysäyttää kaikki prosessit palvelimilla ja estää käyttäjiltä pääsy henkilökohtaisten tietojensa tallentamiseen ja muokkaamiseen.

Mutta tällaisten käsittämättömien tietomäärien kuvittelemiseksi on ymmärrettävä selvästi, että kaikki koostuu pienistä yksityiskohdista. On tarpeen ymmärtää, mikä on aakkosten teho (256) ja kuinka monta bittiä sisältää 1 tavun tietoa (kuten muistat, 8).




Ylös