Mikä on aakkosten tiedon voima. Tekstin tietomäärä ja tiedon mittayksiköt. Menetelmät tiedon mittaamiseksi sähköisessä muodossa

ONGELMANRATKAISU

Kun tallennat ja siirrät tietoja käyttämällä tekniset laitteet Tietoa tulee pitää merkkijonona - merkkinä (kirjaimet, numerot, kuvapisteiden värikoodit jne.).

Joukkoa merkkijärjestelmän (aakkoset) symboleja voidaan pitää erilaisina mahdollisina tiloina (tapahtumina).
Sitten, jos oletetaan, että symbolien esiintyminen viestissä on yhtä todennäköinen, mahdollisten tapahtumien määrä N voidaan laskea mm N = 2i
Tietojen määrä viestissä minä voidaan laskea kertomalla merkkien määrä K yhden merkin tietopainoa kohti i
Joten meillä on kaavat, joita tarvitaan tietojen määrän määrittämiseen aakkosjärjestyksessä:

Seuraavat tunnettujen (annettu) ja etsittyjen (etsi) määrien yhdistelmät ovat mahdollisia:

TyyppiAnnettulöytöKaava
1 i N N = 2i
2 N i
3 minä, K minä I=K*i
4 minä, minä K
5 Minä, K i
6 N, K minä Molemmat kaavat
7 N, I K
8 Minä, K N

Jos näihin ongelmiin lisätään tehtäviä eri mittayksiköissä kirjoitettujen suureiden suhteesta, käyttämällä suureiden esitysta kahden potenssien muodossa, saadaan 9 tyyppistä tehtävää.
Tarkastellaan kaiken tyyppisiä tehtäviä. Sovitaan, että siirryttäessä tiedon mittayksiköstä toiseen rakennamme arvoketjun. Tällöin laskentavirheen todennäköisyys pienenee.

Ongelma 1. On vastaanotettu viesti, jonka tietomäärä on 32 bittiä. Mikä on tämä tilavuus tavuina?

Ratkaisu: Yhdessä tavussa on 8 bittiä. 32:8=4
Vastaus: 4 tavua.

Ongelma 2. Tietosanoman määrä on kilotavuina ja megatavuina ilmaistuna 12582912 bittiä.

Ratkaisu: Koska 1 kt = 1024 tavua = 1024*8 bittiä, sitten 12582912:(1024*8) = 1536 kt ja
koska 1 Mt = 1024 kt, sitten 1536: 1024 = 1,5 Mt
Vastaus: 1536 kt ja 1,5 megatavua.

Tehtävä 3. Tietokoneessa on RAM 512 Mt. Tätä arvoa vastaavien bittien määrä on suurempi:

1) 10 000 000 000 bittiä 2) 8 000 000 000 bittiä 3) 6 000 000 000 bittiä 4) 4 000 000 000 bittiä Ratkaisu: 512 * 1024 * 1024 * 8 bittiä 6742 * 8 bittiä.
Vastaus: 4.

Tehtävä 4. Määritä bittien määrä kahdessa megatavussa käyttämällä vain 2:n potenssia numeroille.
Ratkaisu: Koska 1 tavu = 8 bittiä = 2 3 bittiä ja 1 Mt = 2 10 kt = 2 20 tavua = 2 23 bittiä. Näin ollen 2MB = 224 bittiä.
Vastaus: 224 bittiä.

Tehtävä 5. Kuinka monta megatavua tietoa 2 23 bitin viesti sisältää?
Ratkaisu: Koska 1 tavu = 8 bittiä = 2 3 bittiä, niin
2 23 bittiä = 2 23 * 2 23 * 2 3 bittiä = 2 10 2 10 tavua = 2 10 kt = 1 Mt.
Vastaus: 1MB

Tehtävä 6. Yksi aakkosten merkki "painottaa" 4 bittiä. Kuinka monta merkkiä tässä aakkosessa on?
Ratkaisu:
Annettu:


Vastaus: 16

Tehtävä 7. Jokainen aakkosten merkki on kirjoitettu 8-numeroisella binäärikoodilla. Kuinka monta merkkiä tässä aakkosessa on?
Ratkaisu:
Annettu:


Vastaus: 256

Tehtävä 8. Venäjän aakkosten arvioidaan joskus olevan 32 kirjainta. Mikä on tällaisen lyhennetyn venäläisen aakkoston yhden kirjaimen informaatiopaino?
Ratkaisu:
Annettu:


Vastaus: 5

Tehtävä 9. Aakkoset koostuvat 100 merkistä. Kuinka paljon tietoa tämän aakkoston yksi merkki sisältää?
Ratkaisu:
Annettu:


Vastaus: 5

Ongelma 10. Chichevok-heimon aakkosissa on 24 kirjainta ja 8 numeroa. Ei välimerkkejä tai aritmeettisia merkkejä. Mikä on binäärinumeroiden vähimmäismäärä, joka tarvitaan kaikkien merkkien koodaamiseen? Huomaa, että sanat on erotettava toisistaan!
Ratkaisu:
Annettu:


Vastaus: 5

Ongelma 11. Tietokoneella kirjoitettu kirja sisältää 150 sivua. Jokaisella sivulla on 40 riviä, jokaisella rivillä on 60 merkkiä. Kuinka paljon tietoa kirjassa on? Anna vastauksesi kilotavuina ja megatavuina
Ratkaisu:
Annettu:


Vastaus: 351 kt tai 0,4 megatavua

Ongelma 12. Unicode-koodauksella tietokoneella kirjoitetun kirjatekstin tietomäärä on 128 kilotavua. Määritä kirjan tekstin merkkien määrä.
Ratkaisu:
Annettu:


Vastaus: 65536

Ongelma 13. 1,5 kt:n tietosanoma sisältää 3072 merkkiä. Määritä käytetyn aakkoston yhden merkin informaatiopaino
Ratkaisu:
Annettu:


Vastaus: 4

Ongelma 14. Viesti, joka on kirjoitettu kirjaimilla 64 merkin aakkosesta, sisältää 20 merkkiä. Kuinka paljon tietoa se sisältää?
Ratkaisu:
Annettu:


Vastaus: 120 bittiä

Ongelma 15. Kuinka monta merkkiä 16-merkkisillä aakkosilla kirjoitettu viesti sisältää, jos sen koko on 1/16 megatavua?
Ratkaisu:
Annettu:


Vastaus: 131072

Ongelma 16. 2048 merkkiä sisältävän viestin koko oli 1/512 megatavua. Minkä kokoisilla aakkosilla viesti on kirjoitettu?
Ratkaisu:
Annettu:


Vastaus: 256

Tehtävät itsenäiseen ratkaisuun:

  1. Jokainen aakkosten merkki on kirjoitettu käyttämällä 4-numeroista binäärikoodia. Kuinka monta merkkiä tässä aakkosessa on?
  2. Viestien kirjoittamisen aakkoset koostuvat 32 merkistä; mikä on yhden merkin informaatiopaino? Muista ilmoittaa mittayksikkö.
  3. Tietokoneella Unicode-koodauksella kirjoitetun tekstin tietomäärä (jokainen merkki on koodattu 16 bitillä) on 4 kilotavua. Määritä tekstin merkkien määrä.
  4. Tietosanoman tilavuus on 8192 bittiä. Ilmaise se kilotavuina.
  5. Kuinka monta bittiä tietoa 4 Mt:n viesti sisältää? Anna vastaus potenssilla 2.
  6. Viesti, joka on kirjoitettu kirjaimilla 256 merkin aakkosesta, sisältää 256 merkkiä. Kuinka paljon tietoa se kuljettaa kilotavuina?
  7. Kuinka monta erilaista niitä on? äänisignaalit, joka koostuu lyhyiden ja pitkien puhelujen sarjoista. Kunkin signaalin pituus on 6 puhelua.
  8. Sääasema valvoo ilmankosteutta. Yhden mittauksen tulos on kokonaisluku 20-100%, joka kirjoitetaan mahdollisimman pienellä bittimäärällä. Asema teki 80 mittausta. Määritä tietomäärä havaintojen tuloksena.
  9. Tiedonsiirtonopeus ADSL-yhteyden kautta on 512 000 bps. Kautta tämä yhteys siirtää 1500 kt:n tiedoston. Määritä tiedoston siirtoaika sekunneissa.
  10. Määritä modeemin nopeus, jos se pystyy lähettämään 640x480 pikselin rasterikuvan 256 sekunnissa. Jokaista pikseliä kohden on 3 tavua. Entä jos paletissa on 16 miljoonaa väriä?
Aiheena tietomäärän määrittäminen aakkosjärjestyksen perusteella on käytetty yhtenäisen valtiontutkinnon koemateriaalin tehtävissä A1, A2, A3, A13, B5.

On olemassa useita tapoja mitata tiedon määrää. Yksi niistä on ns aakkosjärjestyksessä.

Aakkosellinen lähestymistapa voit mitata tiedon määrää tekstissä (symbolinen viesti), joka koostuu tietyn aakkoston merkeistä.

Aakkoset on joukko kirjaimia, merkkejä, numeroita, sulkeita jne.
Aakkosten merkkien lukumäärää kutsutaan nimellä tehoa.

Aakkosellisessa lähestymistavassa uskotaan, että jokaisella tekstin hahmolla on omansa tiedon paino. Symbolin informaatiopaino riippuu aakkosten voimakkuudesta.

Mikä on aakkosten pienin teho, jota voidaan käyttää tietojen tallentamiseen (koodaukseen)?



Kutsutaan yhdistelmäksi 2, 3 jne. bitti binäärikoodi.

Kuinka monta merkkiä voidaan koodata kahdella bitillä?

Symbolin järjestysnumero

1

2

3

4

Kaksinumeroinen binäärikoodi

00

01

10

11

4 merkkiä 2 bittiä.

Kuinka monta merkkiä voidaan koodata kolmella bitillä?

Symbolin järjestysnumero

1

2

3

4

5

6

7

8

Kolminumeroinen binäärikoodi

000

001

010

011

100

101

110

111


Tästä seuraa, että aakkosissa kardinaalisuuden kanssa 8 merkkiä kunkin merkin tietopaino - 3 bittiä.

Voimme päätellä, että aakkosissa kapasiteetilla 16 merkkiä kunkin merkin tietopaino on 4 bittiä.

Merkitään aakkosten voimaa kirjaimella N, ja symbolin informaatiopaino on kirjain b.

Aakkosten voiman suhde N ja symbolin tietopaino b.

N

2

4

8

16

b

1 bittiä

Mittaustiedot.

Aakkosellinen lähestymistapa tiedon mittaamiseen.

Sama viesti voi kuljettaa paljon tietoa yhdelle henkilölle, mutta ei kuljettaa sitä ollenkaan toiselle henkilölle. Tällä lähestymistavalla tiedon määrää on vaikea määrittää yksiselitteisesti.

Aakkosellinen lähestymistapa mahdollistaa jollain kielellä (luonnollisella tai muodollisella) esitetyn viestin tietomäärän mittaamisen sen sisällöstä riippumatta.

Minkä tahansa suuren kvantitatiiviseksi ilmaisemiseksi tarvitaan ensinnäkin mittayksikkö. Mittaus suoritetaan vertaamalla mitattua arvoa mittayksikköön. Se, kuinka monta kertaa mittayksikkö "sopii" mitattuun arvoon, on mittauksen tulos.

Aakkosellisessa lähestymistavassa uskotaan, että tietyn viestin jokaisella merkillä on omat ominaisuutensa tiedon paino- kantaa kiinteää tiedon määrä. Kaikilla saman aakkoston kirjaimilla on sama paino aakkosten voimakkuudesta riippuen. Binääriaakkoston symbolin informaatiopaino otetaan informaation minimiyksiköksi ja sitä kutsutaan 1 bittiä.

Huomaa, että tietoyksikön nimi "bit" tulee englanninkielisestä lauseesta binary digit - "binary digit".

1 bitti on pienin tiedon yksikkö. Uskotaan, että tämä on binääriaakkosten symbolin tietopaino.

1.6.2. Satunnaisen aakkoston merkin tietopaino

Aiemmin selvisimme, että minkä tahansa luonnollisen tai muodollisen kielen aakkoset voidaan korvata binääriaakkosilla. Tässä tapauksessa alkuperäisen aakkoston teho N on suhteessa binäärikoodin i bittikapasiteettiin, joka tarvitaan koodaamaan kaikki alkuperäisen aakkoston merkit, suhde: N = 2 i.

Aakkoston symbolin i informaatiopaino ja aakkoston N teho liittyvät toisiinsa suhteella: N = 2 i.

Tehtävä 1. Pulti-aakkosissa on 8 merkkiä. Mikä on tämän aakkoston symbolin informaatiopaino?

Ratkaisu. Tehdään lyhyt lausunto ongelman ehdoista.

Suureiden i ja N välinen suhde tunnetaan: N = 2 i.

Alkutiedot huomioon ottaen: 8 = 2 i. Tästä syystä: i = 3.

Täydellinen ratkaisu muistikirjassa voi näyttää tältä:

Vastaus: 3 bittiä.

1.6.3. Viestin tietomäärä

Tietomäärä sanoma (viestin informaation määrä), jota edustavat luonnollisen tai muodollisen kielen symbolit, koostuu sen muodostavien symbolien tietopainoista.

Sanoman I tietomäärä on yhtä suuri kuin viestin K merkkien lukumäärän ja aakkosten merkin i informaatiopainon tulo: I = K * i.

Ongelma 2. Viesti, joka on kirjoitettu 32 merkin aakkosilla, sisältää 140 merkkiä. Kuinka paljon tietoa se sisältää?

Tehtävä 3. Tietosanoma, jonka tilavuus on 720 bittiä, koostuu 180 merkistä. Mikä on aakkosten voima, jolla tämä viesti on kirjoitettu?

1.6.4. Tiedon yksiköt

Nykyään tekstin valmistelu tapahtuu pääasiassa tietokoneella. Voimme puhua "tietokoneaakkosesta", joka sisältää seuraavat merkit: pienet ja isot venäjän ja kirjaimet, numerot, välimerkit, aritmeettiset symbolit, hakasulkeet jne. Tämä aakkosto sisältää 256 merkkiä. Koska 256 = 28, kunkin merkin informaatiopaino tässä aakkostossa on 8 bittiä. Kahdeksan bitin arvoa kutsutaan tavuksi. 1 tavu on aakkosymbolin informaatiopaino, jonka kapasiteetti on 256.

1 tavu = 8 bittiä

Bitti ja tavu ovat "pieniä" mittayksiköitä. Käytännössä tietomäärien mittaamiseen käytetään suurempia yksiköitä:

1 kilotavu = 1 kt = 1024 tavua = 210 tavua

1 megatavu = 1 megatavu = 1024 kt = 210 kt = 220 tavua

1 gigatavu = 1 gigatavu = 1024 megatavua = 210 megatavua = 220 kt = 230 tavua

1 teratavu = 1 Tt = 1024 Gt = 210 Gt = 220 Mt = 230 kt = 240 tavua

Tehtävä 4. 4 kilotavun tietosanoma koostuu 4096 merkistä. Mikä on käytetyn aakkoston symbolin informaatiopaino? Kuinka monta merkkiä aakkoset, joilla tämä viesti on kirjoitettu, sisältävät?

Ongelma 5. Syklocrossiin osallistuu 128 urheilijaa. Erikoislaite rekisteröi jokaisen osallistujan välimaalin läpäisyn ja kirjaa sen numeron nollien ja ykkösten ketjuun, jonka pituus on vähintään joka urheilija. Mikä on laitteen tallentaman viestin tietomäärä sen jälkeen, kun 80 pyöräilijää on suorittanut välimaalin?

Ratkaisu. 128 osallistujan numerot on koodattu binääriaakkosilla. Binäärikoodin vaadittava bittisyvyys (ketjun pituus) on 7, koska 128 = 27. Toisin sanoen laitteen tallentama viesti, että yksi pyöräilijä on ohittanut välimaalin, sisältää 7 bittiä tietoa. Kun 80 urheilijaa suorittaa välimaalin, laite tallentaa 80 7 = 560 bittiä eli 70 tavua tietoa.

Muistakaamme, että subjektiivisen tiedon määrittelyn näkökulmasta tieto on viestien sisältöä, jonka henkilö saa eri lähteistä. Sama viesti voi kuljettaa paljon tietoa yhdelle henkilölle, mutta ei kuljettaa sitä ollenkaan toiselle henkilölle. Tällä lähestymistavalla tiedon määrää on vaikea määrittää yksiselitteisesti.

Aakkosellinen lähestymistapa mahdollistaa jollain kielellä (luonnollisella tai muodollisella) esitetyn viestin tietomäärän mittaamisen sen sisällöstä riippumatta.

Minkä tahansa suuren kvantitatiiviseksi ilmaisemiseksi tarvitaan ensinnäkin mittayksikkö. Mittaus suoritetaan vertaamalla mitattua arvoa mittayksikköön. Se, kuinka monta kertaa mittayksikkö "sopii" mitattuun arvoon, on mittauksen tulos.

Aakkosellisessa lähestymistavassa uskotaan, että jokaisella viestin merkillä on tietty informaatiopaino - se kuljettaa kiinteän määrän tietoa. Kaikilla saman aakkoston kirjaimilla on sama paino aakkosten voimakkuudesta riippuen. Binääriaakkoston symbolin informaatiopaino otetaan informaation vähimmäisyksikkönä ja sitä kutsutaan 1 bitiksi. Huomaa, että tietoyksikön nimi "bit" tulee englanninkielisestä lauseesta "binary digit".

1.4.2. Satunnaisen aakkoston merkin tietopaino

Aiemmin selvisimme, että minkä tahansa luonnollisen tai muodollisen kielen aakkoset voidaan korvata binääriaakkosilla. Tässä tapauksessa alkuperäisen aakkoston teho N on suhteessa binäärikoodin i bittikapasiteettiin, joka tarvitaan koodaamaan kaikki alkuperäisen aakkoston merkit, suhde: N = 2 i.

Ongelma 1. Pulti-aakkosissa on 8 merkkiä. Mikä on tämän aakkoston symbolin informaatiopaino?

Ratkaisu. Tehdään lyhyt lausunto ongelman ehdoista.

Suureiden i ja N välinen suhde tunnetaan: N = 2 i.

Alkutiedot huomioon ottaen: 8 = 2 i. Tästä syystä: i = 3.

Täydellinen ratkaisu muistikirjassa voi näyttää tältä:

Vastaus: 3 bittiä

1.4.3. Viestin tietomäärä

Viestin informaatiomäärä (viestin informaation määrä), jota edustavat luonnollisen tai muodollisen kielen symbolit, muodostuu sen muodostavien symbolien informaatiopainoista.

Ongelma 2. Viesti, joka on kirjoitettu 32 merkin aakkosilla, sisältää 140 merkkiä. Kuinka paljon tietoa se sisältää?

Ratkaisu.

Vastaus": 700 bittiä.

Ongelma 3. Tietosanoma, jonka tilavuus on 720 bittiä, koostuu 180 merkistä. Mikä on aakkosten voima, jolla tämä viesti on kirjoitettu?

Ratkaisu.

Vastaus: 16 merkkiä.

1.4.4. Tiedon yksiköt

Nykyään tekstin valmistelu tapahtuu pääasiassa tietokoneella. Voimme puhua "tietokoneaakkosesta", joka sisältää seuraavat merkit: pienet ja isot venäläiset ja latinalaiset kirjaimet, numerot, välimerkit, aritmeettisten operaatioiden merkit, hakasulkeet jne. Tämä aakkosto sisältää 256 merkkiä. Koska 256 = 2 8 , kunkin merkin informaatiopaino tässä aakkostossa on 8 bittiä. Kahdeksan bitin arvoa kutsutaan tavuksi. 1 tavu on aakkosymbolin informaatiopaino, jonka kapasiteetti on 256.

Ongelma 4. 4 kilotavun tietosanoma koostuu 4096 merkistä. Mikä on tämän viestin symbolin informaatiopaino? Kuinka monta merkkiä aakkoset, joilla tämä viesti on kirjoitettu, sisältävät? Ratkaisu.

Vastaus: 256 merkkiä.

Tärkein

Aakkosellisessa lähestymistavassa uskotaan, että tietyn viestin jokaisella merkillä on tietty informaatiopaino - se kuljettaa kiinteän määrän tietoa.

1 bitti on tiedon vähimmäisyksikkö.

Aakkosymbolin informaatiopaino i ja aakkoston teho N liittyvät toisiinsa suhteella: N = 2 i . Viestin informaatiotilavuus I on yhtä suuri kuin sanoman merkkien lukumäärän K tulo aakkoston i-merkin informaatiopainolla: I = K i.

1 tavu = 8 bittiä.

Tavu, kilotavu, megatavu, gigatavu, teratavu ovat tiedon mittayksiköitä. Jokainen seuraava yksikkö on 1024 (2 10) kertaa suurempi kuin edellinen.

Kysymyksiä ja tehtäviä


Tietojenkäsittelytieteessä aakkoset ovat merkkijärjestelmä, jota voidaan käyttää välittämään informaatiosanomaa. Tämän määritelmän olemuksen ymmärtämiseksi tässä on joitain muita teoreettisia faktoja:

  1. Kaikki viestit koostuvat aakkosista. Esimerkiksi tämä artikkeli on viesti. Sitten se koostuu venäjän aakkosten merkeistä.
  2. Symbolilla voimme ymmärtää aakkosten vähämerkityksisen hiukkasen. Jakamattomia hiukkasia kutsutaan myös atomeiksi. Venäjän aakkosten merkit ovat "a", sitten "b", "v" ja niin edelleen.
  3. Teoriassa aakkosia ei tarvitse koodata millään tavalla. Esimerkiksi painetussa kirjassa aakkosten merkit tarkoittavat itseään, mikä tarkoittaa, että niillä ei ole koodausta.

Mutta käytännössä meillä on seuraava: tietokone ei ymmärrä mitä kirjaimet ovat. Siksi informaatioviestin lähettäminen on ensin koodattava kielellä, jota tietokone ymmärtää. Jotta voimme edetä pidemmälle, on tarpeen ottaa käyttöön lisäehtoja.

Mikä on aakkosten voima

Aakkosten teholla tarkoitamme siinä olevien merkkien kokonaismäärää. Saadaksesi selville, kuinka voimakas aakkoset ovat, sinun tarvitsee vain laskea siinä olevien merkkien määrä. Selvitetään se. Venäjän aakkosissa aakkosten teho on 33 tai 32 merkkiä, jos et käytä "ё".

Oletetaan, että kaikki aakkosemme merkit esiintyvät yhtä suurella todennäköisyydellä. Tämä oletus voidaan ymmärtää seuraavasti: Oletetaan, että meillä on pussi merkittyjä kuutioita. Kuutioiden määrä siinä on ääretön, ja jokainen on merkitty vain yhdellä symbolilla. Sitten tasaisella jakautumisella, riippumatta siitä, kuinka monta kuutiota otamme pussista, eri symboleilla varustettujen kuutioiden määrä on sama, tai suuntautuu tähän, kun pussista otamme kuutiot lisääntyvät.

Tietosanomien painon arviointi

Lähes sata vuotta sitten amerikkalainen insinööri Ralph Hartley kehitti kaavan, jonka avulla voidaan arvioida viestin sisältämän tiedon määrä. Hänen kaavansa toimii yhtä todennäköisille tapahtumille ja näyttää tältä:

i = log 2 M

Missä "i" on jakamattomien informaatioatomien (bittien) lukumäärä viestissä, "M" on aakkosten teho. Siirrytään eteenpäin. Matemaattisten muunnosten avulla voimme määrittää, että aakkosten teho voidaan laskea seuraavasti:

Tämä kaava määrittelee yleisesti yhtä todennäköisten tapahtumien määrän "M" ja tiedon määrän "i" välillä.

Tehon laskeminen

Todennäköisesti tiedät jo koulusi tietojenkäsittelytieteen kurssilta, että nykyaikaiset von Neumann-arkkitehtuuriin rakennetut laskentajärjestelmät käyttävät binaarista tiedon koodausjärjestelmää. Tällä tavalla sekä ohjelmat että tiedot koodataan.

Tekstin esittämiseksi tietokonejärjestelmässä käytetään yhtenäistä kahdeksannumeroista koodia. Koodia pidetään yhtenäisenä, koska se sisältää kiinteän joukon elementtejä - 0 ja 1. Tällaisen koodin arvot määritetään näiden elementtien tietyssä järjestyksessä. Kahdeksan bitin koodia käyttämällä voimme koodata 256 bitin painoisia viestejä, koska Hartleyn kaavan mukaan: M 8 = 2 8 = 256 bittiä informaatiota.

Tämä binäärimerkkikoodauksen tilanne on kehittynyt historiallisesti. Mutta teoriassa voisimme käyttää muita aakkosia tietojen esittämiseen. Joten esimerkiksi neljän merkin aakkosissa jokaisen merkin paino ei olisi yksi, vaan kaksi bittiä, kahdeksanmerkkisessä aakkosessa - 3 bittiä ja niin edelleen. Tämä lasketaan käyttämällä yllä annettua binaarilogaritmia ( i = log 2 M).

Koska aakkosessa, jonka teho on 256 bittiä, kahdeksan binäärinumeroa on varattu yhden merkin osoittamiseen, päätettiin ottaa käyttöön lisätieto - tavu. Yksi tavu sisältää yhden ASCII-merkin ja kahdeksan bittiä.

Miten tietoa mitataan

Kahdeksan bittinen koodaus tekstiviestit, jota käytetään ASCII-merkkitaulukossa, sallii sinun mukautua perus setti Latinalaiset ja kyrilliset kirjaimet isoilla ja pienillä kirjaimilla, numerot, välimerkit ja muut perusmerkit.

Suurempien tietomäärien mittaamiseksi käytetään erityisiä etuliitteitä sanoille tavu ja bitti. Tällaiset etuliitteet on esitetty alla olevassa taulukossa:

Monet fysiikkaa opiskelleet väittävät, että olisi rationaalista käyttää klassisia etuliitteitä merkitsemään informaatioyksiköitä (kuten kilo- ja mega-), mutta itse asiassa tämä ei ole täysin oikein, koska tällaiset suureiden etuliitteet tarkoittavat kertomista yhdellä tai toinen luvun kymmenen potenssi, kun tietojenkäsittelytieteessä binäärimittausjärjestelmää käytetään kaikkialla.

Tietoyksiköiden oikeat nimet

Epätarkkuuksien ja haittojen poistamiseksi maaliskuussa 1999 kansainvälinen sähkötekniikan toimikunta hyväksyi uudet etuliitteet yksiköille, joita käytetään elektronisen tiedon määrän määrittämiseen. tietokone teknologia. Nämä etuliitteet olivat "mebi", "kibi", "gibi", "tebi", "exbi", "peti". Nämä yksiköt eivät ole vielä juurtuneet, joten tämän standardin käyttöönotto ja laajan käytön aloittaminen vie todennäköisesti aikaa. Seuraavan taulukon avulla voit määrittää, miten siirryt perinteisistä yksiköistä äskettäin hyväksyttyihin yksiköihin:

Oletetaan, että meillä on teksti, joka sisältää K merkkiä. Sitten aakkosjärjestystä käyttäen voimme laskea sen sisältämän informaation määrän V. Se on yhtä suuri kuin aakkosten tehon ja siinä olevan yhden merkin tietopainon tulo.

Hartleyn kaavaa käyttämällä osaamme laskea tiedon määrän binäärilogaritmin avulla. Olettaen, että aakkosmerkkien lukumäärä on N ja merkkien lukumäärä tietosanomatietueessa on K, saadaan seuraava kaava viestin tietomäärän laskemiseksi:

V = K ⋅ log 2 N

Aakkosellinen lähestymistapa osoittaa, että tiedon määrä riippuu vain aakkosten tehosta ja viestien koosta (eli siinä olevien merkkien määrästä), mutta se ei liity millään tavalla henkilön semanttiseen sisältöön. .

Tehon laskennan esimerkkejä

Tietojenkäsittelytieteen tunneilla he antavat usein ongelmia löytää aakkosten voima, viestin pituus tai tiedon määrä. Tässä yksi tällainen tehtävä:

"Tekstitiedosto vie 11 kt levytilaa ja sisältää 11 264 merkkiä. Määritä tämän tekstitiedoston aakkoskapasiteetti."

Mikä ratkaisu on, näkyy alla olevasta kuvasta.

Siten aakkoset, joiden kapasiteetti on 256 merkkiä, kuljettavat vain 8 bittiä tietoa, jota tietojenkäsittelytieteessä kutsutaan yhdeksi tavuksi. Tavu kuvaa yhtä ASCII-taulukon merkkiä, mikä, jos ajattelee sitä, ei ole ollenkaan paljon.

Onko yksi tavu paljon vai vähän?

Nykyaikaiset tietovarastot, kuten Googlen ja Facebookin datakeskukset, sisältävät peräti kymmeniä petatavuja tietoa. Tarkkaa datamäärää on kuitenkin vaikea laskea heillekään, koska silloin on tarpeen pysäyttää kaikki prosessit palvelimilla ja estää käyttäjiltä pääsy henkilökohtaisten tietojensa tallentamiseen ja muokkaamiseen.

Mutta kuvitellaksesi niin uskomattomia tietomääriä, sinun on ymmärrettävä selvästi, että kaikki koostuu pienistä yksityiskohdista. On tarpeen ymmärtää mikä on aakkosten teho (256) ja kuinka monta bittiä 1 tavu informaatiota sisältää (kuten muistat, 8).




Yläosa