Alfabe bilgisinin gücü nedir? Metnin bilgi hacmi ve bilginin ölçü birimleri. Elektronik formdaki bilgileri ölçme yöntemleri

PROBLEM ÇÖZME

Bilgiyi kullanarak saklarken ve iletirken teknik cihazlar bilgiler bir dizi sembol - işaret (harfler, sayılar, görüntü noktalarının renk kodları vb.) olarak değerlendirilmelidir.

Bir işaret sisteminin (alfabe) bir dizi sembolü, çeşitli olası durumlar (olaylar) olarak düşünülebilir.
Daha sonra, bir mesajda sembollerin ortaya çıkmasının eşit derecede olası olduğunu varsayarsak, olası olayların sayısı Nşu şekilde hesaplanabilir N=2i
Bir mesajdaki bilgi miktarı BEN karakter sayısı çarpılarak hesaplanabilir k bir karakterin bilgi ağırlığı başına Ben
Alfabetik yaklaşımla bilgi miktarını belirlemek için gereken formüllere sahibiz:

Bilinen (Verilen) ve aranan (Bul) miktarların aşağıdaki kombinasyonları mümkündür:

TipVerilenBulmakFormül
1 Ben N N=2i
2 N Ben
3 ben, K BEN ben=K*i
4 ben, ben k
5 ben, K Ben
6 N, K BEN Her iki formül
7 N, ben k
8 ben, K N

Bu problemlere, büyüklüklerin ikinin kuvvetleri şeklinde gösterimini kullanarak, farklı ölçü birimlerinde yazılan büyüklüklerin oranı ile ilgili görevleri eklersek, 9 tür problem elde ederiz.
Her türden görevi ele alalım. Bir bilgi ölçümü biriminden diğerine geçerken bir değerler zinciri oluşturacağımız konusunda hemfikir olalım. O zaman hesaplama hatası olasılığı azalır.

Sorun 1. 32 bit bilgi hacmine sahip bir mesaj alındı. Bayt cinsinden bu hacim nedir?

Çözüm: Bir baytta 8 bit vardır. 32:8=4
Cevap: 4 bayt.

Sorun 2. Bilgi mesajının hacmi kilobayt ve megabayt cinsinden ifade edilen 12582912 bittir.

Çözüm: 1Kbayt=1024 bayt=1024*8 bit olduğuna göre 12582912:(1024*8)=1536 Kbayt ve
1 MB = 1024 KB olduğundan 1536: 1024 = 1,5 MB
Cevap: 1536KB ve 1,5MB.

Görev 3. Bilgisayar var Veri deposu 512MB. Bu değere karşılık gelen bit sayısı daha fazladır:

1) 10.000.000.000 bit 2) 8.000.000.000 bit 3) 6.000.000.000 bit 4) 4.000.000.000 bit Çözüm: 512*1024*1024*8 bit=4294967296 bit.
Cevap: 4.

Görev 4. Sayılar için yalnızca 2'nin katlarını kullanarak iki megabayttaki bit sayısını belirleyin.
Çözüm: 1 bayt = 8 bit = 2 3 bit ve 1 MB = 2 10 KB = 2 20 bayt = 2 23 bit olduğundan. Dolayısıyla 2MB = 2 24 bit.
Cevap: 2 24 bit.

Görev 5. 2 23 bitlik bir mesaj kaç megabayt bilgi içerir?
Çözüm: 1 bayt = 8 bit = 2 3 bit olduğundan, o zaman
2 23 bit=2 23 *2 23 *2 3 bit=2 10 2 10 bayt=2 10 KB=1MB.
Cevap: 1MB

Görev 6. Alfabenin bir karakteri 4 bit “ağırlığındadır”. Bu alfabede kaç karakter var?
Çözüm:
Verilen:


Cevap: 16

Görev 7. Alfabenin her karakteri 8 basamaklı ikili kod kullanılarak yazılır. Bu alfabede kaç karakter var?
Çözüm:
Verilen:


Cevap: 256

Görev 8. Rus alfabesinin bazen 32 harf olduğu tahmin edilmektedir. Böyle kısaltılmış bir Rus alfabesinin bir harfinin bilgi ağırlığı nedir?
Çözüm:
Verilen:


Cevap: 5

Görev 9. Alfabe 100 karakterden oluşur. Bu alfabenin bir karakteri ne kadar bilgi taşıyor?
Çözüm:
Verilen:


Cevap: 5

Sorun 10.Çiçevok kabilesinin alfabesinde 24 harf ve 8 rakam bulunmaktadır. Noktalama işaretleri veya aritmetik işaretleri yoktur. Tüm karakterleri kodlamak için ihtiyaç duydukları minimum ikili basamak sayısı nedir? Lütfen kelimelerin birbirinden ayrılması gerektiğini unutmayın!
Çözüm:
Verilen:


Cevap: 5

Sorun 11. Bilgisayar kullanılarak yazılan kitap 150 sayfadan oluşuyor. Her sayfada 40 satır, her satırda 60 karakter bulunmaktadır. Kitapta ne kadar bilgi var? Cevabınızı kilobayt ve megabayt cinsinden verin
Çözüm:
Verilen:


Cevap: 351KB veya 0,4MB

Sorun 12. Unicode kodlama kullanılarak bilgisayarda yazılan kitap metninin bilgi hacmi 128 kilobayttır. Kitabın metnindeki karakter sayısını belirleyin.
Çözüm:
Verilen:


Cevap: 65536

Sorun 13. 1,5 KB'lık bir bilgi mesajı 3072 karakter içerir. Kullanılan alfabenin bir karakterinin bilgi ağırlığını belirleyin
Çözüm:
Verilen:


Cevap: 4

Sorun 14. 64 karakterlik alfabedeki harflerle yazılan mesaj 20 karakterden oluşuyor. Ne kadar bilgi taşıyor?
Çözüm:
Verilen:


Cevap: 120bit

Sorun 15. 16 karakterlik alfabe kullanılarak yazılan bir mesaj, boyutu megabaytın 1/16'sı ise kaç karakter içerir?
Çözüm:
Verilen:


Cevap: 131072

Sorun 16. 2048 karakterden oluşan mesajın boyutu 1/512 megabayttı. Mesajın yazıldığı alfabenin büyüklüğü nedir?
Çözüm:
Verilen:


Cevap: 256

Bağımsız çözüm için görevler:

  1. Alfabenin her karakteri 4 basamaklı ikili kod kullanılarak yazılır. Bu alfabede kaç karakter var?
  2. Mesaj yazma alfabesi 32 karakterden oluşur; bir karakterin bilgi ağırlığı nedir? Ölçü birimini belirtmeyi unutmayın.
  3. Unicode kodlaması kullanılarak bir bilgisayara yazılan metnin bilgi hacmi (her karakter 16 bit ile kodlanmıştır) 4 KB'dir. Metindeki karakter sayısını belirleyin.
  4. Bilgi mesajının hacmi 8192 bittir. Kilobayt cinsinden ifade edin.
  5. 4 MB'lık bir mesaj kaç bit bilgi içerir? Cevabı 2'nin kuvvetleri olarak verin.
  6. 256 karakterlik alfabedeki harflerle yazılan bir mesaj 256 karakterden oluşur. Kilobayt cinsinden ne kadar bilgi taşıyor?
  7. Kaç tane farklı var? ses sinyalleri, kısa ve uzun arama dizilerinden oluşur. Her sinyalin uzunluğu 6 çağrıdır.
  8. Meteoroloji istasyonu havanın nemini izliyor. Bir ölçümün sonucu, mümkün olan en küçük bit sayısı kullanılarak yazılan %20 ila %100 arasında bir tam sayıdır. İstasyon 80 ölçüm yaptı. Gözlemler sonucunda bilgi hacmini belirleyin.
  9. ADSL bağlantısı üzerinden veri aktarım hızı 512.000 bps'dir. Başından sonuna kadar bu bağlantı 1500 KB boyutunda bir dosyayı aktarın. Dosya aktarım süresini saniye cinsinden belirleyin.
  10. Modemin 640x480 piksellik bir raster görüntüyü 256 saniyede iletebilmesi durumunda hızını belirleyiniz. Her piksel için 3 bayt vardır. Peki ya palette 16 milyon renk varsa?
Alfabetik yaklaşıma dayalı bilgi miktarının belirlenmesi konusu, Birleşik Devlet Sınavı test materyallerinin A1, A2, A3, A13, B5 görevlerinde kullanılmaktadır.

Bilgi miktarını ölçmenin birkaç yolu vardır. Onlardan birine denir alfabetik.

Alfabetik yaklaşım belirli bir alfabenin karakterlerinden oluşan bir metindeki (sembolik mesaj) bilgi miktarını ölçmenizi sağlar.

Alfabe harfler, işaretler, sayılar, parantez vb.'den oluşan bir dizidir.
Alfabedeki karakter sayısına denir güç.

Alfabetik yaklaşımla metindeki her karakterin kendine özgü bir anlamı olduğuna inanılmaktadır. bilgi ağırlığı. Bir sembolün bilgi ağırlığı alfabenin gücüne bağlıdır.

Bilgiyi kaydetmek (kodlamak) için kullanılabilecek alfabenin minimum gücü nedir?



2, 3 vb. kombinasyonu diyelim. biraz ikili kod.

İki bitle kaç karakter kodlanabilir?

Sembol sıra numarası

1

2

3

4

İki basamaklı ikili kod

00

01

10

11

4 karakter 2 bit.

Üç bitle kaç karakter kodlanabilir?

Sembol sıra numarası

1

2

3

4

5

6

7

8

Üç haneli ikili kod

000

001

010

011

100

101

110

111


Şunu takip eder: önem sırasına sahip alfabede 8 karakter her karakterin bilgi ağırlığı - 3 bit.

Kapasiteli alfabede olduğu sonucuna varabiliriz 16 karakter her karakterin bilgi ağırlığı 4 bit.

Alfabenin gücünü harfle gösterelim N ve sembolün bilgi ağırlığı harftir B.

Alfabenin gücü arasındaki ilişki N ve sembolün bilgi ağırlığı B.

N

2

4

8

16

B

1 bit

Ölçüm bilgileri.

Bilgi ölçümüne alfabetik yaklaşım.

Aynı mesaj bir kişi için çok fazla bilgi taşıyabilirken, başka bir kişi için hiç taşımayabilir. Bu yaklaşımla bilgi miktarını kesin olarak belirlemek zordur.

Alfabetik yaklaşım, içeriği ne olursa olsun, bir dilde (doğal veya resmi) sunulan bir mesajın bilgi hacmini ölçmemize olanak tanır.

Herhangi bir büyüklüğü niceliksel olarak ifade edebilmek için öncelikle bir ölçü birimi gereklidir. Ölçüm, ölçülen değerin bir ölçü birimiyle karşılaştırılması yoluyla gerçekleştirilir. Bir ölçü biriminin ölçülen değere kaç kez "uyduğu" ölçümün sonucudur.

Alfabetik yaklaşımda, belirli bir mesajın her karakterinin kendine özgü bir anlamı olduğuna inanılmaktadır. bilgi ağırlığı- sabit taşır Bilgi miktarı. Aynı alfabenin tüm karakterleri, alfabenin gücüne bağlı olarak aynı ağırlığa sahiptir. İkili alfabedeki bir sembolün bilgi ağırlığı, minimum bilgi birimi olarak alınır ve denir. 1 bit.

Lütfen "bit" bilgi biriminin adının İngilizce ikili rakam - "ikili rakam" ifadesinden geldiğini unutmayın.

Minimum bilgi birimi olarak 1 bit alınır. Bunun ikili alfabenin bir sembolünün bilgi ağırlığı olduğuna inanılmaktadır.

1.6.2. Rastgele bir alfabedeki bir karakterin bilgi ağırlığı

Daha önce herhangi bir doğal veya resmi dilin alfabesinin ikili bir alfabeyle değiştirilebileceğini öğrendik. Bu durumda, orijinal alfabe N'nin gücü, orijinal alfabenin tüm karakterlerini kodlamak için gereken ikili kodun i bit kapasitesiyle ilişkilidir, ilişki: N = 2 i.

Alfabe sembolü i'nin bilgi ağırlığı ve N alfabesinin gücü birbiriyle şu ilişkiyle ilişkilidir: N = 2 i.

Görev 1. Pulti alfabesi 8 karakterden oluşur. Bu alfabenin bir sembolünün bilgi ağırlığı nedir?

Çözüm. Sorunun koşullarına ilişkin kısa bir açıklama yapalım.

i ve N büyüklükleri arasındaki ilişki bilinmektedir: N = 2 i.

Başlangıç ​​verileri dikkate alındığında: 8 = 2 i. Dolayısıyla: i = 3.

Bir dizüstü bilgisayardaki eksiksiz çözüm şu şekilde görünebilir:

Cevap: 3 bit.

1.6.3. Mesajın bilgi hacmi

Bilgi hacmi Doğal veya resmi bir dilin sembolleriyle temsil edilen mesaj (bir mesajdaki bilgi miktarı), kendisini oluşturan sembollerin bilgi ağırlıklarından oluşur.

I mesajının bilgi hacmi, K mesajındaki karakter sayısı ile i alfabe karakterinin bilgi ağırlığının çarpımına eşittir: I = K * i.

Sorun 2. 32 karakterlik alfabeyle yazılan mesaj 140 karakterden oluşuyor. Ne kadar bilgi taşıyor?

Görev 3. 720 bitlik bir bilgi mesajı 180 karakterden oluşur. Bu mesajın yazıldığı alfabenin gücü nedir?

1.6.4. Bilgi birimleri

Günümüzde metin hazırlama çoğunlukla bilgisayar kullanılarak yapılmaktadır. Şu karakterleri içeren bir “bilgisayar alfabesinden” bahsedebiliriz: küçük ve büyük Rusça ve edebiyat, sayılar, noktalama işaretleri, aritmetik semboller, parantez vb. Bu alfabe 256 karakter içerir. 256=28 olduğundan bu alfabedeki her karakterin bilgi ağırlığı 8 bittir. Sekiz bit'e eşit bir değere bayt denir. 1 byte, 256 kapasiteli bir alfabe sembolünün bilgi ağırlığıdır.

1 bayt = 8 bit

Bit ve bayt “küçük” ölçü birimleridir. Pratikte bilgi hacimlerini ölçmek için daha büyük birimler kullanılır:

1 kilobayt = 1 KB = 1024 bayt = 210 bayt

1 megabayt = 1 MB = 1024 KB = 210 KB = 220 bayt

1 gigabayt = 1 GB = 1024 MB = 210 MB = 220 KB = 230 bayt

1 terabayt = 1 TB = 1024 GB = 210 GB = 220 MB = 230 KB = 240 bayt

Görev 4. 4 KB'lık bir bilgi mesajı 4096 karakterden oluşur. Kullanılan alfabe sembolünün bilgi ağırlığı nedir? Bu mesajın yazıldığı alfabe kaç karakterden oluşuyor?

Sorun 5. Cyclocross'a 128 sporcu katılıyor. Özel bir cihaz, her katılımcının ara bitişi geçişini kaydeder ve numarasını, her sporcu için aynı olacak şekilde sıfırlar ve minimum uzunluktaki birler zinciri halinde kaydeder. 80 bisikletçi ara finişi tamamladıktan sonra cihazın kaydettiği mesajın bilgi hacmi ne olacak?

Çözüm. 128 katılımcının numaraları ikili alfabe kullanılarak kodlanmıştır. İkili kodun gerekli bit derinliği (zincir uzunluğu) 128 = 27 olduğundan 7'dir. Başka bir deyişle, bir bisikletçinin ara bitişi geçtiğine dair cihaz tarafından kaydedilen mesaj 7 bitlik bilgi taşır. 80 sporcu ara finişi tamamladığında cihaz 80 7 = 560 bit yani 70 byte bilgi kaydedecektir.

Bilginin tanımlanmasına subjektif bir yaklaşım açısından bakıldığında bilginin, kişinin çeşitli kaynaklardan aldığı mesajların içeriği olduğunu hatırlayalım. Aynı mesaj bir kişi için çok fazla bilgi taşıyabilirken, başka bir kişi için hiç taşımayabilir. Bu yaklaşımla bilgi miktarını kesin olarak belirlemek zordur.

Alfabetik yaklaşım, içeriği ne olursa olsun, bir dilde (doğal veya resmi) sunulan bir mesajın bilgi hacmini ölçmemize olanak tanır.

Herhangi bir büyüklüğü niceliksel olarak ifade edebilmek için öncelikle bir ölçü birimi gereklidir. Ölçüm, ölçülen değerin bir ölçü birimiyle karşılaştırılması yoluyla gerçekleştirilir. Bir ölçü biriminin ölçülen değere kaç kez "uyduğu" ölçümün sonucudur.

Alfabetik yaklaşımla, bir mesajın her karakterinin belirli bir bilgi ağırlığına sahip olduğuna, sabit miktarda bilgi taşıdığına inanılmaktadır. Aynı alfabenin tüm karakterleri, alfabenin gücüne bağlı olarak aynı ağırlığa sahiptir. İkili alfabede bir sembolün bilgi ağırlığı, minimum bilgi birimi olarak alınır ve 1 bit olarak adlandırılır. Bilgi biriminin adının “bit”in İngilizce “ikili rakam” ifadesinden geldiğini lütfen unutmayın.

1.4.2. Rastgele bir alfabedeki bir karakterin bilgi ağırlığı

Daha önce herhangi bir doğal veya resmi dilin alfabesinin ikili bir alfabeyle değiştirilebileceğini öğrendik. Bu durumda, orijinal alfabe N'nin gücü, orijinal alfabenin tüm karakterlerini kodlamak için gereken ikili kodun i bit kapasitesiyle ilişkilidir, ilişki: N = 2 i.

Sorun 1. Pulti alfabesi 8 karakterden oluşur. Bu alfabenin bir sembolünün bilgi ağırlığı nedir?

Çözüm. Sorunun koşullarına ilişkin kısa bir açıklama yapalım.

i ve N büyüklükleri arasındaki ilişki bilinmektedir: N = 2 i.

Başlangıç ​​verileri dikkate alındığında: 8 = 2 i. Dolayısıyla: i = 3.

Bir dizüstü bilgisayardaki eksiksiz çözüm şu şekilde görünebilir:

Cevap: 3 bit

1.4.3. Mesajın bilgi hacmi

Doğal veya resmi bir dilin sembolleriyle temsil edilen bir mesajın bilgi hacmi (mesajdaki bilgi miktarı), onu oluşturan sembollerin bilgi ağırlıklarından oluşur.

Sorun 2. 32 karakterlik alfabeyle yazılan mesaj 140 karakterden oluşuyor. Ne kadar bilgi taşıyor?

Çözüm.

Cevap": 700 bit.

Sorun 3. 720 bitlik bir bilgi mesajı 180 karakterden oluşur. Bu mesajın yazıldığı alfabenin gücü nedir?

Çözüm.

Cevap: 16 karakter.

1.4.4. Bilgi birimleri

Günümüzde metin hazırlama çoğunlukla bilgisayar kullanılarak yapılmaktadır. Küçük ve büyük Rus ve Latin harfleri, sayılar, noktalama işaretleri, aritmetik işlem işaretleri, parantez vb. karakterleri içeren bir “bilgisayar alfabesinden” bahsedebiliriz. Bu alfabe 256 karakter içerir. 256 = 2 8 olduğundan bu alfabedeki her karakterin bilgi ağırlığı 8 bittir. Sekiz bit'e eşit bir değere bayt denir. 1 byte, 256 kapasiteli bir alfabe sembolünün bilgi ağırlığıdır.

Sorun 4. 4 KB'lık bir bilgi mesajı 4096 karakterden oluşur. Bu mesajın sembolünün bilgi ağırlığı nedir? Bu mesajın yazıldığı alfabe kaç karakterden oluşuyor? Çözüm.

Cevap: 256 karakter.

En önemli

Alfabetik yaklaşımla, belirli bir mesajın her karakterinin belirli bir bilgi ağırlığına sahip olduğuna, sabit miktarda bilgi taşıdığına inanılır.

1 bit minimum bilgi birimidir.

Alfabe sembolünün bilgi ağırlığı i ile alfabenin gücü N birbiriyle şu ilişkiyle ilişkilidir: N = 2 i . Mesajın bilgi hacmi I, mesajdaki K karakter sayısının alfabenin i karakterinin bilgi ağırlığı ile çarpımına eşittir: I = K i.

1 bayt = 8 bit.

Bayt, kilobayt, megabayt, gigabayt, terabayt bilgi ölçüm birimleridir. Sonraki her birim bir öncekinden 1024 (2 10) kat daha büyüktür.

Sorular ve görevler


Bilgisayar bilimlerinde alfabe, bir bilgi mesajını iletmek için kullanılabilecek bir işaretler sistemidir. Bu tanımın özünü anlamak için bazı ek teorik gerçekleri burada bulabilirsiniz:

  1. Herhangi bir mesaj alfabeden oluşur. Örneğin bu yazı bir mesajdır. Daha sonra Rus alfabesindeki karakterlerden oluşur.
  2. Sembollerle alfabenin en az anlamlı parçacığını anlayabiliriz. Bölünemeyen parçacıklara atom da denir. Rus alfabesindeki karakterler “a”, ardından “b”, “v” vb.'dir.
  3. Teorik olarak alfabenin hiçbir şekilde kodlanmasına gerek yoktur. Örneğin basılı bir kitapta alfabenin karakterleri kendi anlamlarını taşır, yani herhangi bir kodlamaları yoktur.

Ancak pratikte elimizde şu var: Bilgisayar harflerin ne olduğunu anlamıyor. Bu nedenle bir bilgi mesajının iletilebilmesi için öncelikle bilgisayarın anlayabileceği bir dilde kodlanması gerekir. Daha ileri gitmek için ek terimlerin tanıtılması gerekir.

Alfabenin gücü nedir

Bir alfabenin gücüyle, içindeki toplam karakter sayısını kastediyoruz. Alfabenin ne kadar güçlü olduğunu öğrenmek için içindeki karakterleri saymanız yeterlidir. Hadi çözelim. Rus alfabesi için alfabenin gücü 33, yani “ё” kullanmazsanız 32 karakterdir.

Alfabemizdeki tüm karakterlerin eşit olasılıkla ortaya çıktığını varsayalım. Bu varsayım şu şekilde anlaşılabilir: Diyelim ki etiketli küplerden oluşan bir çantamız var. İçindeki küplerin sayısı sonsuzdur ve her biri yalnızca bir sembolle işaretlenmiştir. Daha sonra düzgün bir dağılımla torbadan ne kadar küp çıkarırsak çıkaralım, farklı sembollere sahip küplerin sayısı aynı olacak veya torbadan çıkardığımız küp sayısı arttıkça buna yönelecektir.

Bilgi mesajlarının ağırlığının tahmini

Neredeyse yüz yıl önce Amerikalı mühendis Ralph Hartley, bir mesajdaki bilgi miktarını tahmin etmek için kullanılabilecek bir formül geliştirdi. Formülü eşit olasılıklı olaylar için işe yarar ve şöyle görünür:

ben = log 2 M

"i" mesajdaki bölünemeyen bilgi atomlarının (bit) sayısını, "M" ise alfabenin kuvvetini göstermektedir. Hadi devam edelim. Matematiksel dönüşümleri kullanarak alfabenin gücünün şu şekilde hesaplanabileceğini belirleyebiliriz:

Bu formül genel olarak eşit olasılıklı olayların sayısı “M” ile bilgi miktarı “i” arasındaki ilişkiyi tanımlar.

Güç hesaplanıyor

Büyük olasılıkla, okulunuzun bilgisayar bilimi dersinden, von Neumann mimarisi üzerine kurulu modern bilgi işlem sistemlerinin ikili bilgi kodlama sistemi kullandığını zaten biliyorsunuzdur. Hem programlar hem de veriler bu şekilde kodlanır.

Bir bilgisayar sisteminde metni temsil etmek için sekiz basamaklı tek tip bir kod kullanılır. Bir kod, 0 ve 1 gibi sabit bir öğe kümesi içerdiğinden tekdüze kabul edilir. Böyle bir koddaki değerler, bu öğelerin belirli bir sırasına göre belirtilir. Sekiz bitlik bir kod kullanarak 256 bitlik mesajları kodlayabiliriz çünkü Hartley formülüne göre: M 8 = 2 8 = 256 bit bilgi.

İkili karakter kodlamada bu durum tarihsel olarak gelişmiştir. Ancak teorik olarak verileri temsil etmek için başka alfabeler de kullanabiliriz. Yani, örneğin, dört karakterli bir alfabede, her karakterin ağırlığı bir değil iki bit olacaktır; sekiz karakterli bir alfabede ise 3 bit vb. Bu, yukarıda verilen ikili logaritma kullanılarak hesaplanır ( ben = log 2 M).

256 bit gücüne sahip bir alfabede, bir karakteri belirtmek için sekiz ikili basamak tahsis edildiğinden, ek bir bilgi ölçüsü - bir bayt - getirilmesine karar verildi. Bir bayt bir ASCII karakteri içerir ve sekiz bit içerir.

Bilgi nasıl ölçülür?

Sekiz bitlik kodlama Metin mesajları ASCII karakter tablosunda kullanılan, uyum sağlamanıza olanak tanır temel set Büyük ve küçük harflerle Latin ve Kiril karakterleri, sayılar, noktalama işaretleri ve diğer temel karakterler.

Daha büyük miktarda veriyi ölçmek için bayt ve bit kelimelerine özel önekler kullanılır. Bu tür önekler aşağıdaki tabloda gösterilmektedir:

Fizik eğitimi alan pek çok kişi, bilgi birimlerini (kilo ve mega gibi) belirtmek için klasik önekleri kullanmanın mantıklı olacağını savunacaktır, ancak aslında bu tamamen doğru değildir, çünkü miktarlara yönelik bu tür önekler bir veya bir ile çarpmayı ifade eder. on sayısının bir başka gücü, bilgisayar bilimlerinde ikili ölçüm sisteminin her yerde kullanıldığı durumlarda.

Veri birimlerinin doğru adları

Yanlışlıkları ve rahatsızlıkları ortadan kaldırmak için Mart 1999'da Uluslararası Elektrik Mühendisliği Alanı Komisyonu, elektronik ortamda bilgi miktarını belirlemek için kullanılan birimlere yeni önekler onayladı. bilgisayar Teknolojisi. Bu önekler “mebi”, “kibi”, “gibi”, “tebi”, “exbi”, “peti” idi. Bu birimler henüz kök salmadı, bu nedenle bu standardın tanıtılması ve yaygın kullanıma başlaması büyük olasılıkla zaman alacaktır. Aşağıdaki tabloyu kullanarak klasik ünitelerden yeni onaylanmış ünitelere nasıl geçiş yapacağınızı belirleyebilirsiniz:

K karakter içeren bir metnimiz olduğunu varsayalım. Daha sonra alfabetik yaklaşımı kullanarak içerdiği V bilgisi miktarını hesaplayabiliriz. Alfabenin gücü ile içindeki bir karakterin bilgi ağırlığının çarpımına eşit olacaktır.

Hartley formülünü kullanarak bilgi miktarını ikili logaritma yoluyla nasıl hesaplayacağımızı biliyoruz. Bilgi mesajı kaydındaki alfabe karakterlerinin sayısının N ve karakter sayısının K olduğunu varsayarak mesajın bilgi hacmini hesaplamak için aşağıdaki formülü elde ederiz:

V = K ⋅ log 2 N

Alfabetik yaklaşım, bilgi hacminin yalnızca alfabenin gücüne ve mesajların boyutuna (yani içindeki karakter sayısına) bağlı olacağını, ancak bir kişinin anlamsal içeriğiyle hiçbir şekilde ilişkili olmayacağını belirtir. .

Güç hesaplama örnekleri

Bilgisayar bilimleri derslerinde sıklıkla alfabenin gücünü, bir mesajın uzunluğunu veya bilgi hacmini bulmaya yönelik problemler verilir. İşte böyle bir görev:

"Metin dosyası 11 KB disk alanı kaplıyor ve 11264 karakter içeriyor. Bu metin dosyasının alfabe kapasitesini belirleyin."

Çözümün ne olacağı aşağıdaki resimde görülebilir.

Böylece 256 karakter kapasiteli bir alfabe, bilgisayar biliminde bir bayt olarak adlandırılan yalnızca 8 bitlik bilgi taşır. Bir bayt, ASCII tablosunun 1 karakterini tanımlar ve eğer düşünürseniz, bu hiç de fazla değildir.

Bir bayt çok mu yoksa az mı?

Google ve Facebook veri merkezleri gibi modern veri ambarları, onlarca petabayttan az olmayan bilgi içerir. Ancak kesin veri miktarını hesaplamak onlar için bile zor olacaktır çünkü o zaman sunuculardaki tüm süreçlerin durdurulması ve kullanıcıların kişisel bilgilerini kaydetme ve düzenleme erişiminin engellenmesi gerekecektir.

Ancak bu kadar inanılmaz miktarda veriyi hayal etmek için her şeyin küçük ayrıntılardan oluştuğunu açıkça anlamanız gerekir. Alfabenin gücünün ne olduğunu (256) ve 1 byte bilginin kaç bit içerdiğini (hatırladığınız gibi 8) anlamak gerekir.




Tepe