قدرت اطلاعات الفبا چقدر است. حجم اطلاعات متن و واحدهای اندازه گیری اطلاعات. روش های اندازه گیری اطلاعات به صورت الکترونیکی

حل مشکل

هنگام ذخیره و انتقال اطلاعات با استفاده از دستگاه های فنیاطلاعات باید به عنوان دنباله ای از نمادها - علائم (حروف، اعداد، کدهای رنگ نقاط تصویر و غیره) در نظر گرفته شود.

مجموعه ای از نمادهای یک سیستم نشانه (الفبا) را می توان به عنوان حالت های ممکن (رویدادها) در نظر گرفت.
سپس، اگر فرض کنیم که ظهور نمادها در یک پیام به یک اندازه محتمل است، تعداد رویدادهای ممکن نرا می توان به صورت محاسبه کرد N=2 i
مقدار اطلاعات در یک پیام منرا می توان با ضرب تعداد کاراکترها محاسبه کرد کبه ازای وزن اطلاعات یک کاراکتر من
بنابراین، ما فرمول های مورد نیاز برای تعیین مقدار اطلاعات در رویکرد حروف الفبا را داریم:

ترکیبات زیر از کمیت های شناخته شده (داده شده) و جستجو شده (یافتن) امکان پذیر است:

تایپ کنیدداده شدهپیدا کردنفرمول
1 من ن N=2 i
2 ن من
3 من، ک من I=K*i
4 من، من ک
5 من، ک من
6 ن، ک من هر دو فرمول
7 ن، من ک
8 من، ک ن

اگر وظایف مربوط به نسبت کمیت های نوشته شده در واحدهای اندازه گیری مختلف را به این مسائل اضافه کنیم، با استفاده از نمایش کمیت ها به صورت توان های دو، 9 نوع مسئله به دست می آید.
بیایید انواع وظایف را در نظر بگیریم. بیایید توافق کنیم که هنگام انتقال از یک واحد اندازه‌گیری اطلاعات به واحد دیگر، زنجیره‌ای از مقادیر را بسازیم. سپس احتمال خطای محاسباتی کاهش می یابد.

مشکل 1. پیامی با حجم اطلاعات 32 بیت دریافت شده است. این حجم چند بایت است؟

راه حل: 8 بیت در یک بایت وجود دارد. 32:8=4
پاسخ: 4 بایت.

مشکل 2. حجم پیام اطلاعاتی 12582912 بیت است که بر حسب کیلوبایت و مگابایت بیان می شود.

راه حل: از آنجایی که 1Kbyte=1024 bytes=1024*8 بیت، پس 12582912:(1024*8)=1536 کیلوبایت و
از آنجایی که 1 مگابایت = 1024 کیلوبایت، سپس 1536: 1024 = 1.5 مگابایت
پاسخ: 1536 کیلوبایت و 1.5 مگابایت.

وظیفه 3.کامپیوتر دارد رم 512 مگابایت تعداد بیت های مربوط به این مقدار بیشتر است:

1) 10,000,000,000 بیت 2) 8,000,000,000 بیت 3) 6,000,000,000 بیت 4) 4,000,000,000 بیت راه حل: 512*1024*1024*49 bits=1024*49 bits.
پاسخ: 4.

وظیفه 4.تعداد بیت ها را در دو مگابایت با استفاده از توان های 2 برای اعداد تعیین کنید.
راه حل: از آنجایی که 1 بایت = 8 بیت = 2 3 بیت و 1 مگابایت = 2 10 کیلوبایت = 2 20 بایت = 2 23 بیت. بنابراین، 2 مگابایت = 2 24 بیت.
پاسخ: 2 24 بیت.

وظیفه 5.یک پیام ۲۲۳ بیتی چند مگابایت اطلاعات دارد؟
راه حل: از آنجایی که 1 بایت = 8 بیت = 2 3 بیت، پس
2 23 بیت = 2 23 * 2 23 * 2 3 بیت = 2 10 2 10 بایت = 2 10 کیلوبایت = 1 مگابایت.
پاسخ: 1 مگابایت

وظیفه 6.یک کاراکتر از حروف الفبا 4 بیت "وزن" دارد. چند کاراکتر در این الفبا وجود دارد؟
راه حل:
داده شده:


جواب: 16

وظیفه 7.هر کاراکتر حروف الفبا با استفاده از 8 رقم کد باینری نوشته می شود. چند کاراکتر در این الفبا وجود دارد؟
راه حل:
داده شده:


جواب: 256

وظیفه 8.الفبای روسی گاهی 32 حرف تخمین زده می شود. وزن اطلاعات یک حرف از چنین الفبای اختصاری روسی چقدر است؟
راه حل:
داده شده:


پاسخ: 5

وظیفه 9.حروف الفبا از 100 کاراکتر تشکیل شده است. یک کاراکتر این الفبا چقدر اطلاعات دارد؟
راه حل:
داده شده:


پاسخ: 5

مسئله 10.قبیله چیچووک دارای 24 حرف و 8 عدد در الفبای خود است. هیچ علامت نگارشی و یا علامت حسابی وجود ندارد. حداقل تعداد ارقام باینری که برای رمزگذاری همه کاراکترها نیاز دارند چقدر است؟ لطفا توجه داشته باشید که کلمات باید از یکدیگر جدا شوند!
راه حل:
داده شده:


پاسخ: 5

مسئله 11.این کتاب که با استفاده از کامپیوتر تایپ شده است شامل 150 صفحه است. هر صفحه 40 خط و هر خط 60 کاراکتر دارد. اطلاعات کتاب چقدر است؟ پاسخ خود را به کیلوبایت و مگابایت بدهید
راه حل:
داده شده:


پاسخ: 351 کیلوبایت یا 0.4 مگابایت

مسئله 12.حجم اطلاعات متن کتاب که با استفاده از رمزگذاری یونیکد روی کامپیوتر تایپ شده است 128 کیلوبایت است. تعداد شخصیت های متن کتاب را مشخص کنید.
راه حل:
داده شده:


پاسخ: 65536

مسئله 13.یک پیام اطلاعاتی 1.5 کیلوبایتی حاوی 3072 کاراکتر است. وزن اطلاعات یک کاراکتر از الفبای مورد استفاده را تعیین کنید
راه حل:
داده شده:


پاسخ: 4

مسئله 14.این پیام که با حروف الفبای 64 کاراکتری نوشته شده است، شامل 20 کاراکتر است. چقدر اطلاعات حمل می کند؟
راه حل:
داده شده:


جواب : 120 بیت

مسئله 15.یک پیام نوشته شده با الفبای 16 کاراکتری در صورتی که اندازه آن 1/16 مگابایت باشد چند کاراکتر دارد؟
راه حل:
داده شده:


جواب: 131072

مسئله 16.اندازه پیام حاوی 2048 کاراکتر، 1/512 مگابایت بود. اندازه الفبای که پیام در آن نوشته شده است چقدر است؟
راه حل:
داده شده:


جواب: 256

وظایف برای راه حل مستقل:

  1. هر کاراکتر حروف الفبا با استفاده از 4 رقم کد باینری نوشته می شود. چند کاراکتر در این الفبا وجود دارد؟
  2. الفبای نوشتن پیام از 32 کاراکتر تشکیل شده است، وزن اطلاعات یک کاراکتر چقدر است؟ فراموش نکنید که واحد اندازه گیری را مشخص کنید.
  3. حجم اطلاعات متن تایپ شده در رایانه با استفاده از رمزگذاری یونیکد (هر کاراکتر با 16 بیت کدگذاری می شود) 4 کیلوبایت است. تعداد کاراکترهای متن را تعیین کنید.
  4. حجم پیام اطلاعاتی 8192 بیت است. آن را به کیلوبایت بیان کنید.
  5. یک پیام 4 مگابایتی حاوی چند بیت اطلاعات است؟ جواب را با توان 2 بدهید.
  6. پیامی که با حروف الفبای 256 کاراکتری نوشته شده است شامل 256 کاراکتر است. چه مقدار اطلاعات را بر حسب کیلوبایت حمل می کند؟
  7. چند تا متفاوت وجود دارد؟ سیگنال های صوتی، متشکل از دنباله ای از تماس های کوتاه و بلند. طول هر سیگنال 6 تماس است.
  8. ایستگاه هواشناسی رطوبت هوا را کنترل می کند. نتیجه یک اندازه گیری یک عدد صحیح از 20 تا 100٪ است که با استفاده از کمترین تعداد بیت ممکن نوشته می شود. ایستگاه 80 اندازه گیری انجام داد. حجم اطلاعات را در نتیجه مشاهدات تعیین کنید.
  9. سرعت انتقال اطلاعات از طریق اتصال ADSL 512000 bps است. از طریق این ارتباطفایلی با حجم 1500 کیلوبایت را انتقال دهید. زمان انتقال فایل را بر حسب ثانیه تعیین کنید.
  10. سرعت مودم را در صورتی که بتواند تصویر شطرنجی 640x480 پیکسل را در 256 ثانیه ارسال کند، تعیین کنید. برای هر پیکسل 3 بایت وجود دارد. اگر 16 میلیون رنگ در پالت وجود داشته باشد چه؟
مبحث تعیین میزان اطلاعات بر اساس رویکرد حروف الفبا در وظایف A1، A2، A3، A13، B5 از مواد آزمون یکپارچه آزمون دولتی استفاده می شود.

روش های مختلفی برای اندازه گیری مقدار اطلاعات وجود دارد. یکی از آنها نام دارد حروف الفبا.

رویکرد حروف الفبابه شما امکان می دهد مقدار اطلاعات موجود در یک متن (پیام نمادین) متشکل از کاراکترهای یک الفبای خاص را اندازه گیری کنید.

الفبامجموعه ای از حروف، علائم، اعداد، براکت ها و غیره است.
به تعداد حروف الفبا آن می گویند قدرت.

با رویکرد حروف الفبا، اعتقاد بر این است که هر کاراکتر متن دارای ویژگی خاصی است وزن اطلاعات. وزن اطلاعات یک نماد به قدرت الفبا بستگی دارد.

حداقل قدرت حروف الفبا که می توان از آن برای ثبت (رمزگذاری) اطلاعات استفاده کرد چقدر است؟



بیایید ترکیبی از 2، 3 و غیره را صدا کنیم. بیت کد باینری.

چند کاراکتر را می توان با دو بیت کدگذاری کرد؟

شماره دنباله نماد

1

2

3

4

کد باینری دو رقمی

00

01

10

11

4 کاراکتر 2 بیت.

چند کاراکتر را می توان با سه بیت رمزگذاری کرد؟

شماره دنباله نماد

1

2

3

4

5

6

7

8

کد باینری سه رقمی

000

001

010

011

100

101

110

111


از آن نتیجه می شود که در الفبا با کاردینالیته 8 کاراکتروزن اطلاعات هر کاراکتر - 3 بیت.

می توانیم نتیجه بگیریم که در الفبا با ظرفیت 16 کاراکتروزن اطلاعات هر کاراکتر خواهد بود 4 بیت.

اجازه دهید قدرت الفبا را با حرف نشان دهیم ن، و وزن اطلاعات نماد حرف است ب.

رابطه بین قدرت الفبا نو وزن اطلاعات نماد ب.

ن

2

4

8

16

ب

1 بیت

اندازه گیری اطلاعات

رویکرد الفبایی برای اندازه گیری اطلاعات.

همین پیام می تواند اطلاعات زیادی را برای یک نفر داشته باشد و برای شخص دیگری اصلاً آن را حمل نکند. با این رویکرد، تعیین مقدار اطلاعات به طور واضح دشوار است.

رویکرد الفبایی به ما امکان می دهد تا حجم اطلاعات یک پیام ارائه شده به زبانی (طبیعی یا رسمی) را بدون توجه به محتوای آن اندازه گیری کنیم.

برای بیان کمی هر کمیت، اول از همه، یک واحد اندازه گیری لازم است. اندازه گیری با مقایسه مقدار اندازه گیری شده با واحد اندازه گیری انجام می شود. تعداد دفعاتی که یک واحد اندازه گیری در مقدار اندازه گیری شده «مطابق» می شود، نتیجه اندازه گیری است.

در رویکرد حروف الفبا، اعتقاد بر این است که هر یک از کاراکترهای یک پیام خاص، ویژگی خاصی دارد وزن اطلاعات- ثابت حمل می کند مقدار اطلاعات. همه حروف الفبای یکسان بسته به قدرت الفبا وزن یکسانی دارند. وزن اطلاعات یک نماد از الفبای دوتایی به عنوان حداقل واحد اطلاعات در نظر گرفته شده و نامیده می شود 1 بیت.

لطفا توجه داشته باشید که نام واحد اطلاعات "بیت" از عبارت انگلیسی باینری رقم - "رقم باینری" گرفته شده است.

1 بیت به عنوان حداقل واحد اطلاعات در نظر گرفته می شود. اعتقاد بر این است که این وزن اطلاعات نماد الفبای دوتایی است.

1.6.2. وزن اطلاعات یک کاراکتر الفبای دلخواه

قبلاً متوجه شدیم که الفبای هر زبان طبیعی یا رسمی را می توان با الفبای دوتایی جایگزین کرد. در این حالت، قدرت الفبای اصلی N مربوط به ظرفیت بیت کد باینری i است که برای رمزگذاری تمام کاراکترهای الفبای اصلی لازم است، رابطه: N = 2 i.

وزن اطلاعات علامت الفبای i و قدرت الفبای N با رابطه: N = 2 i به یکدیگر مرتبط هستند.

وظیفه 1.الفبای پولتی شامل 8 کاراکتر است. وزن اطلاعات نماد این الفبا چقدر است؟

راه حل.بیایید یک بیان مختصر از شرایط مشکل بیان کنیم.

رابطه بین کمیت های i و N مشخص است: N = 2 i.

با در نظر گرفتن داده های اولیه: 8 = 2 i. از این رو: i = 3.

راه حل کامل در یک نوت بوک ممکن است به شکل زیر باشد:

جواب: 3 بیت.

1.6.3. حجم اطلاعات پیام

حجم اطلاعاتپیام (مقدار اطلاعات در یک پیام)، که با نمادهای یک زبان طبیعی یا رسمی نشان داده می شود، از وزن اطلاعات نمادهای تشکیل دهنده آن تشکیل شده است.

حجم اطلاعات پیام I برابر است با حاصل ضرب تعداد کاراکترهای پیام K و وزن اطلاعات حروف الفبا i: I = K * i.

مشکل 2. این پیام که با الفبای 32 کاراکتری نوشته شده است شامل 140 کاراکتر است. چقدر اطلاعات حمل می کند؟

وظیفه 3.یک پیام اطلاعاتی با حجم 720 بیت از 180 کاراکتر تشکیل شده است. قدرت الفبای که این پیام در آن نوشته شده است چیست؟

1.6.4. واحدهای اطلاعات

امروزه تهیه متن عمدتاً با استفاده از رایانه انجام می شود. ما می توانیم در مورد "الفبای کامپیوتر" صحبت کنیم، که شامل کاراکترهای زیر است: روسی کوچک و بزرگ و نامه ها، اعداد، علائم نگارشی، نمادهای حسابی، کروشه و ... این الفبا شامل 256 کاراکتر می باشد. از آنجایی که 256 = 28، وزن اطلاعات هر کاراکتر در این الفبا 8 بیت است. مقداری معادل هشت بیت را بایت می گویند. 1 بایت وزن اطلاعات یک علامت الفبا با ظرفیت 256 است.

1 بایت = 8 بیت

بیت و بایت واحدهای اندازه گیری "کوچک" هستند. در عمل از واحدهای بزرگتر برای اندازه گیری حجم اطلاعات استفاده می شود:

1 کیلوبایت = 1 کیلوبایت = 1024 بایت = 210 بایت

1 مگابایت = 1 مگابایت = 1024 کیلوبایت = 210 کیلوبایت = 220 بایت

1 گیگابایت = 1 گیگابایت = 1024 مگابایت = 210 مگابایت = 220 کیلوبایت = 230 بایت

1 ترابایت = 1 ترابایت = 1024 گیگابایت = 210 گیگابایت = 220 مگابایت = 230 کیلوبایت = 240 بایت

وظیفه 4.یک پیام اطلاعاتی 4 کیلوبایتی شامل 4096 کاراکتر است. وزن اطلاعات علامت الفبای مورد استفاده چقدر است؟ الفبای نوشته شده این پیام حاوی چند کاراکتر است؟

مشکل 5. 128 ورزشکار در سیکلکراس شرکت می کنند. یک دستگاه ویژه، عبور هر شرکت‌کننده از پایان میانی را ثبت می‌کند و تعداد آن را در زنجیره‌ای از صفرها و یک‌ها با حداقل طول، برای هر ورزشکار یکسان، ثبت می‌کند. حجم اطلاعات پیام ضبط شده توسط دستگاه پس از اتمام پایان میانی توسط 80 دوچرخه سوار چقدر خواهد بود؟

راه حل. اعداد 128 شرکت‌کننده با استفاده از الفبای دودویی کدگذاری شده‌اند. عمق بیت مورد نیاز کد باینری (طول زنجیره) 7 است، زیرا 128 = 27. به عبارت دیگر، پیام ضبط شده توسط دستگاه مبنی بر اینکه یک دوچرخه سوار از پایان میانی عبور کرده است، 7 بیت اطلاعات را حمل می کند. هنگامی که 80 ورزشکار پایان میانی را کامل می کنند، دستگاه 80 7 = 560 بیت یا 70 بایت اطلاعات را ضبط می کند.

به یاد داشته باشیم که از دیدگاه یک رویکرد ذهنی در تعریف اطلاعات، اطلاعات محتوای پیام هایی است که شخص از منابع مختلف دریافت می کند. همین پیام می تواند اطلاعات زیادی را برای یک نفر داشته باشد و برای شخص دیگری اصلاً آن را حمل نکند. با این رویکرد، تعیین مقدار اطلاعات به طور واضح دشوار است.

رویکرد الفبایی به ما امکان می دهد تا حجم اطلاعات یک پیام ارائه شده به زبانی (طبیعی یا رسمی) را بدون توجه به محتوای آن اندازه گیری کنیم.

برای بیان کمی هر کمیت، اول از همه، یک واحد اندازه گیری لازم است. اندازه گیری با مقایسه مقدار اندازه گیری شده با واحد اندازه گیری انجام می شود. تعداد دفعاتی که یک واحد اندازه گیری در مقدار اندازه گیری شده «مطابق» می شود، نتیجه اندازه گیری است.

با رویکرد حروف الفبا، اعتقاد بر این است که هر کاراکتر یک پیام دارای وزن اطلاعاتی خاصی است - مقدار ثابتی از اطلاعات را حمل می کند. همه حروف الفبای یکسان بسته به قدرت الفبا وزن یکسانی دارند. وزن اطلاعات یک نماد از الفبای دودویی به عنوان حداقل واحد اطلاعات در نظر گرفته می شود و 1 بیت نامیده می شود. لطفا توجه داشته باشید که نام واحد اطلاعات "بیت" از عبارت انگلیسی "رقم دودویی" گرفته شده است.

1.4.2. وزن اطلاعات یک کاراکتر الفبای دلخواه

قبلاً متوجه شدیم که الفبای هر زبان طبیعی یا رسمی را می توان با الفبای دوتایی جایگزین کرد. در این حالت، قدرت الفبای اصلی N مربوط به ظرفیت بیت کد باینری i است که برای رمزگذاری تمام کاراکترهای الفبای اصلی لازم است، رابطه: N = 2 i.

مشکل 1. الفبای پولتی شامل 8 کاراکتر است. وزن اطلاعات نماد این الفبا چقدر است؟

راه حل. بیایید یک بیان مختصر از شرایط مشکل بیان کنیم.

رابطه بین کمیت های i و N مشخص است: N = 2 i.

با در نظر گرفتن داده های اولیه: 8 = 2 i. از این رو: i = 3.

راه حل کامل در یک نوت بوک ممکن است به شکل زیر باشد:

جواب: 3 بیت

1.4.3. حجم اطلاعات پیام

حجم اطلاعات یک پیام (مقدار اطلاعات در یک پیام)، که با نمادهای یک زبان طبیعی یا رسمی نشان داده می شود، از وزن اطلاعات نمادهای تشکیل دهنده آن تشکیل شده است.

مشکل 2. این پیام که با الفبای 32 کاراکتری نوشته شده است شامل 140 کاراکتر است. چقدر اطلاعات حمل می کند؟

راه حل.

جواب: 700 بیت.

مشکل 3. یک پیام اطلاعاتی با حجم 720 بیت از 180 کاراکتر تشکیل شده است. قدرت الفبای که این پیام در آن نوشته شده است چیست؟

راه حل.

پاسخ: 16 کاراکتر.

1.4.4. واحدهای اطلاعات

امروزه تهیه متن عمدتاً با استفاده از رایانه انجام می شود. ما می توانیم در مورد "الفبای کامپیوتر" صحبت کنیم که شامل کاراکترهای زیر است: حروف کوچک و بزرگ روسی و لاتین، اعداد، علائم نقطه گذاری، علائم عملیات حسابی، پرانتز، و غیره. این الفبا شامل 256 کاراکتر است. از آنجایی که 256 = 2 8 وزن اطلاعات هر کاراکتر در این الفبا 8 بیت است. مقداری معادل هشت بیت را بایت می گویند. 1 بایت وزن اطلاعات یک علامت الفبا با ظرفیت 256 است.

مشکل 4. یک پیام اطلاعاتی 4 کیلوبایتی شامل 4096 کاراکتر است. وزن اطلاعاتی نماد این پیام چقدر است؟ الفبای نوشته شده این پیام حاوی چند کاراکتر است؟ راه حل.

پاسخ: 256 کاراکتر.

مهم ترین

با رویکرد حروف الفبا، اعتقاد بر این است که هر کاراکتر یک پیام خاص وزن اطلاعاتی خاصی دارد - مقدار ثابتی از اطلاعات را حمل می کند.

1 بیت حداقل واحد اطلاعات است.

وزن اطلاعات i نماد الفبا و توان N حروف الفبا با رابطه: N = 2 i . حجم اطلاعات I پیام برابر است با حاصل ضرب عدد K کاراکتر پیام با وزن اطلاعات کاراکتر i الفبا: I = K i.

1 بایت = 8 بیت.

بایت، کیلوبایت، مگابایت، گیگابایت، ترابایت واحدهای اندازه گیری اطلاعات هستند. هر واحد بعدی 1024 (2 10) برابر بزرگتر از واحد قبلی است.

سوالات و وظایف


در علم کامپیوتر، الفبای سیستمی از علائم است که می تواند برای انتقال یک پیام اطلاعاتی استفاده شود. برای درک ماهیت این تعریف، در اینجا چند واقعیت نظری اضافی وجود دارد:

  1. هر پیامی از الفبا تشکیل شده است. به عنوان مثال، این مقاله یک پیام است. سپس از حروف الفبای روسی تشکیل شده است.
  2. با نماد می توانیم ذره کم اهمیت الفبا را درک کنیم. ذرات غیر قابل تقسیم را اتم نیز می نامند. حروف الفبای روسی "a"، سپس "b"، "v" و غیره هستند.
  3. در تئوری، الفبا به هیچ وجه نیازی به رمزگذاری ندارد. مثلاً در یک کتاب چاپی، حروف الفبا به معنای خودشان هستند، یعنی هیچ کدگذاری ندارند.

اما در عمل ما موارد زیر را داریم: رایانه نمی فهمد حروف چیست. بنابراین، برای انتقال یک پیام اطلاعاتی، ابتدا باید به زبانی رمزگذاری شود که کامپیوتر بتواند آن را بفهمد. برای حرکت بیشتر لازم است اصطلاحات تکمیلی معرفی شود.

قدرت الفبا چقدر است

منظور ما از قدرت یک الفبا، تعداد کل کاراکترهای آن است. برای اینکه بفهمید الفبا چقدر قدرتمند است، فقط باید تعداد کاراکترهای آن را بشمارید. بیایید آن را بفهمیم. برای الفبای روسی، قدرت الفبا 33 یا 32 کاراکتر است اگر از "ё" استفاده نکنید.

بیایید فرض کنیم که همه کاراکترهای الفبای ما با احتمال مساوی رخ می دهند. این فرض را می توان به صورت زیر درک کرد: فرض کنید کیسه ای از مکعب های برچسب دار داریم. تعداد مکعب های موجود در آن بی نهایت است و هر کدام تنها با یک علامت امضا شده است. سپس با توزیع یکنواخت، مهم نیست که چند مکعب از کیسه خارج کنیم، تعداد مکعب های با نمادهای مختلف یکسان خواهد بود یا با افزایش تعداد مکعب هایی که از کیسه بیرون می آوریم، به این سمت می روند.

تخمین وزن پیام های اطلاعاتی

تقریبا صد سال پیش، مهندس آمریکایی رالف هارتلی فرمولی را ایجاد کرد که می‌توان از آن برای تخمین مقدار اطلاعات در یک پیام استفاده کرد. فرمول او برای رویدادهای به همان اندازه احتمالی کار می کند و به این صورت است:

i = log 2 M

در جایی که "i" تعداد اتم های اطلاعاتی (بیت) تقسیم ناپذیر در پیام است، "M" قدرت الفبا است. بیایید ادامه دهیم. با استفاده از تبدیل های ریاضی می توان تعیین کرد که قدرت الفبا را می توان به صورت زیر محاسبه کرد:

این فرمول به طور کلی رابطه بین تعداد رویدادهای محتمل "M" و مقدار اطلاعات "i" را تعریف می کند.

محاسبه قدرت

به احتمال زیاد، شما قبلاً از درس علوم کامپیوتر مدرسه خود می‌دانید که سیستم‌های محاسباتی مدرن که بر اساس معماری فون نویمان ساخته شده‌اند، از یک سیستم رمزگذاری اطلاعات باینری استفاده می‌کنند. به این ترتیب هم برنامه ها و هم داده ها کدگذاری می شوند.

برای نمایش متن در یک سیستم محاسباتی، از یک کد یکنواخت هشت رقمی استفاده می شود. یک کد یکنواخت در نظر گرفته می شود زیرا حاوی مجموعه ثابتی از عناصر - 0 و 1 است. مقادیر در چنین کدی با ترتیب خاصی از این عناصر مشخص می شوند. با استفاده از یک کد هشت بیتی، می توانیم پیام هایی با وزن 256 بیت را رمزگذاری کنیم، زیرا طبق فرمول هارتلی: M 8 = 2 8 = 256 بیت اطلاعات.

این وضعیت با رمزگذاری کاراکترهای باینری از نظر تاریخی توسعه یافته است. اما از نظر تئوری می‌توانیم از الفبای دیگری برای نمایش داده‌ها استفاده کنیم. بنابراین، به عنوان مثال، در یک الفبای چهار نویسه، هر کاراکتر دارای وزن نه یک، بلکه دو بیت است، در یک الفبای هشت نویسه - 3 بیت، و غیره. این با استفاده از لگاریتم باینری که در بالا داده شد محاسبه می شود ( i = log 2 M).

از آنجایی که در الفبای با قدرت 256 بیت، هشت رقم باینری برای تعیین یک کاراکتر اختصاص داده شده است، تصمیم گرفته شد که اندازه گیری اضافی اطلاعات - یک بایت را معرفی کنیم. یک بایت شامل یک کاراکتر ASCII و شامل هشت بیت است.

اطلاعات چگونه اندازه گیری می شود

رمزگذاری هشت بیتی پیام های متنی، که در جدول کاراکترهای ASCII استفاده می شود، به شما امکان می دهد تا آن را جابجا کنید مجموعه پایهحروف لاتین و سیریلیک با حروف بزرگ و کوچک، اعداد، علائم نقطه گذاری و سایر کاراکترهای اصلی.

به منظور اندازه گیری مقادیر بیشتر داده، از پیشوندهای خاصی برای کلمات بایت و بیت استفاده می شود. چنین پیشوندهایی در جدول زیر نشان داده شده است:

بسیاری از افرادی که فیزیک خوانده اند استدلال می کنند که منطقی است که از پیشوندهای کلاسیک برای نشان دادن واحدهای اطلاعاتی (مانند کیلو و مگا-) استفاده کنیم، اما در واقع این کاملاً صحیح نیست، زیرا چنین پیشوندهایی برای کمیت ها نشان دهنده ضرب در یک یا یکی دیگر از قدرت های عدد ده، زمانی که در علوم کامپیوتر از سیستم اندازه گیری دودویی در همه جا استفاده می شود.

نام صحیح واحدهای داده

به منظور رفع نادرستی ها و ناراحتی ها، در مارس 1999، کمیسیون بین المللی در زمینه مهندسی برق، پیشوندهای جدیدی را برای واحدهایی تصویب کرد که برای تعیین میزان اطلاعات در الکترونیک استفاده می شود. فناوری رایانه. این پیشوندها «مبی»، «کیبی»، «گیبی»، «تبی»، «اکسبی»، «پتی» بودند. این واحدها هنوز ریشه نگرفته اند، بنابراین به احتمال زیاد معرفی این استاندارد و شروع استفاده گسترده زمان می برد. با استفاده از جدول زیر می‌توانید نحوه انتقال از واحدهای کلاسیک به واحدهای تازه تأیید شده را تعیین کنید:

فرض کنید متنی داریم که حاوی K کاراکتر است. سپس با استفاده از روش حروف الفبا می توان مقدار اطلاعات V را محاسبه کرد. برابر با حاصل ضرب قدرت الفبا و وزن اطلاعات یک کاراکتر در آن خواهد بود.

با استفاده از فرمول هارتلی، می دانیم که چگونه مقدار اطلاعات را از طریق لگاریتم باینری محاسبه کنیم. با فرض اینکه تعداد کاراکترهای الفبای N و تعداد کاراکترهای رکورد پیام اطلاعاتی K باشد، فرمول زیر را برای محاسبه حجم اطلاعات پیام به دست می آوریم:

V = K ⋅ log 2 N

رویکرد الفبایی نشان می دهد که حجم اطلاعات فقط به قدرت الفبا و اندازه پیام ها (یعنی تعداد کاراکترهای موجود در آن) بستگی دارد، اما به هیچ وجه با محتوای معنایی یک شخص مرتبط نخواهد بود. .

مثال های محاسبه توان

در درس های علوم کامپیوتر، اغلب برای یافتن قدرت الفبا، طول پیام یا حجم اطلاعات، مشکلاتی را مطرح می کنند. در اینجا یکی از این وظایف وجود دارد:

"فایل متنی 11 کیلوبایت فضای دیسک را اشغال می کند و شامل 11264 کاراکتر است. ظرفیت الفبای این فایل متنی را تعیین کنید."

راه حل چه خواهد بود را می توانید در تصویر زیر مشاهده کنید.

بنابراین الفبای با ظرفیت 256 کاراکتر تنها 8 بیت اطلاعات را حمل می کند که در علوم کامپیوتر به آن یک بایت می گویند. یک بایت 1 کاراکتر از جدول ASCII را توصیف می کند، که اگر به آن فکر کنید، اصلاً زیاد نیست.

یک بایت زیاد است یا کم؟

انبارهای داده مدرن مانند مراکز داده گوگل و فیس بوک حاوی ده ها پتابایت اطلاعات نیستند. با این حال، محاسبه مقدار دقیق داده‌ها حتی برای آنها نیز دشوار خواهد بود، زیرا در این صورت لازم است تمام فرآیندهای روی سرورها متوقف شود و دسترسی کاربران به ضبط و ویرایش اطلاعات شخصی خود ممنوع شود.

اما برای تصور چنین حجم باورنکردنی از داده ها، باید به وضوح درک کنید که همه چیز از جزئیات کوچک تشکیل شده است. لازم است بدانیم که قدرت الفبا (256) چیست و 1 بایت اطلاعات حاوی چند بیت است (همانطور که به یاد دارید، 8).




بالا