Одиниці вимірювання ємності носіїв та обсягу інформації

Одиниці вимірювання інформаціїслужать для вимірювання різних характеристик, пов'язаних з інформацією.

Найчастіше вимір інформації стосується вимірювання ємності комп'ютерної пам'яті (пристрій, що запам'ятовують) і вимірювання кількості даних, що передаються по цифрових каналах зв'язку. Рідше вимірюється кількість інформації.

Зміст

Великий обсяг даних може містити в собі дуже мала кількість інформації. Тобтообсяг данихікількість інформаціїє різними характеристиками, що застосовуються в різних областях, пов'язаних з інформацією, але історично назву "кількість інформації" використовували у значенні "обсяг даних", а для вимірювання кількості інформації застосовували назви "інформаційна ентропія" та "цінність інформації".

Одиниці вимірювання ємності носіїв та обсягу даних

Застосовуються для вимірюванняємності носіївінформації - пристроїв, що запам'ятовують, і для вимірюванняоб'ємів даних.

Одиниці виміру кількості інформації

Застосовуються для вимірюваннякількості інформаціївобсязі даних. Інформаційна ентропія

Первинною характеристикою обсягу даних є кількість можливих станів.

Первинною одиницею вимірюванняобсягу данихє1 можливий стан(значення, код).

Вторинною характеристикоюобсягу данихєрозряд.

Місткість (обсяг) одного розряду може бути різною і залежить від основи застосованої системи кодування.

Ємності одного розряду в двійковій, трійковій та десятковій системах кодування:

Один двійковий розряд (біт) має 2 взаємовиключніможливі стани(значення, коду).

Один трійковий розряд (трит) має 3 взаємовиключніможливі стани(значення, коду).

Один десятковий розряд (децит) має 10 взаємовиключних можливих станів (значень, кодів).

Третичними характеристиками обсягу даних є різні безлічі розрядів.

Місткістьмножини розрядівдорівнюєкількості можливих станівцієїмножини розрядів, яка визначається в комбінаториці, дорівнює кількості розміщень з повтореннями і обчислюється за формулою:

Тобто ємністьмножини розрядівявляє собою показову функцію від кількостірозрядівз основою, що дорівнюєкількості можливих станіводногорозряду.

Коли деякі величини, зокрема обсяг даних, є показові функції, то, у часто, зручніше користуватися не самими величинами, а логарифмами цих величин.

Обсяг даних також можна представляти логарифмічно, як логарифмкількості можливих станів[1] .

Обсяг інформації (обсяг даних) – може вимірюватися логарифмічно. [2] Це означає, що коли кілька об'єктів розглядаються як один, кількість можливих станів перемножується, а кількість інформації — складається. Не важливо, йдеться про випадкові величини в математиці, регістри цифрової пам'яті в техніці або в квантових системах у фізиці.

Для обсягів двійкових даних зручніше користуватися логарифмами.

Найменше ціле число, двійковий логарифм якого позитивне — це 2. Відповідна йому одиниця — біт — є основою обчислення інформації в цифровій техніці.

Для обсягів трійкових даних зручніше користуватися трійковими логарифмами.

Одиниця, що відповідає числу 3, трит дорівнює log23-1,585 біта.

Така одиниця як нат(nat), що відповідає натуральному логарифму застосовується в інженерних та наукових розрахунках. У обчислювальної техніки вона практично не застосовується, тому що основа натуральних логарифмів не є цілим числом.

Для обсягів десяткових даних зручніше користуватися десятковими логарифмами.

Одиниця, що відповідає числу 10,децитдорівнює log210-3.322 біта.

У цілихкількостях двійкових розрядів(бітів)кількість можливих станівдорівнює ступеням двійки.

Зошита, напівбайт, ніббл

Особливу назву мають чотири двійкові розряди (4 біти) — зошити, напівбайт, нібл, які вміщують кількість інформації, що міститься в одній шістнадцятковій цифрі.

Вимірювання в байтахГОСТ 8.417-2002 Приставки СІ Приставки ПЕКНазва Позначення Ступінь Назва Ступінь Назва Символ Ступінь

байт	Б	10 0	-	10 0	байт	B	Б	2 0
кілобайт	кбайт	10 3	кіло-	10 3	кібібайт	KiB	КіБ	2 10
мегабайт	Мбайт	10 6	мега-	10 6	мебібайт	MiB	МіБ	2 20
гігабайт	Гбайт	10 9	гіга-	10 9	гібібайт	GiB	ГіБ	2 30
терабайт	Тбайт	10 12	тера-	10 12	тебібайт	TiB	Тіб	2 40
петабайт	Пбайт	10 15	пета-	10 15	пебібайт	PiB	ПіБ	2 50
ексабайт	Ебайт	10 18	екса-	10 18	ексбібайт	EiB	ЕіБ	2 60
зеттабайт	Збайт	10 21	зетта-	10 21	зебібайт	ZiB	ЗіБ	2 70
іоттабайт	Ібайт	10 24	іотта-	10 24	йобібайт	YiB	ЙіБ	2 80

Наступною по порядку популярною одиницею інформації є 8 біт, абобайт(про термінологічні тонкощі написано нижче). Саме до байта (а не до біта) безпосередньо наводяться все більші обсяги інформації, що обчислюються в комп'ютерних технологіях.

Такі величини як машинне слово і т. п., що становлять кілька байт, як одиниці виміру майже ніколи не використовуються.

Для вимірювання великих ємностей запам'ятовуючих пристроїв і великих об'ємів інформації, що мають велику кількість байтів, служать одиниці «кілобайт» = [1000] байт та «Кбайт» [3] (кібібайт, kibibyte) = 1024 байт (про плутанину десяткових та двійкових одиниць та термінів див. нижче). Такий порядок величин мають, наприклад:

Сектор диска зазвичай дорівнює 512 байтам тобто половині Кбайта, хоча для деяких пристроїв може дорівнювати одному або двом кібібайт.
Класичний розмір блоку у файлових системах UNIX дорівнює одному Кбайт (1024 байт).
"Сторінка пам'яті" в процесорах x86 (починаючи з моделі Intel 80386) має розмір 4096 байт, тобто 4 Кбайт.

Обсяг інформації, що отримується при зчитуванні дискети «3,5» високої щільності» дорівнює 1440 Кбайт (рівно); інші формати також обчислюються цілим числом Кбайт.

Одиниці "мегабайт" = 1000 кілобайт = [1 000 000]байт і «мебібайт» [3] (mebibyte) = 1024 Кбайт = 1048576 байт застосовуються для вимірювання обсягів носіїв інформації.

Оперативну пам'ять і ємність CD-ROM міряють двійковими одиницями (мебібайтами, хоча їх зазвичай не називають), але обсягу НЖМД десяткові мегабайти були популярнішими.

Сучасні жорсткі диски мають об'єми, що виражаються в цих одиницях щонайменше шестизначними числами, тому для них застосовуються гігабайти.

Одиниці «гігабайт» = 1000 мегабайт = [1 000 000] кілобайт = [1 000 000 000] байт і «Гбайт» [3] (гибибайт, gibibyte) = 1024 Мбайт = 1024 Мбайт = 2 носіїв інформації, наприклад, жорстких дисків. Різниця між двійковою та десятковою одиницями вже перевищує 7 %.

Для обчислення ще більших обсягів інформації є одиницітерабайтітебібайт(10 12 і 2 40 байт відповідно),петабайттапебібайт(10 15 і 250 байт відповідно) і т. д.

У таких позначеннях якбайт(українське) абоB(англійське) під байтом (B) мається на увазі саме 8 біт, хоча сам термін «байт» не цілком коректний з погляду теорії.

У французькій мові використовуються позначенняo,Ko,Moі т. д. (від слова octet) щоб підкреслити, що йдеться саме про 8 біт.

Довгий час різниці між множниками 1000 і 1024 р. намагалися не надавати великого значення. Щоб уникнути непорозумінь слід чітко розуміти різницю між:

двійковими кратними одиницями, що позначаються згідно з ГОСТ 8.417-2002 як "Кбайт", "Мбайт", "Гбайт" і т. д. (два в ступенях кратних десяти);
одиницямикілобайт,мегабайт,гігабайті т. д., які розуміються як наукові терміни (десять у ступенях, кратних трьом),

ці одиниціза визначеннямрівні, відповідно, 10 3 , 10 6 , 10 9 байтам і т. д.

Як терміни для "Кбайт", "Мбайт", "Гбайт" і т. д. МЕК пропонує "кібібайт", "мебібайт", "гібібайт" і т. д., проте ці терміни критикуються за невимовність і не зустрічаються в усній промови.

У різних галузях інформатики переваги у вживанні десяткових і двійкових одиниць теж різні. Причому, хоча з часу стандартизації термінології та позначень пройшло вже кілька років, далеко не скрізь прагнуть прояснити точне значення одиниць, що використовуються.