Одиниці вимірювання ємності носіїв та обсягу інформації
Одиниці вимірювання інформаціїслужать для вимірювання різних характеристик, пов'язаних з інформацією.
Найчастіше вимір інформації стосується вимірювання ємності комп'ютерної пам'яті (пристрій, що запам'ятовують) і вимірювання кількості даних, що передаються по цифрових каналах зв'язку. Рідше вимірюється кількість інформації.
Зміст
Великий обсяг даних може містити в собі дуже мала кількість інформації. Тобтообсяг данихікількість інформаціїє різними характеристиками, що застосовуються в різних областях, пов'язаних з інформацією, але історично назву "кількість інформації" використовували у значенні "обсяг даних", а для вимірювання кількості інформації застосовували назви "інформаційна ентропія" та "цінність інформації".
Одиниці вимірювання ємності носіїв та обсягу даних
Застосовуються для вимірюванняємності носіївінформації - пристроїв, що запам'ятовують, і для вимірюванняоб'ємів даних.
Одиниці виміру кількості інформації
Застосовуються для вимірюваннякількості інформаціївобсязі даних. Інформаційна ентропія
Первинною характеристикою обсягу даних є кількість можливих станів.
Первинною одиницею вимірюванняобсягу данихє1 можливий стан(значення, код).
Вторинною характеристикоюобсягу данихєрозряд.
Місткість (обсяг) одного розряду може бути різною і залежить від основи застосованої системи кодування.
Ємності одного розряду в двійковій, трійковій та десятковій системах кодування:
Один двійковий розряд (біт) має 2 взаємовиключніможливі стани(значення, коду).
Один трійковий розряд (трит) має 3 взаємовиключніможливі стани(значення, коду).
Один десятковий розряд (децит) має 10 взаємовиключних можливих станів (значень, кодів).
Третичними характеристиками обсягу даних є різні безлічі розрядів.
Місткістьмножини розрядівдорівнюєкількості можливих станівцієїмножини розрядів, яка визначається в комбінаториці, дорівнює кількості розміщень з повтореннями і обчислюється за формулою:
Тобто ємністьмножини розрядівявляє собою показову функцію від кількостірозрядівз основою, що дорівнюєкількості можливих станіводногорозряду.
Коли деякі величини, зокрема обсяг даних, є показові функції, то, у часто, зручніше користуватися не самими величинами, а логарифмами цих величин.
Обсяг даних також можна представляти логарифмічно, як логарифмкількості можливих станів[1] .
Обсяг інформації (обсяг даних) – може вимірюватися логарифмічно. [2] Це означає, що коли кілька об'єктів розглядаються як один, кількість можливих станів перемножується, а кількість інформації — складається. Не важливо, йдеться про випадкові величини в математиці, регістри цифрової пам'яті в техніці або в квантових системах у фізиці.
Для обсягів двійкових даних зручніше користуватися логарифмами.
Найменше ціле число, двійковий логарифм якого позитивне — це 2. Відповідна йому одиниця — біт — є основою обчислення інформації в цифровій техніці.
Для обсягів трійкових даних зручніше користуватися трійковими логарифмами.
Одиниця, що відповідає числу 3, трит дорівнює log23-1,585 біта.
Така одиниця як нат(nat), що відповідає натуральному логарифму застосовується в інженерних та наукових розрахунках. У обчислювальної техніки вона практично не застосовується, тому що основа натуральних логарифмів не є цілим числом.
Для обсягів десяткових даних зручніше користуватися десятковими логарифмами.
Одиниця, що відповідає числу 10,децитдорівнює log210-3.322 біта.
У цілихкількостях двійкових розрядів(бітів)кількість можливих станівдорівнює ступеням двійки.
Зошита, напівбайт, ніббл
Особливу назву мають чотири двійкові розряди (4 біти) — зошити, напівбайт, нібл, які вміщують кількість інформації, що міститься в одній шістнадцятковій цифрі.
| байт | Б | 10 0 | - | 10 0 | байт | B | Б | 2 0 |
| кілобайт | кбайт | 10 3 | кіло- | 10 3 | кібібайт | KiB | КіБ | 2 10 |
| мегабайт | Мбайт | 10 6 | мега- | 10 6 | мебібайт | MiB | МіБ | 2 20 |
| гігабайт | Гбайт | 10 9 | гіга- | 10 9 | гібібайт | GiB | ГіБ | 2 30 |
| терабайт | Тбайт | 10 12 | тера- | 10 12 | тебібайт | TiB | Тіб | 2 40 |
| петабайт | Пбайт | 10 15 | пета- | 10 15 | пебібайт | PiB | ПіБ | 2 50 |
| ексабайт | Ебайт | 10 18 | екса- | 10 18 | ексбібайт | EiB | ЕіБ | 2 60 |
| зеттабайт | Збайт | 10 21 | зетта- | 10 21 | зебібайт | ZiB | ЗіБ | 2 70 |
| іоттабайт | Ібайт | 10 24 | іотта- | 10 24 | йобібайт | YiB | ЙіБ | 2 80 |
Наступною по порядку популярною одиницею інформації є 8 біт, абобайт(про термінологічні тонкощі написано нижче). Саме до байта (а не до біта) безпосередньо наводяться все більші обсяги інформації, що обчислюються в комп'ютерних технологіях.
Такі величини як машинне слово і т. п., що становлять кілька байт, як одиниці виміру майже ніколи не використовуються.
Для вимірювання великих ємностей запам'ятовуючих пристроїв і великих об'ємів інформації, що мають велику кількість байтів, служать одиниці «кілобайт» = [1000] байт та «Кбайт» [3] (кібібайт, kibibyte) = 1024 байт (про плутанину десяткових та двійкових одиниць та термінів див. нижче). Такий порядок величин мають, наприклад:
- Сектор диска зазвичай дорівнює 512 байтам тобто половині Кбайта, хоча для деяких пристроїв може дорівнювати одному або двом кібібайт.
- Класичний розмір блоку у файлових системах UNIX дорівнює одному Кбайт (1024 байт).
- "Сторінка пам'яті" в процесорах x86 (починаючи з моделі Intel 80386) має розмір 4096 байт, тобто 4 Кбайт.
Обсяг інформації, що отримується при зчитуванні дискети «3,5» високої щільності» дорівнює 1440 Кбайт (рівно); інші формати також обчислюються цілим числом Кбайт.
Одиниці "мегабайт" = 1000 кілобайт = [1 000 000]байт і «мебібайт» [3] (mebibyte) = 1024 Кбайт = 1048576 байт застосовуються для вимірювання обсягів носіїв інформації.
Оперативну пам'ять і ємність CD-ROM міряють двійковими одиницями (мебібайтами, хоча їх зазвичай не називають), але обсягу НЖМД десяткові мегабайти були популярнішими.
Сучасні жорсткі диски мають об'єми, що виражаються в цих одиницях щонайменше шестизначними числами, тому для них застосовуються гігабайти.
Одиниці «гігабайт» = 1000 мегабайт = [1 000 000] кілобайт = [1 000 000 000] байт і «Гбайт» [3] (гибибайт, gibibyte) = 1024 Мбайт = 1024 Мбайт = 2 носіїв інформації, наприклад, жорстких дисків. Різниця між двійковою та десятковою одиницями вже перевищує 7 %.
Для обчислення ще більших обсягів інформації є одиницітерабайтітебібайт(10 12 і 2 40 байт відповідно),петабайттапебібайт(10 15 і 250 байт відповідно) і т. д.
У таких позначеннях якбайт(українське) абоB(англійське) під байтом (B) мається на увазі саме 8 біт, хоча сам термін «байт» не цілком коректний з погляду теорії.
У французькій мові використовуються позначенняo,Ko,Moі т. д. (від слова octet) щоб підкреслити, що йдеться саме про 8 біт.
Довгий час різниці між множниками 1000 і 1024 р. намагалися не надавати великого значення. Щоб уникнути непорозумінь слід чітко розуміти різницю між:
- двійковими кратними одиницями, що позначаються згідно з ГОСТ 8.417-2002 як "Кбайт", "Мбайт", "Гбайт" і т. д. (два в ступенях кратних десяти);
- одиницямикілобайт,мегабайт,гігабайті т. д., які розуміються як наукові терміни (десять у ступенях, кратних трьом),
ці одиниціза визначеннямрівні, відповідно, 10 3 , 10 6 , 10 9 байтам і т. д.
Як терміни для "Кбайт", "Мбайт", "Гбайт" і т. д. МЕК пропонує "кібібайт", "мебібайт", "гібібайт" і т. д., проте ці терміни критикуються за невимовність і не зустрічаються в усній промови.
У різних галузях інформатики переваги у вживанні десяткових і двійкових одиниць теж різні. Причому, хоча з часу стандартизації термінології та позначень пройшло вже кілька років, далеко не скрізь прагнуть прояснити точне значення одиниць, що використовуються.