Йоттабайт та йобібайт

інформації

Йобібайт. — Про що подумали? А Ви знаєте, що відповідно до стандартів МЕК є така одиниця вимірювання інформації? Подивіться на табличку у Вікіпедії або наприкінці цієї нотатки!

інформації
Що таке Біт? — перше питання, яке я ставлю на першій лекції курсу «Алгоритмізація та програмування» і, як правило, отримую щось неживе типу — «Елементарна одиниця виміру інформації» або «Один біт може набувати лише двох значень, які позначають 0 і 1» , те, чого навчили у школі. Ну і що далі? А далі нічого — аксіоматика, а далі, прагнучи пізнати світ, треба було б його дробити і розщеплювати, знущатися з нього, як з атома в андронному колайдері. Дорогого варте, от і доводиться приймати «біт» як щось неподільне, як просто даність — жарт.

Поблукавши трохи Вікіпедією, натрапив на таку фразу — «В даний час не існує єдиного визначення терміна інформація». Обидва на! А що можна виміряти неіснуюче? В інформатиці і не таке можливе, а найголовніше, це потрібно і корисно.

Біт - скороченняbi nary digit, а ще й цікава гра слів, bit в англійській - "трохи", "трохи". Вперше для вимірювання кількості інформації слово bit було використане Клодом Шенноном A Mathematical Theory of Communication એ. Рефлексія великих учених завжди вражає і нагадує образність мислення первісних людських племен, наприклад, імена у північноамериканських індіанців. Гвекігіжиг - Небо, що повертається над головою, трохи - просто битий, куди вже простіше.

Звичайно, для повного розуміння звернемося до першоджерела і почитаємо класика: «Біт — це двійковий логарифм ймовірності рівноймовірних подій або сума творів ймовірності на двійковийлогарифм ймовірності при рівноймовірних подіях» або, наприклад, простіше: «Біт — базова одиниця виміру એ кількості інформації એ , що дорівнює кількості інформації, що міститься в досвіді, що має два рівноймовірні результати. Це тотожно кількості інформації у відповіді питання, допускає відповіді «так» чи «ні» і жодного іншого (тобто така кількість інформації, що дозволяє однозначно відповісти на поставлене питання)». Ось, розумієш, який Гвекігіжиж виходить. «Я уб'ю тебе, … тлумач-перекладач!». Не кожен із першої спроби осмислить ці набори окремо зрозумілих слів, зібрані в речення мозком великого вченого.

Якщо відмовитися від статики і включити динаміку те, те саме можна сказати так: зміна значення двійкового розряду, званого «бітом», — це перемикання, тобто відповідає зміні стану на протилежне, що зрозуміліше і коротше. Носієм такої зміни може бути все, що ми придумаємо, можемо відчути чи поміряти, аби у носія були протилежності, наприклад, світло: «видно не видно»; електрична напруга в розетці: «стукне-не стукне»; стрілка компаса: «північ-південь» і ще маса всього, що може набувати протилежних значень. Як ми називатимемо ці протилежні стани в такому контексті все одно, хоч «тралі-валі», хоч «мумба-юмба». Однак, для конструктивного використання такого уявлення про біт хотілося б отримати цей носій, фізичну основу для збереження стану двійкового розряду і вже потім думати про назву.

Насправді байт штука апаратно залежна, зазвичай, під байтом розуміють одну частину, половину, машинного слова. А машинне слово має розмір регістрів центрального процесора. Так що раніше байт був розміром 6 біт, а зараз наближається до 32 біт.Коли Ви купуєте новий комп'ютер, то в технічних характеристиках процесора обов'язково зустрінете слово розрядність, зараз 32 або 64. Так ось - це і є розмір регістру, а отже, і машинного слова. У сімействі мережевих протоколів для обміну інформацією між комп'ютерами порцію інформації так само називають байтом, а щоб підкреслити розмір порції в 8 біт, кажуть октет. Але октет, якось кострубато звучить, байт краще, тому просто домовимося в рамках цієї замітки вважати байт розміром 8 біт.

Що таке щось у «коробочці»-байті – це тема окремої розмови під назвою «Тип даних». Зараз же, для отримання фізичного відчуття значущості байта, обмежимося тим, що розміру цієї «коробочки» достатньо щоб розрізнити всі коди графічних образів малих і великих символів англійської та української алфавітів (2*(26 + 33) = 118, ще трохи залишиться для цифр, знаків пунктуації та ще чогось корисного). Якщо їх можна розрізнити, то можна поодинці складати в ці «коробочки» код літери алфавітів, зберігати і змінювати їх, що, власне, і робить будь-який комп'ютер, що направляється жорсткою рукою програміста.

Педантичний програміст обов'язково побачить помилку у цих обчисленнях. А полягає вона в тому, що число 10, до якого ми звикли з дитинства, не може бути розкладено на множники на основі комп'ютерної системи числення 2. Так у десятковій системі числення:

100 = 10 * 10 = 10 2; 1000 = 10 * 10 * 10 = 10 3; 10000 = 10 * 10 * 10 * 10 = 10 4 і

у двійковій системі числення аналогічно

4 = 2 * 2 = 2 2; 8 = 2 * 2 * 2 = 2 3; 16 = 2 * 2 * 2 * 2 = 2 4 .

Таким чином, значення розкладів на множники в десятковій та двійковій системах числення ніколи не збігаються, між точнимизначеннями 8 і 16 двійкового розкладання ні чим не заповнена та пристойна відстань. 8 ближче до 10, ніж 16, але не 10. Аналогічно і для будь-якого числа кратного 10 - 100, 1000, 10 000 отримаємо тільки наближення, а не точне збіг.

йобібайт
А саме таке розкладання використовується для кодування чисел при їх перенесенні з реального нескінченного та безперервного світу у світ «коробочок» комп'ютера, що займають кінцеву кількість біт. Найближчим до 1000 точним числом подібного розкладання є 1024 = 210, тому і комп'ютерний кілобайт не є 1000 байт, а трохи більше - 1024 байта. Таким чином, виходить, що чим вагоміша десяткова приставка, тим більша різниця між загальноприйнятим та програмістським розумінням обсягу інформації. Для "кіло" - 24 байти; для «мега» вже 48,576 kB, адже 220 = 1048576; а для «гіга» — 73,742 MB, тому, що 2 30 =1 073 741 824. Якщо виміряти в «папугах», на нашу в «Війні та світі», — це 23 повні набори або 92 електронні книги. Ціла шафа в домашній бібліотеці — чутлива!

На завершення наводжу таблицю, в якій записані приставки до слова байт та відповідний розмір для вітчизняного стандарту ГОСТ та стандарту МЕК – Міжнародної електротехнічної комісії, незалежної, неурядової організації.

Вимірювання в байтах
Десятична приставкаДвійкова приставка એ
НазваСимволСтупіньНазваСимволСтупінь
ГОСТПЕК
байтB10 0байтBбайт2 0
кілобайтkB10 3кібібайтKiBКбайт2 10
мегабайтMB10 6мебібайтMiBМбайт2 20
ГігабайтGB10 9гібібайтGiBГбайт2 30
терабайтTB10 12тебібайтTiBТбайт2 40
петабайтPB10 15пебібайтPiBПбайт2 50
ексабайтEB10 18ексбібайтEiBЕбайт2 60
зеттабайтZB10 21зебібайтZiBЗбайт2 70
йоттабайтYB10 24йобібайтYiBЙбайт2 80

І вже зовсім на завершення. Виробники пам'яті для комп'ютерів дісталися лише середини таблиці, тобто. «Терабайтів», 10 12 . Час ще є, доки вони дістануться останнього рядка з «йобібайтом», а Україна органічно інтегрується у світову спільноту і почне застосовувати його стандарти. Тому хотілося б рекомендувати МЕК звернути свою увагу майже на 400 млн. осіб, які досконало володіють українською мовою, у яких назва пристрою зберігання інформації «Восьми Йобібайтний гвинт» викликає непристойні асоціації.

Обмеження відповідальності

Інформація на сайті надається «як є», без будь-яких гарантій, включаючи гарантію застосування в певних цілях, комерційну придатність тощо. У текстах можуть бути технічні неточності та помилки. Автор не може гарантувати повноти, достовірності та актуальності всієї інформації, ненесе відповідальність за наслідки використання сайту третіми особами.

Автор не робить жодних заяв, не дає жодних гарантій та оцінок щодо того, що результатів, розміщених на сайті та описаних у заявах щодо майбутніх результатів, буде досягнуто.

Автор не несе відповідальності за збитки, що виникли у користувачів або третіх осіб внаслідок використання ними сайту, включаючи втрачену вигоду.

Автор не несе відповідальності за збитки, що виникли в результаті дій користувачів, які явно не відповідають звичайним правилам роботи з інформацією в Інтернеті.

Користуючись сайтом, ви приймаєте та погоджуєтесь з усіма нашими правилами, включаючи «Обмеження відповідальності».