Подання інформації, мови, кодування Писемність та кодування інформації
Подання інформації, мови, кодування
Писемність та кодування інформації
Процес читання тексту — це зворотний стосовно письма процес, у якому письмовий текст перетворюється на усне мовлення. Читання можна назвати декодуванням письмового тексту. Схематично ці два процеси зображені малюнку.
Схема передачі інформації через писемність
Схема типова всім процесів, що з передачею інформації.
Цілі та способи кодування
Існує безліч способів кодування. Наприклад, стенографія - швидкий спосіб запису мовлення. Нею володіють лише деякі спеціально навчені люди – стенографісти. Вони встигають записувати текст синхронно з промовою людини. У стенограмі один значок означає ціле слово або поєднання букв. Розшифрувати (декодувати) стенограму може лише сам стенографіст.
Подивіться на текст стенограми малюнку. Там написано таке: «Говорити вміють усі люди у світі. Навіть у найпримітивніших племен є мова. Мова - це щось загальне і найлюдяніше, що є на світі».
Можна вигадати й інші способи кодування.
Наведені приклади ілюструють наступне важливе правило:для кодування однієї й тієї інформації можуть бути використані різні способи; їх вибір залежить від низки обставин: мети кодування, умов, наявних средств.Якщо треба записати текст у темпі мови, робимо це за допомогою стенографії; якщо треба передати текст за кордон, користуємось латинським алфавітом; якщо треба подати текст у вигляді, зрозумілому для грамотної української людини, записуємо його за правилами граматики української мови.
Ще одна важлива обставина:вибір способукодування інформації може бути пов'язаний з передбачуваним способом її обробки. Обговоримо це на прикладі подання чисел — кількісної інформації. Використовуючи українську абетку, можна записати число «тридцять п'ять». Використовуючи алфавіт арабської десяткової системи числення, пишемо: 35. Нехай вам треба зробити обчислення. Скажіть, який запис зручніший для виконання розрахунків: «тридцять п'ять помножити на сто двадцять сім» чи «35 х 127»? Очевидно, що для перемноження багатозначних чисел ви користуватиметеся другим записом.
Зауважимо, що ці два записи, еквівалентні за змістом, використовують різні мови: перший — природна українська мова, другий — формальна мова математики, яка не має національної приналежності. Перехід від подання природною мовою до подання формальною мовою можна також розглядати як кодування. Людині зручно використовуватиме кодування чисел десяткову систему числення, а комп'ютеру — двійкову систему.
Формальними мовами, що широко використовуються в інформатиці, є мови програмування.
Історія технічних способів кодування інформації
З появою технічних засобів зберігання та передачі інформації виникли нові ідеї та прийоми кодування. Першим технічним засобом передачі на відстань став телеграф, винайдений 1837 року американцем Семюэлем Морзе. Телеграфне повідомлення - це послідовність електричних сигналів, що передається від одного телеграфного апарату по дротах до іншого телеграфного апарату. Ці технічні обставини привели Морзе до ідеї використання всього двох видів сигналів - короткого і довгого - для кодування повідомлення, що передається лініями телеграфного зв'язку.
Такий спосіб кодування отримавназва азбка Морзе. У ньому кожна буква алфавіту кодується послідовністю коротких сигналів (крапок) та довгих сигналів (тире). Літери відокремлюються одна від одної паузами - відсутністю сигналів.
У таблиці показано абетку Морзе стосовно українського алфавіту.
Спеціальних розділових знаків у ній немає. Їх зазвичай записують словами: «тчк» - крапка, «ЗПТ» - кома і т. п.
Найзнаменитішим телеграфним повідомленням є сигнал лиха "SOS" (Save Our Souls - врятуйте наші душі). Ось як він виглядає в коді абетки Морзе:
Три точки позначають букву S, три тире - букву О. Дві паузи відокремлюють букви одна від одної.
Характерною особливістю абетки Морзе є змінна довжина коду різних літер, тому код Морзе називаютьнерівномірним кодом.Літери, які зустрічаються в тексті частіше, мають більш короткий код, ніж рідкісні букви. Наприклад, код букви "Е" - одна точка, а код букви "Ъ" складається з шести знаків. Навіщо так зроблено? Щоб зменшити довжину всього повідомлення. Але через змінну довжину коду літер виникає проблема відокремлення літер один від одного в тексті. Тому доводиться для поділу використовувати паузу (перепустку). Отже, телеграфний алфавіт Морзе є трійковим, оскільки у ньому використовується три знаки: крапка, тире, перепустка.
Рівномірний телеграфний кодбув винайдений французом Жаном Морісом Бодо наприкінці XIX століття. У ньому використовувалося лише два види сигналів. Неважливо, як їх назвати: точка та тире, плюс і мінус, нуль та одиниця. Це два електричних сигнали, що відрізняються один від одного.
У коді Бодо довжина кодів всіх символів абетки однакова і дорівнює п'яти. У такому разі не виникає проблеми відокремлення букв одна від одної: кожна п'ятірка сигналів — це знак тексту.
КодБодо — це перший історія техніки спосіб двійкового кодування информации.Завдяки ідеї Бодо вдалося автоматизувати процес передачі та друку літер. Було створено клавішний телеграфний апарат. Натискання клавіші з певною літерою виробляє відповідний п'ятиімпульсний сигнал, який передається лінією зв'язку. Приймаючий апарат під впливом цього сигналу друкує ту ж літеру на паперовій стрічці.
З базового курсу інформатики ви знаєте, що в сучасних комп'ютерах для кодування текстів також застосовується рівномірний двійковий код. Проблеми кодування інформації в комп'ютері та передачі даних по мережі ми розглянемо трохи пізніше.