Короткий екскурс у кодування тексту

Так, чехарда стандартів не оминула і нашу з вами кирилицю — для її представлення було складено такі таблиці символів: 1.КОІ-72.КОІ-8(у трьох варіантах -KOI8-R,KOI8-UтаISO-IR-111) 3 .CP8664.ISO 8859-5(як частина стандартуISO/IEC 8859) 5.MacCyrillic6.Windows-1251

Маразм міцнішав, і найкращі уми людства думали як зменшити кількість кодувань, що зустрічаються в живій природі (відверто кажучи — в інтернеті), а організацієюUnicode Consortiumбув запропонований однойменний стандарт кодування символів, що складається з універсального набору символів (). UCS) та сімейства кодувань (UTF), які були стандартизовані окремо, але включені до стандарту.

Підсумовуючи вищевикладене, в сучасному рунеті найбільш поширені кодуванняWindows-1251, зважаючи на популярність операційної системи від Microsoft Corporation, іUTF-8, яка дозволяє закодувати більшу кількість символів (інакше кажучи - дозволяє працювати з кількома мовами) і має більше поширення в не-Windows-світі (я маю на увазі дистрибутиви Linux, FreeBSD і Mac OS X), ну а для підтримки ще більшої кількості мов (ну раптом вам закортить!) можна використовуватиUTF-16, тільки обережно.

P.S. Про американців так вийшло, я патріот, але применшувати їх досягнення не в праві.