Кодування в HTML

Я дуже часто говорю і пишу про кодування, однак, не всі люди знають, що це таке. Начебто розуміють, що кирилиця – це “windows-1251” ( “CP1251”), а Unicode – це “UTF-8”. А що таке кодування, так і не розуміють. І метою даної статті є розповісти про те, що це таке.

Кодування – це таблиця, в якій описується відповідність певного символу і числа. Тобто будь-який символ, який ми бачимо або вводимо, для комп’ютера в реальності – всього лише набір бітів (набір нулів і одиниць). Саме ці біти і переганяються від пристрою до пристрою. А щоб показати результат цих перегонів людині, комп’ютер перетворює за допомогою таблиці (тієї самої кодування) код символу в відповідний зовнішній вигляд.

Однак, мов велика кількість і часто у них абсолютно різний набір символів. Саме тому так часто виникають проблеми з кодуванням. Ви набирали текст, допустимо, російською мовою. А комп’ютер вирішив, що цей текст написаний на китайському. І, зрозуміло, він використовують китайську кодування, а не кириличну. В результаті, йде неправильне перетворення символів, і ми бачимо “абракадабру”.

Кодувань ж велика кількість, і задача програміста (Web-майстра) складається в правільниом виборі кодування і вказівки її безпосередньо, а не сподіватися на сервер, браузер, користувача або ще кого-то.

Сподіваюся, трохи прояснив питання про те, що таке кодування. Напевно, у Вас виникла думка про те, щоб об’єднати всі ці кодування в одну, щоб була універсальність. Думки правильні, і це вже зробили, так народилася кодування UTF-8 – найпопулярніша в усьому світі. Вона і є тією самою універсальною кодуванням. Тому більшість CMS (наприклад, Joomla, WordPress, Drupal та багато інших) роблять в кодуванні UTF-8, так як CMS повинна працювати при будь-якій національній кодуванні (і кириличної, і вірменської, і арабської, і китайської, і будь-який інший).

Який висновок можна зробити з цієї статті? Коли Ви створюєте сайт, то відразу дайте собі відповідь на питання: “А на яких мовах буде мій сайт?”. Якщо Ви точно знаєте, що там буде не тільки російський і латинський алфавіт, то використовуйте UTF-8. В іншому випадку, залишаю вибір за Вами. Одне можу сказати точно: з UTF-8 доведеться злегка помучитися. З національної кодуванням все значно простіше. Однак, якщо у Вас буде міжнародний сайт, то краще UTF-8 Ви нічого не знайдете.

1 Star2 Stars3 Stars4 Stars5 Stars (2 votes, average: 4.00 out of 5)
Loading...

Залишити коментар