Python конвертуємо кодування текстових файлів в UTF-8 - KorP`s blog

Я, мабуть, це не дивно, люблю аніме, як і багато хто в сучасному світі. Єдине - терпіти не можу українське озвучення і волію дивитися із субтитрами. Але. більшість релізерів сидять на windows і зовсім не думаю про те, що існують інших ОС, для яких кодування windows-1251 не те що не є рідним, а взагалі коректно не відображається. Почавши нещодавно вивчати python, став думати про різні, корисні для "будинку" скрипти, а прочитавши днями статтю на хабрі. який би цим і займався. Про нього й розповім.

Сам скрипт досить простенький і невеликий, ось листинг:

Скрипт перевіряє вхідний файл на кодування, якщо файл у кодуванні, відмінному від UTF-8 - конвертує файл. Для коректної роботи скрипта нам потрібний модуль chardet. Його потрібно завантажити, ну а далі все просто - розархівуємо модуль, через консоль заходимо в цю директорію, скажімо:

та виконати команду:

модуль досить швидко встановиться та скрипт буде повністю працездатний. Скрипт здатний конвертувати як одиночний файл, і всю директорію повністю (знаходячи у ній лише файли з розширенням srt, ass, txt). Приклади:

Якщо викликати скрипт без аргументів, ви отримаєте запрошення ввести шлях до директорії чи файлу.

Скрипт на github де чекаю на ваші фікси та доповнення.