В прошлом году мне понадобилось доработать токенизатор в моем движке. Поэтому я быстро набросал новую простейшую версию. Токенизатор хранит лишь начало/конец токена аля std::string_view. Поддерживается UTF-8. Поддерживает произвольный набор разделителей и их произвольную длину. Может быть достаточно легко доработан до …
UTF-8
Flexible and Economical UTF-8 Decode
Давно использую декодер, состоящий из кучи бранчей и логических операций. Вот вариант без бренча (тернарный оператор в данном случае брачнем не является), двух логических операций и таблицы – Flexible and Economical UTF-8 Decode
Еще раз об ID3 тегах в mp3
Есть пакет media-libs/mutagen – это набор небольших утилит написанных на питоне, существенно помогающих облегчить конвертацию.Пишем такую команду: Этой командой перекодируем все файлы с тегами в кодировке cp1251 в кодировку utf8, попутно удаляем тег первой версии, дабы Amarok не обращал на …
Sypex Dumper Lite
Переезжая с одного сервера на другой пришлось переносить и базы данных. Ни одна из программ и утилит не могла справиться с большими базами и с кодировками отличными от UTF-8. Случайно нашел Sypex Dumper – это незаменимый скрипт для переноса и …
Konqueror и smb
Для того, что бы Konqueror отображал русские “шары” корректно, достаточно создать такой файлик – ~/.smb/smb.conf, с таким содержимым (для локали utf-8): [global] dos charset = CP866 unix charset = UTF-8 display charset = UTF-8