Есть та же проблема с latin1_swedish_ci
Тому, кто ставил до меня биллинг в БД с такой кодировкой - руки бы отрывать. Но переносить надо. И огромное желание в юникод.
Интересно послушать, как другие подобное проделывали. Особенно учитывая тот факт, что кодировка ОС - utf-8 тоже.
Себя гуру назвать не могу.
У меня база весит ~33Гб. Если делать дамп через mysqldump, из-за различий системной кодировки (юникод) и этой ужасной latin1, кодировка выходит битой.
Конвертануть обратно в latin1 не получится, ибо с таким объемом iconv не работает. Зато на ура справляется piconv - perl'овский вариант релизции.
Только что доконвертировал дамп, сейчас проверю результаты.
mysqldump --default-character-set=latin1 UTM5 >utm5_latin1.sql
После этого действия iconv обычно не нужен.
Достаточно попробовать глянуть смотрелкой, поддерживающей utf-8 эти данные, поискать там русский язык. Если все читается - то просто sed-ом меняете в скрипте указания кодировки таблиц/базы.
У меня при попытке заливки 60Гб UTM5H вываливается через 1.2.-1.4Гб:
[root@accounter /usr]# mysql -u root -pqwsxza UTM5H <UTM5H.sql
ERROR 2013 (HY000) at line 2520: Lost connection to MySQL server during query
Может чего подкрутить надо?
Пробовал заливать на 5.0, потом установил 5.1 - та же ерунда.