pátek 30. ledna 2009

Konverze znakové sady pomocí Enca do UTF-8

Tenhle problémek souvisí s předchozím příspěvkem o mountování floppy diskety. Našel jsem na ní totiž mimo jiné hledaný text, ale byl tak starý, že byl kódován snad ještě v T602 do nějaké msdos znakové sady s Latin2.

Mrknul jsem se na různé způsoby, jak si pomoct pokud jde o kódování znaků v Ubuntu. Kdysi jsem tak vyřešil problém s převodem češtiny na UTF-8 v Geditu. Tohle bylo trochu něco jiného. Zadařilo se mi až u prográmku Enca. Čeština byla naprosto v pohodě převedena z té deset let staré "hrůzy" na UTF-8, kteroužto verzi jsem si hned uložil. Akorát bylo nutno odstranit některé znaky mimo vlastní text.

Žádné komentáře: