Я могу просмотреть http://hosting2.phor.net/~bolomi/ и сохранить это в файл. В Chrome я могу просмотреть источник и видеть, что заголовок страницы является 波羅蜜. Если я открываю сохраненный файл в энергии для редактирования, я вижу вопросительные знаки для тех символов. Затем, если я :set encoding=gb2312
Я буду видеть первые два символа и затем вопросительные знаки. Если, вместо этого, я делаю :e ++enc=gb2312 %:p
Я буду видеть средний символ.
После того, как файл открыт (потому что я использую MacVim, и Выборка открывает файл для меня автоматически), что корректный рабочий процесс должен отредактировать этот файл?
gb2312 только делает упрощенные символы.
Firefox, Mozilla и python2-chardet-2.0.1 все лежат и говорят, что это - gb2312, но так как он имеет традиционные символы, необходимый набор символов является gb18030.
Так: если это похоже на утку, шарлатанов как утка, пахнет как утка и является на вкус как утка... открывают файл с hexdump и читают файл определения кодовой страницы.