TXT编码转换工具

Kindle不识别ANSI编码(gb2312)的txt文档。找到的工具都只能统一更改,所以写了这玩意。我果然还是爱着.net啊……T_T

识别文件编码的代码来自天飞的园子

可执行文件:http://wei.si/encodingchange.zip

Update:一部分文件转换之后乱码,这些文件特点都是UTF-8编码但无BOM,只根据BOM判断编码类型的程序会认为文件开头没有EF BB BF,判断非UTF-8编码,直接打开也是乱码(比如UE和Kindle还有旧版IE),或者错误以GB2312方式读取并转换(比如我这个程序)。从Wikipedia看,这是因为Unicode标准虽然允许BOM,但它并非必需或者推荐(While Unicode standard allows BOM in UTF-8 , it does not require or recommend it)。

在没有BOM情况下记事本会从内容字符出现概率判断编码,所以它可以正确显示编码。具体的理论可以看一种语言/编码检测的复合方法,是Mozilla所创造用来识别网页编码的。