String byte[]中相互转化的字符集乱码问题


clipboard.png


 private static FileInputStream fr;
 fr = new FileInputStream("E://test-1.txt");
byte[] initContent = new byte[1024];
int size =  fr.read(initContent);
byte[] content = Arrays.copyOf(initContent, size);
String srcString = new String(initContent,"utf-8");
System.out.println("Original string:" + srcString);


 输出为
Original string:Wish you success��

Why there are two �?

字符集 字符编码 乱码

绿坝娘的祝福 9 years, 3 months ago

试验了一下,叹号是全角的 的时候,.txt 文件按 GBK 编码保存。
这种情况下读出来按 UTF8 生成字符串就是两个问号。
你改成 GBK 应该就对了。

如果你的文本文件用 UTF8 保存,然后读出来按 GBK 生成字符串,一样会乱码,你可以试试。

还有这里


 String srcString = new String(initContent, "utf-8");

你是想写这个吧……


 String srcString = new String(content, "utf-8");

要不然 content 完全没用。

口水流一地 answered 9 years, 3 months ago

Your Answer