Java獲取字符串編碼格式實現(xiàn)思路_第1頁
Java獲取字符串編碼格式實現(xiàn)思路_第2頁
Java獲取字符串編碼格式實現(xiàn)思路_第3頁
Java獲取字符串編碼格式實現(xiàn)思路_第4頁
Java獲取字符串編碼格式實現(xiàn)思路_第5頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

第Java獲取字符串編碼格式實現(xiàn)思路判斷一個字符串的編碼格式:

publicstaticStringgetEncoding(Stringstr){

Stringencode="GB2312";

try{

if(isEncoding(str,encode)){//判斷是不是GB2312

returnencode;

}catch(Exceptionexception){

encode="ISO-8859-1";

try{

if(isEncoding(str,encode)){//判斷是不是ISO-8859-1

returnencode;

}catch(Exceptionexception1){

encode="UTF-8";

try{

if(isEncoding(str,encode)){//判斷是不是UTF-8

returnencode;

}catch(Exceptionexception2){

encode="GBK";

try{

if(isEncoding(str,encode)){//判斷是不是GBK

returnencode;

}catch(Exceptionexception3){

return"";//如果都不是,說明輸入的內(nèi)容不屬于常見的編碼格式。

publicstaticbooleanisEncoding(Stringstr,Stringencode){

try{

if(str.equals(newString(str.getBytes(),encode))){

returntrue;

}catch(UnsupportedEncodingExceptione){

e.printStackTrace();

returnfalse;

}

Java獲取一個文本文件的編碼格式

文本文件是我們在windows平臺下常用的一種文件格式,這種格式會隨著操作系統(tǒng)的語言不同,而出現(xiàn)其默認(rèn)的編碼不同

那么如何使用程序獲取文本文件的編碼方式呢?

文件編碼的格式?jīng)Q定了文件可存儲的字符類型,所以得到文件的類型至關(guān)重要

下文筆者講述獲取一個文本文件的格式信息的方法分享,如下所示:

實現(xiàn)思路:

通過獲取文件流的前3個字節(jié)

判斷其值的方式,即可獲取文本文件的編碼方式

例:

packagecom.java265.other;

importjava.io.File;

importjava.io.FileInputStream;

importjava.io.InputStream;

publicclassTest{

*獲取文本文件的編碼方式

publicstaticvoidmain(String[]args){

Filefile=newFile("E://person//java.txt");

System.out.println(GetEncoding(file));

publicstaticStringGetEncoding(Filefile)

Stringcharset="GBK";

byte[]first3Bytes=newbyte[3];

try{

booleanchecked=false;

InputStreamis=newFileInputStream(file);

intread=is.read(first3Bytes,0,3);

if(read==-1)

returncharset;

if(first3Bytes[0]==(byte)0xFFfirst3Bytes[1]==(byte)0xFE){

charset="UTF-16LE";

checked=true;

}elseif(first3Bytes[0]==(byte)0xFE

first3Bytes[1]==(byte)0xFF){

charset="UTF-16BE";

checked=true;

}elseif(first3Bytes[0]==(byte)0xEF

first3Bytes[1]==(byte)0xBB

first3Bytes[2]==(byte)0xBF){

charset="UTF-8";

checked=true;

}elseif(first3Bytes[0]==(byte)0xA

first3Bytes[1]==(byte)0x5B

first3Bytes[2]==(byte)0x30){

charset="UTF-8";

checked=true;

}elseif(first3Bytes[0]==(byte)0xD

first3Bytes[1]==(byte)0xA

first3Bytes[2]==(byte)0x5B){

charset="GBK";

checked=true;

}elseif(first3Bytes[0]==(byte)0x5B

first3Bytes[1]==(byte)0x54

first3Bytes[2]==(byte)0x49){

charset="windows-1251";

checked=true;

//bis.reset();

InputStreamistmp=newFileInputStream(file);

if(!checked){

intloc=0;

while((read=istmp.read())!=-1){

loc++;

if(read=0xF0)

break;

if(0x80=readread=0xBF)

break;

if(0xC0=readread=0xDF){

read=istmp.read();

if(0x80=readread=0xBF)

continue;

else

break;

}elseif(0xE0=readread=0xEF){

read=istmp.read();

if(0x80=readread=0xBF){

read=istmp.read();

if(0x80=readread=0xBF){

charset="UTF-

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論