java導(dǎo)出dbf文件生僻漢字處理方式
java導(dǎo)出dbf文件生僻漢字處理
java導(dǎo)出數(shù)據(jù)到dbf文件,如果姓名中有生僻漢字,在dbf中看到的很可能是?號(hào)。
遇到這種情況需查對(duì)GBK的生僻漢字的Unicode表,GBK提及的52個(gè)生僻漢字有兩種Unicode。
例如:
䶮(yan 3) \u4ADE就不能在dbf中正常顯示是?
如果換成\uE863則可以(可以打開word的插入->符號(hào)->其他符號(hào),在字符代碼中輸入4ADE的到字符插入word,輸入E863的到另一形式插入word,將這兩種形式的字符從word拷貝到Visual Fox Pro的命令窗口可以看到差別,一個(gè)變成?一個(gè)能正常顯示)。
解決方式:
1.建立52個(gè)生僻漢字的unicode映射Map
2.將生僻漢字轉(zhuǎn)成unicode形式(有可能是將整個(gè)姓名轉(zhuǎn)成unicode)
3.將姓名的unicode形式進(jìn)行分割(\u)生成數(shù)組(注意兩端的雙引號(hào))
4.遍歷unicode數(shù)組,如果找到生僻漢字的unicode則進(jìn)行替換
5.將unicode還原成漢字
6.寫入dbf
漢字轉(zhuǎn)unicode可利用(import com.alibaba.fastjson.JSON) :
//unicode轉(zhuǎn)中文 public static String unicodeToString(String str) { return String.valueOf(JSON.parse(str)); } //中文字符轉(zhuǎn)unicode public static String stringToUnicode(String s) { return JSON.toJSONString(s, SerializerFeature.BrowserCompatible); }
其他說明:
例如:
䶮在mysql中能顯示出來,導(dǎo)出到dbf中時(shí)如果選擇 字符集為 GB2312或GBK,導(dǎo)出的 䶮為?。
在Visual Fox Pro 9的命令窗口里輸入的 䶮為?
打開word,插入,輸入字符編碼4DAE得到 䶮,插入到word,復(fù)制粘貼到 Visual Fox Pro 9的命令窗口改字顯示 為?
打開word,插入,輸入字符編碼8E63得到 ,有些版本的Word能顯示出來,有些版本的不能顯示,按Alt+X ,插入到word,復(fù)制粘貼到 Visual Fox Pro 9的命令窗口改字能顯示 正常
上圖輸入E863無反應(yīng)
按快捷鍵Alt+x后的效果
java-dbf中文標(biāo)題亂碼
項(xiàng)目中需要對(duì)DBF的文件進(jìn)行導(dǎo)入處理,上網(wǎng)搜了發(fā)現(xiàn)有java-dbf這個(gè)東西。實(shí)際應(yīng)用中踩了不少坑,主要就是中文亂碼的問題。
InputStream in = new FileInputStream("D:\\test.dbf"); DBFReader reader = new DBFReader(in); reader.setCharactersetName("GBK"); for(int i = 0; i < reader.getFieldCount(); i++){ DBFField field = reader.getField(i); System.out.print(field.getName() + ","); } System.out.print("\r\n"); Object[] values; while ( (values = reader.nextRecord()) != null ){ for(Object value : values){ System.out.print(value.toString() + ","); } System.out.print("\r\n"); }
網(wǎng)上寫法千篇一律,大概就是這樣。問題來了DBF中具體數(shù)據(jù)的中文亂碼通過reader.setCharactersetName("GBK")解決了。
但是發(fā)現(xiàn)列名的亂碼還是沒有解決
后來查了一下源碼,發(fā)現(xiàn)了問題所在
public DBFReader(InputStream in, Charset charset, boolean showDeletedRows) { try { this.showDeletedRows = showDeletedRows; this.inputStream = in; this.dataInputStream = new DataInputStream(this.inputStream); this.header = new DBFHeader(); this.header.read(this.dataInputStream, charset, showDeletedRows); setCharset(this.header.getUsedCharset()); /* it might be required to leap to the start of records at times */ int fieldSize = this.header.getFieldDescriptorSize(); int tableSize = this.header.getTableHeaderSize(); int t_dataStartIndex = this.header.headerLength - (tableSize + (fieldSize * this.header.fieldArray.length)) - 1; skip(t_dataStartIndex); this.mapFieldNames = createMapFieldNames(this.header.userFieldArray); } catch (IOException e) { DBFUtils.close(dataInputStream); DBFUtils.close(in); throw new DBFException(e.getMessage(), e); } }
其中header就是我們讀取的列名,列數(shù)所依靠的成員變量,但是這個(gè)變量在對(duì)象創(chuàng)建的時(shí)候就賦值好了。
這就導(dǎo)致了后來即使調(diào)用了setCharactersetName也解決不了列名亂碼問題。
所以我們要從根本上解決問題,創(chuàng)建對(duì)象的時(shí)候直接傳入charset對(duì)象。
修改后代碼如下
public static void main(String[] args) throws FileNotFoundException { InputStream in = new FileInputStream("D:\\test.dbf"); Charset charset = Charset.forName("GBK"); DBFReader reader = new DBFReader(in,charset); for(int i = 0; i < reader.getFieldCount(); i++){ DBFField field = reader.getField(i); System.out.print(field.getName() + ","); } System.out.print("\r\n"); Object[] values; while ( (values = reader.nextRecord()) != null ){ for(Object value : values){ System.out.print(value.toString() + ","); } System.out.print("\r\n"); } }
輸出時(shí)候列名就正常了
以上為個(gè)人經(jīng)驗(yàn),希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。
相關(guān)文章
Java中Connection timed out和Connection refused的區(qū)別講解
今天小編就為大家分享一篇關(guān)于Java中Connection timed out和Connection refused的區(qū)別講解,小編覺得內(nèi)容挺不錯(cuò)的,現(xiàn)在分享給大家,具有很好的參考價(jià)值,需要的朋友一起跟隨小編來看看吧2019-04-04劍指Offer之Java算法習(xí)題精講數(shù)組與字符串題
跟著思路走,之后從簡單題入手,反復(fù)去看,做過之后可能會(huì)忘記,之后再做一次,記不住就反復(fù)做,反復(fù)尋求思路和規(guī)律,慢慢積累就會(huì)發(fā)現(xiàn)質(zhì)的變化2022-03-03Java之使用POI教你玩轉(zhuǎn)Excel導(dǎo)入與導(dǎo)出
這篇文章主要介紹了Java之使用POI教你玩轉(zhuǎn)Excel導(dǎo)入與導(dǎo)出,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2022-10-10SpringBoot使用jasypt實(shí)現(xiàn)數(shù)據(jù)庫信息脫敏的方法詳解
這篇文章主要介紹了SpringBoot使用jasypt實(shí)現(xiàn)數(shù)據(jù)庫信息的脫敏,以此來保護(hù)數(shù)據(jù)庫的用戶名username和密碼password(容易上手,詳細(xì)),文中有詳細(xì)的圖文講解和代碼示例供大家參考,需要的朋友可以參考下2024-06-06使用kafka如何選擇分區(qū)數(shù)及kafka性能測試
這篇文章主要介紹了使用kafka如何選擇分區(qū)數(shù)及kafka性能測試,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2021-08-08java中BCryptPasswordEncoder密碼的加密與驗(yàn)證方式
這篇文章主要介紹了java中BCryptPasswordEncoder密碼的加密與驗(yàn)證方式,具有很好的參考價(jià)值,希望對(duì)大家有所幫助,如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2023-08-08