java中使用Files.readLines()處理文本中行數(shù)據(jù)方式
使用Files.readLines()處理文本中行數(shù)據(jù)
開發(fā)中遇到對數(shù)據(jù)庫導出到文件里的數(shù)據(jù)進行處理,然后對處理后的數(shù)據(jù)再重新寫回文件中,在這個過程中使用到了Files.readLines()方法
/** * * @param file : existed file * @throws IOException */ public void lineProcess(File file) throws IOException { Files.readLines(file, Charset.defaultCharset(), new LineProcessor() { File outFile = new File("outfile");//處理后的數(shù)據(jù)輸出文件 List<String> lines = new ArrayList<String>(); @Override public boolean processLine(String line) throws IOException { String newLine = ""; //file中的 line數(shù)據(jù)格式:name,age,address -> NAME,AGE,ADDRESS, String[] contents = line.split(","); for (int i=0;i<contents.length;i++){ newLine.concat(contents[i].toLowerCase()); } lines.add(newLine); //將處理后的數(shù)寫入新的文件 outFile FileUtils.writeLines(outFile,lines,true); lines.clear(); return true; } @Override public Object getResult() { try{ FileUtils.writeLines(outFile,lines,true); }catch (Exception e){ e.getCause(); } lines.clear(); return null; } }); }
方法中的LineProcessor()實現(xiàn)對每一行數(shù)據(jù)處理邏輯。
依賴guava
<dependency> <groupId>com.google.guava</groupId> <artifactId>guava</artifactId> <version>19.0</version> </dependency>
被readLine()折騰了一把
雖然寫IO方面的程序不多,但BufferedReader/BufferedInputStream倒是用過好幾次的,原因是:
它有一個很特別的方法:readLine(),使用起來特別方便,每次讀回來的都是一行,省了很多手動拼接buffer的瑣碎;
它比較高效,相對于一個字符/字節(jié)地讀取、轉(zhuǎn)換、返回來說,它有一個緩沖區(qū),讀滿緩沖區(qū)才返回;一般情況下,都建議使用它們把其它Reader/InputStream包起來,使得讀取數(shù)據(jù)更高效。
對于文件來說,經(jīng)常遇到一行一行的,特別相符情景。
這次是在藍牙開發(fā)時,使用兩個藍牙互相傳數(shù)據(jù)(即一個發(fā)一個收),bluecove這個開源組件已經(jīng)把數(shù)據(jù)讀取都封裝成InputStream了,也就相當于平時的IO讀取了,很自然就使用起readLine()來了。
發(fā)數(shù)據(jù)
BufferedWriter output = new BufferedWriter(new OutputStreamWriter(conn.openOutputStream())); int i = 1; String message = "message " + i; while(isRunning) { output.write(message+"/n"); i++; }
讀數(shù)據(jù)
BufferedReader input = new BufferedReader(new InputStreamReader(m_conn.openInputStream())); String message = ""; String line = null; while((line = m_input.readLine()) != null) { message += line; } System.out.println(message);
上面是代碼的節(jié)選,使用這段代碼會發(fā)現(xiàn)寫數(shù)據(jù)時每次都成功,而讀數(shù)據(jù)側(cè)卻一直沒有數(shù)據(jù)輸出(除非把流關(guān)掉)。經(jīng)過折騰,原來這里面有幾個大問題需要理解:
誤以為readLine()是讀取到?jīng)]有數(shù)據(jù)時就返回null(因為其它read方法當讀到?jīng)]有數(shù)據(jù)時返回-1),而實際上readLine()是一個阻塞函數(shù),當沒有數(shù)據(jù)讀取時,就一直會阻塞在那,而不是返回null;因為readLine()阻塞后,System.out.println(message)這句根本就不會執(zhí)行到,所以在接收端就不會有東西輸出。要想執(zhí)行到System.out.println(message),一個辦法是發(fā)送完數(shù)據(jù)后就關(guān)掉流,這樣readLine()結(jié)束阻塞狀態(tài),而能夠得到正確的結(jié)果,但顯然不能傳一行就關(guān)一次數(shù)據(jù)流;另外一個辦法是把System.out.println(message)放到while循環(huán)體內(nèi)就可以。
readLine()只有在數(shù)據(jù)流發(fā)生異?;蛘吡硪欢吮籧lose()掉時,才會返回null值。
如果不指定buffer大小,則readLine()使用的buffer有8192個字符。在達到buffer大小之前,只有遇到"/r"、"/n"、"/r/n"才會返回。
readLine()的實質(zhì)(下面是從JDK源碼摘出來的)
String readLine(boolean ignoreLF) throws IOException { StringBuffer s = null; int startChar; synchronized (lock) { ensureOpen(); boolean omitLF = ignoreLF || skipLF; bufferLoop: for (;;) { if (nextChar >= nChars) fill(); //在此讀數(shù)據(jù) if (nextChar >= nChars) { /* EOF */ if (s != null && s.length() > 0) return s.toString(); else return null; } ......//其它 } private void fill() throws IOException { ..../其它 int n; do { n = in.read(cb, dst, cb.length - dst); //實質(zhì) } while (n == 0); if (n > 0) { nChars = dst + n; nextChar = dst; } }
從上面看出,readLine()是調(diào)用了read(char[] cbuf, int off, int len) 來讀取數(shù)據(jù),后面再根據(jù)"/r"或"/n"來進行數(shù)據(jù)處理。
在Java I/O書上也說了:
public String readLine() throws IOException
This method returns a string that contains a line of text from a text file. /r, /n, and /r/n are assumed to be line breaks and are not included in the returned string. This method is often used when reading user input from System.in, since most platforms only send the user's input to the running program after the user has typed a full line (that is, hit the Return key).
readLine() has the same problem with line ends that DataInputStream's readLine() method has; that is, the potential to hang on a lone carriage return that ends the stream . This problem is especially acute on networked connections, where readLine() should never be used.
小結(jié),使用readLine()一定要注意
讀入的數(shù)據(jù)要注意有/r或/n或/r/n
沒有數(shù)據(jù)時會阻塞,在數(shù)據(jù)流異?;驍嚅_時才會返回null
使用socket之類的數(shù)據(jù)流時,要避免使用readLine(),以免為了等待一個換行/回車符而一直阻塞
以上為個人經(jīng)驗,希望能給大家一個參考,也希望大家多多支持腳本之家。
相關(guān)文章
零基礎(chǔ)搭建boot+MybatisPlus的詳細教程
這篇文章主要介紹了零基礎(chǔ)搭建boot+MybatisPlus,首先需要創(chuàng)建數(shù)據(jù)庫表和創(chuàng)建boot項目使用mybatisplus操作數(shù)據(jù)庫,本文通過示例代碼給大家介紹的非常詳細,需要的朋友可以參考下2022-03-03Java SpringBoot集成ChatGPT實現(xiàn)AI聊天
ChatGPT已經(jīng)組件放開了,現(xiàn)在都可以基于它寫插件了,也許可以用它結(jié)合文字語音開發(fā)一個老人小孩需要的智能的說話陪伴啥的,這篇文章就介紹SpringBoot結(jié)合ChatGPT實現(xiàn)AI聊天感興趣的同學可以借鑒一下2023-04-04Java對象在內(nèi)存中的布局是如何實現(xiàn)的?
Java對象在內(nèi)存中屬于oop-klass二分模型,即對象的實例數(shù)據(jù)和對象類型的元數(shù)據(jù)(字段定義、方法、常量池等元數(shù)據(jù))是分開存儲的.而由于JVM對對象內(nèi)相同寬度的字段分配在一起,所以只要指定了字段類型分配的順序,就可以計算出每種類型字段相對于當前對象的偏移起始位置2021-06-06