欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

java正則匹配讀取txt文件提取特定開頭和結(jié)尾的字符串

 更新時間:2022年11月29日 12:37:44   作者:黑白極客  
通常我們可以直接通過文件流來讀取txt文件的內(nèi)容,但有時候也會遇到問題,下面這篇文章主要給大家介紹了關(guān)于java正則匹配讀取txt文件提取特定開頭和結(jié)尾的字符串的相關(guān)資料,需要的朋友可以參考下

前言

前天剛?cè)肼毜乃惴ㄍ?,過來問我怎么提取txt文件中的數(shù)據(jù),我一看這還不簡單,結(jié)果…搞了好久。

正則不用真的會忘記,寫篇博客增加一下記憶吧。

需求:提取txt文件中,有特定開頭(雙引號) ,特定結(jié)尾(雙引號) 的中間的數(shù)據(jù),打印出來

一、使用FileInputStream處理

FileInputStream:是java中的字節(jié)輸入流,就是通過字節(jié)的形式進(jìn)行讀取

構(gòu)造方法 可以通過傳遞指定打開文件的路徑字符串,來創(chuàng)建FileInputStrem對象

new FileInputStrem("文件路徑")  

InputStremReader 是連接字節(jié)流和字符流之間的橋梁,我們通過 new InputStremReader() 的構(gòu)造方法,傳遞一個FileInputStrem對象,和一個編碼格式,這個編碼格式具體根據(jù)你要讀取文件的編碼格式

InputStreamReader(file,"UTF-8");

編碼格式可以打開txt文件在右下角查看

// 這里利用了一下小技巧就是 我這個同事給我的文件 每個要提取的數(shù)據(jù)都在同一行內(nèi),所以可以通過每行讀取。

        while ((line = br.readLine()) != null) {
            System.out.println(getPatternCode(line,rgex));
        }

二、使用正則開始匹配

1.匹配規(guī)則書寫

正則表達(dá)式匹配規(guī)則 這里是以 (ox) 開始 以“ 結(jié)尾
這里的第一對括號防止防止轉(zhuǎn)義 所以加了\
然后()表示一個子表達(dá)式的開始和結(jié)尾 要匹配這兩個字符的話 就用上面的\
.表示匹配任意
*表示匹配任意多個
\” 表示匹配最后字符
這里的規(guī)則大概就是這樣,可以根據(jù)需要自己匹配

String rgex = "\\(0x\\)(.*?)\"";

2.pattern

pattern是正則表達(dá)式的編譯形式 匹配的模式
Pattern.compile 是獲取Pattern實例,Pattern的構(gòu)造器是私有的,只能通過compile方法獲取

Pattern pattern = Pattern.compile(rgex);

matcher類也是私有的,只能通過pattern.matcher來創(chuàng)建,
構(gòu)造方法傳遞一個參數(shù)時,返回一個matcher實例,是匹配上的字符串
構(gòu)造方法傳遞兩個參數(shù)時,返回一個boolean值,表示是否匹配上指定的字符串

Matcher m = pattern.matcher(string);

m.find() 是部分匹配,
從給定的字符串開始匹配,第一次匹配到之后 如果沒有重置,則會從上次匹配到的最后一個字符的下一位開始往后匹配
匹配成功后會返回 true

m.find()

m.group() 是返回匹配的數(shù)據(jù)
group(0) 是返回原始匹配的數(shù)據(jù)
group(1) 是返回第一次匹配到的數(shù)據(jù)

m.group(1);

代碼案例

package fileOperation;

import java.io.*;
import java.util.regex.Matcher;
import java.util.regex.Pattern;

/**
 * @program: solution
 * @description: 讀取文件 利用正則表達(dá)式篩選數(shù)據(jù)
 * @author: Wang Hai Xin
 * @create: 2022-10-24 18:52
 **/
public class txtFiltration {

    public static void main(String[] args) throws IOException {
        /**/
        FileInputStream file = new FileInputStream("C:\\project\\solution\\src\\main\\java\\fileOperation\\djk-Log 2022-10-21 17_48_06.txt");
        /*指定文件類型*/
        InputStreamReader isr = new InputStreamReader(file, "UTF-8");

        BufferedReader br = new BufferedReader(isr);

        /*匹配規(guī)則*/
        String rgex = "\\(0x\\)(.*?)\"";

        String line = null;
        while ((line = br.readLine()) != null) {
            System.out.println(getPatternCode(line,rgex));
        }
    }
    
    public static String getPatternCode(String string, String rgex){
        // 匹配的模式
        Pattern pattern = Pattern.compile(rgex);
        Matcher m = pattern.matcher(string);
        while (m.find()) {
            return m.group(1);
        }
        return null;
    }
}

效果展示,直接將結(jié)果從控制臺復(fù)制使用即可

注意:控制臺展示的數(shù)目有限,如果出現(xiàn)前半部分丟失, 可能是控制臺展示的數(shù)據(jù)達(dá)到上限,可以通過輸出到指定文件或者exel文件中

總結(jié) 

到此這篇關(guān)于java正則匹配讀取txt文件提取特定開頭和結(jié)尾的字符串的文章就介紹到這了,更多相關(guān)java提取txt文件中指定內(nèi)容內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

相關(guān)文章

最新評論