欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

使用NOPI讀取Word、Excel文檔內(nèi)容

 更新時(shí)間:2018年03月23日 16:07:01   作者:馬洪彪  
這篇文章主要為大家詳細(xì)介紹了使用NOPI讀取Word、Excel文檔內(nèi)容的方法,具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下

使用NOPI讀取Excel的例子很多,讀取Word的例子不多。

Excel的解析方式有多中,可以使用ODBC查詢,把Excel作為一個(gè)數(shù)據(jù)集對待。也可以使用文檔結(jié)構(gòu)模型的方式進(jìn)行解析,即解析Workbook(工作簿)、Sheet、Row、Column。

Word的解析比較復(fù)雜,因?yàn)閃ord的文檔結(jié)構(gòu)模型定義較為復(fù)雜。解析Word或者Excel,關(guān)鍵是理解Word、Excel的文檔對象模型。

Word、Excel文檔對象模型的解析,可以通過COM接口調(diào)用,此類方式使用較廣。(可以錄制宏代碼,然后替換為對應(yīng)的語言)

也可以使用XML模型解析,尤其是對于2007、2010版本的文檔的解析。

using NPOI.POIFS.FileSystem;
using NPOI.SS.UserModel;
using NPOI.XSSF.UserModel;
using NPOI.XWPF.UserModel;
using System;
using System.Collections.Generic;
using System.Configuration;
using System.IO;
using System.Text;

namespace eyuan
{
  public static class NOPIHandler
  {
    /// <summary>
    /// 
    /// </summary>
    /// <param name="fileName"></param>
    /// <returns></returns>
    public static List<List<List<string>>> ReadExcel(string fileName)
    {
      //打開Excel工作簿
      XSSFWorkbook hssfworkbook = null;
      try
      {
        using (FileStream file = new FileStream(fileName, FileMode.Open, FileAccess.Read))
        {
          hssfworkbook = new XSSFWorkbook(file);
        }
      }
      catch (Exception e)
      {
        LogHandler.LogWrite(string.Format("文件{0}打開失敗,錯(cuò)誤:{1}", new string[] { fileName, e.ToString() }));
      }
      //循環(huán)Sheet頁
      int sheetsCount = hssfworkbook.NumberOfSheets;
      List<List<List<string>>> workBookContent = new List<List<List<string>>>();
      for (int i = 0; i < sheetsCount; i++)
      {
        //Sheet索引從0開始
        ISheet sheet = hssfworkbook.GetSheetAt(i);
        //循環(huán)行
        List<List<string>> sheetContent = new List<List<string>>();
        int rowCount = sheet.PhysicalNumberOfRows;
        for (int j = 0; j < rowCount; j++)
        {
          //Row(邏輯行)的索引從0開始
          IRow row = sheet.GetRow(j);
          //循環(huán)列(各行的列數(shù)可能不同)
          List<string> rowContent = new List<string>();
          int cellCount = row.PhysicalNumberOfCells;
          for (int k = 0; k < cellCount; k++)
          {
            //ICell cell = row.GetCell(k);
            ICell cell = row.Cells[k];
            if (cell == null)
            {
              rowContent.Add("NIL");
            }
            else
            {
              rowContent.Add(cell.ToString());
              //rowContent.Add(cell.StringCellValue);
            }
          }
          //添加行到集合中
          sheetContent.Add(rowContent);
        }
        //添加Sheet到集合中
        workBookContent.Add(sheetContent);
      }

      return workBookContent;
    }

    /// <summary>
    /// 
    /// </summary>
    /// <param name="fileName"></param>
    /// <returns></returns>
    public static string ReadExcelText(string fileName)
    {
      string ExcelCellSeparator = ConfigurationManager.AppSettings["ExcelCellSeparator"];
      string ExcelRowSeparator = ConfigurationManager.AppSettings["ExcelRowSeparator"];
      string ExcelSheetSeparator = ConfigurationManager.AppSettings["ExcelSheetSeparator"];
      //
      List<List<List<string>>> excelContent = ReadExcel(fileName);
      string fileText = string.Empty;
      StringBuilder sbFileText = new StringBuilder();
      //循環(huán)處理WorkBook中的各Sheet頁
      List<List<List<string>>>.Enumerator enumeratorWorkBook = excelContent.GetEnumerator();
      while (enumeratorWorkBook.MoveNext())
      {

        //循環(huán)處理當(dāng)期Sheet頁中的各行
        List<List<string>>.Enumerator enumeratorSheet = enumeratorWorkBook.Current.GetEnumerator();
        while (enumeratorSheet.MoveNext())
        {

          string[] rowContent = enumeratorSheet.Current.ToArray();
          sbFileText.Append(string.Join(ExcelCellSeparator, rowContent));
          sbFileText.Append(ExcelRowSeparator);
        }
        sbFileText.Append(ExcelSheetSeparator);
      }
      //
      fileText = sbFileText.ToString();
      return fileText;
    }

    /// <summary>
    /// 讀取Word內(nèi)容
    /// </summary>
    /// <param name="fileName"></param>
    /// <returns></returns>
    public static string ReadWordText(string fileName)
    {
      string WordTableCellSeparator = ConfigurationManager.AppSettings["WordTableCellSeparator"];
      string WordTableRowSeparator = ConfigurationManager.AppSettings["WordTableRowSeparator"];
      string WordTableSeparator = ConfigurationManager.AppSettings["WordTableSeparator"];
      //
      string CaptureWordHeader = ConfigurationManager.AppSettings["CaptureWordHeader"];
      string CaptureWordFooter = ConfigurationManager.AppSettings["CaptureWordFooter"];
      string CaptureWordTable = ConfigurationManager.AppSettings["CaptureWordTable"];
      string CaptureWordImage = ConfigurationManager.AppSettings["CaptureWordImage"];
      //
      string CaptureWordImageFileName = ConfigurationManager.AppSettings["CaptureWordImageFileName"];
      //
      string fileText = string.Empty;
      StringBuilder sbFileText = new StringBuilder();

      #region 打開文檔
      XWPFDocument document = null;
      try
      {
        using (FileStream file = new FileStream(fileName, FileMode.Open, FileAccess.Read))
        {
          document = new XWPFDocument(file);
        }
      }
      catch (Exception e)
      {
        LogHandler.LogWrite(string.Format("文件{0}打開失敗,錯(cuò)誤:{1}", new string[] { fileName, e.ToString() }));
      }
      #endregion

      #region 頁眉、頁腳
      //頁眉
      if (CaptureWordHeader == "true")
      {
        sbFileText.AppendLine("Capture Header Begin");
        foreach (XWPFHeader xwpfHeader in document.HeaderList)
        {
          sbFileText.AppendLine(string.Format("{0}", new string[] { xwpfHeader.Text }));
        }
        sbFileText.AppendLine("Capture Header End");
      }
      //頁腳
      if (CaptureWordFooter == "true")
      {
        sbFileText.AppendLine("Capture Footer Begin");
        foreach (XWPFFooter xwpfFooter in document.FooterList)
        {
          sbFileText.AppendLine(string.Format("{0}", new string[] { xwpfFooter.Text }));
        }
        sbFileText.AppendLine("Capture Footer End");
      }
      #endregion

      #region 表格
      if (CaptureWordTable == "true")
      {
        sbFileText.AppendLine("Capture Table Begin");
        foreach (XWPFTable table in document.Tables)
        {
          //循環(huán)表格行
          foreach (XWPFTableRow row in table.Rows)
          {
            foreach (XWPFTableCell cell in row.GetTableCells())
            {
              sbFileText.Append(cell.GetText());
              //
              sbFileText.Append(WordTableCellSeparator);
            }

            sbFileText.Append(WordTableRowSeparator);
          }
          sbFileText.Append(WordTableSeparator);
        }
        sbFileText.AppendLine("Capture Table End");
      }
      #endregion

      #region 圖片
      if (CaptureWordImage == "true")
      {
        sbFileText.AppendLine("Capture Image Begin");
        foreach (XWPFPictureData pictureData in document.AllPictures)
        {
          string picExtName = pictureData.suggestFileExtension();
          string picFileName = pictureData.GetFileName();
          byte[] picFileContent = pictureData.GetData();
          //
          string picTempName = string.Format(CaptureWordImageFileName, new string[] { Guid.NewGuid().ToString() + "_" + picFileName + "." + picExtName });
          //
          using (FileStream fs = new FileStream(picTempName, FileMode.Create, FileAccess.Write))
          {
            fs.Write(picFileContent, 0, picFileContent.Length);
            fs.Close();
          }
          //
          sbFileText.AppendLine(picTempName);
        }
        sbFileText.AppendLine("Capture Image End");
      }
      #endregion

      //正文段落
      sbFileText.AppendLine("Capture Paragraph Begin");
      foreach (XWPFParagraph paragraph in document.Paragraphs)
      {
        sbFileText.AppendLine(paragraph.ParagraphText);

      }
      sbFileText.AppendLine("Capture Paragraph End");
      //

      //
      fileText = sbFileText.ToString();
      return fileText;
    }


  }
}

以上就是本文的全部內(nèi)容,希望對大家的學(xué)習(xí)有所幫助,也希望大家多多支持腳本之家。

相關(guān)文章

  • 分析C# Dictionary的實(shí)現(xiàn)原理

    分析C# Dictionary的實(shí)現(xiàn)原理

    對于C#中的Dictionary類相信大家都不陌生,這是一個(gè)Collection(集合)類型,可以通過Key/Value(鍵值對的形式來存放數(shù)據(jù);該類最大的優(yōu)點(diǎn)就是它查找元素的時(shí)間復(fù)雜度接近O(1)。那么什么樣的設(shè)計(jì)能使得Dictionary類實(shí)現(xiàn)O(1)的時(shí)間復(fù)雜度呢
    2021-06-06
  • LINQ基礎(chǔ)之Join和UNION子句

    LINQ基礎(chǔ)之Join和UNION子句

    這篇文章介紹了LINQ使用Join和UNION子句的方法,文中通過示例代碼介紹的非常詳細(xì)。對大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下
    2022-04-04
  • C#實(shí)現(xiàn)winform用子窗體刷新父窗體及子窗體改變父窗體控件值的方法

    C#實(shí)現(xiàn)winform用子窗體刷新父窗體及子窗體改變父窗體控件值的方法

    這篇文章主要介紹了C#實(shí)現(xiàn)winform用子窗體刷新父窗體及子窗體改變父窗體控件值的方法,涉及C#窗體交互的相關(guān)技巧,具有一定參考借鑒價(jià)值,需要的朋友可以參考下
    2015-07-07
  • C#使用ScrapySharp實(shí)現(xiàn)多線程下載操作

    C#使用ScrapySharp實(shí)現(xiàn)多線程下載操作

    在現(xiàn)代互聯(lián)網(wǎng)應(yīng)用中,數(shù)據(jù)抓取是一個(gè)常見的需求,無論是為了數(shù)據(jù)分析、內(nèi)容聚合還是自動化測試,ScrapySharp 是一個(gè)基于 .NET 的輕量級、高性能的網(wǎng)頁抓取庫,本文將探討如何在 C# 中使用 ScrapySharp 實(shí)現(xiàn)多線程下載策略,需要的朋友可以參考下
    2024-08-08
  • C#常用知識點(diǎn)簡單回顧(有圖有真相)

    C#常用知識點(diǎn)簡單回顧(有圖有真相)

    C#知識點(diǎn)記錄編程的點(diǎn)點(diǎn)滴滴,本文整理了一些(傳值調(diào)用與引用調(diào)用/打印三角形/遞歸求階乘/多態(tài)性..等等),感興趣的朋友可以了解下的,不要走開(有圖有真相)
    2013-01-01
  • Unity后處理效果之邊角壓暗

    Unity后處理效果之邊角壓暗

    這篇文章主要為大家詳細(xì)介紹了Unity后處理效果之邊角壓暗,文中示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下
    2021-03-03
  • C#實(shí)現(xiàn)利用反射簡化給類字段賦值的方法

    C#實(shí)現(xiàn)利用反射簡化給類字段賦值的方法

    這篇文章主要介紹了C#實(shí)現(xiàn)利用反射簡化給類字段賦值的方法,涉及C#操作反射的相關(guān)技巧,需要的朋友可以參考下
    2015-05-05
  • C#實(shí)現(xiàn)基于ffmpeg加虹軟的人臉識別的示例

    C#實(shí)現(xiàn)基于ffmpeg加虹軟的人臉識別的示例

    本篇文章主要介紹了C#實(shí)現(xiàn)基于ffmpeg加虹軟的人臉識別的示例,小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,也給大家做個(gè)參考。一起跟隨小編過來看看吧
    2017-10-10
  • C# 填充Excel圖表、圖例背景色的實(shí)例代碼

    C# 填充Excel圖表、圖例背景色的實(shí)例代碼

    下面的內(nèi)容將分別介紹通過C#來設(shè)置Excel中圖表背景色、以及圖表中的圖例背景色的方法,需要的朋友可以參考下
    2019-04-04
  • C#編程實(shí)現(xiàn)Excel文檔中搜索文本內(nèi)容的方法及思路

    C#編程實(shí)現(xiàn)Excel文檔中搜索文本內(nèi)容的方法及思路

    有了在Word文檔中編程實(shí)現(xiàn)搜索文本的經(jīng)驗(yàn),在Excel中實(shí)現(xiàn)這個(gè)功能也并非難事。
    2013-07-07

最新評論