C#讀取word中表格數(shù)據(jù)的方法實現(xiàn)
前些日子有一個項目需要從word文件中取表格數(shù)據(jù)并進行處理,網(wǎng)上大部分方案都是基于office的com組件實現(xiàn),但是這樣有一個缺點,如果電腦里沒有安裝office將無法使用,因為之前操作excel都是使用的NPOI,所以理所當然的想用NPOI解決此問題。
于是找到了如下代碼
private List<string> GetDoc(string Path)
{
if (Path == "")
return null; //文件路徑為空
List<string> Result = new List<string>(); //結(jié)果容器
FileStream stream = new FileStream(Path, FileMode.Open); //打開流
XWPFDocument docx = new XWPFDocument(stream);
var list = new List<XWPFTableCell>();
//循環(huán)遍歷表格內(nèi)容
foreach (var row in docx.Tables[0].Rows)
{
foreach (var cell in row.GetTableCells())
{
if (!list.Contains(cell))
{
list.Add(cell);
Result.Add(cell.GetText());
}
}
}
stream.Close();
return Result; //關(guān)閉文件流(很關(guān)鍵,否則會導(dǎo)致下一個文件無法大開)
}
但是這樣做又有一個缺點 ,NPOI僅支持.docx格式的文件,如果讀取.doc會直接報錯!
于是后續(xù)又找到了另一開源組件freeSpire。有如下代碼
private List<string> GetDocX(string Path)
{
if (Path == "")
return null; //文件路徑為空
List<string> Result = new List<string>();
Spire.Doc.Document doc = new Spire.Doc.Document();
doc.LoadFromFile(Path);
TextBox textbox = doc.TextBoxes[0];
Spire.Doc.Table table = textbox.Body.Tables[0] as Spire.Doc.Table;
foreach (TableRow row in table.Rows)
{
foreach (TableCell cell in row.Cells)
{
foreach (Paragraph paragraph in cell.Paragraphs)
{
Result.Add(paragraph.Text);
}
}
}
return Result;
}但是不知道什么原因,并不能抓取.doc文件中的表格。

隨后嘗試了其getText()函數(shù)確定可以直接抓取文字內(nèi)容,初步判斷可能是格式問題。

有考慮過自己寫匹配函數(shù)對文本內(nèi)容進行分析,但由于格式過于復(fù)雜,很多通用性問題無法解決后放棄。如果格式不復(fù)雜的話,也不失為一種解決方法。
最后采用的方法是先利用Spire組件將.doc轉(zhuǎn)換為.docx后再利用NPOI進行內(nèi)容處理,效果拔群?。。?/p>
private string ChangeToDocx(string Path)
{
if (Path == "")
return ""; //文件路徑為空
List<string> Result = new List<string>();
Spire.Doc.Document doc = new Spire.Doc.Document();
doc.LoadFromFile(Path); //打開文件
Path.Replace(".doc", "docx"); //替換后綴
doc.SaveToFile(Path, FileFormat.Docx); //保存為.doc
return Path;
}主函數(shù)中調(diào)用如下:(若不是.doc則無需轉(zhuǎn)換以節(jié)約開銷)
if (Path.Contains(".doc"))
{
string newPath = ChangeToDocx(Path);
result = GetDoc(newPath);
}
result = GetDoc(Path);到此這篇關(guān)于C#讀取word中表格數(shù)據(jù)的方法實現(xiàn)的文章就介紹到這了,更多相關(guān)C#讀取word數(shù)據(jù)內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
C#訪問C++動態(tài)分配的數(shù)組指針(實例講解)
下面小編就為大家分享一篇C#訪問C++動態(tài)分配的數(shù)組指針(實例講解),具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2017-12-12
C#實現(xiàn)JWT無狀態(tài)驗證的實戰(zhàn)應(yīng)用解析
這篇文章主要介紹了C#實現(xiàn)JWT無狀態(tài)驗證的實戰(zhàn)應(yīng)用解析,本文給大家介紹的非常詳細,對大家的學(xué)習(xí)或工作具有一定的參考借鑒價值,需要的朋友可以參考下2021-03-03
c# SQLHelper(for winForm)實現(xiàn)代碼
數(shù)據(jù)連接池c# SQLHelper 實現(xiàn)代碼2009-02-02
WPF/Silverlight實現(xiàn)圖片局部放大的方法分析
這篇文章主要介紹了WPF/Silverlight實現(xiàn)圖片局部放大的方法,結(jié)合實例形式分析了WPF/Silverlight針對圖片屬性操作相關(guān)實現(xiàn)技巧,需要的朋友可以參考下2017-03-03

