如何將caj格式Pdf格式轉(zhuǎn)化為Word文件 caj格式Pdf格式轉(zhuǎn)word詳細(xì)教程

從中國文獻(xiàn)網(wǎng)、期刊網(wǎng)、中國知網(wǎng)等下載的資料大多是caj、kdh等格式,只能使用cajviewer查看,不能被修改編輯。網(wǎng)上提供了許多處理這種情況的軟件,但是大多數(shù)處理效率極低。本文將介紹給大家一個簡便、快捷將caj、kdh、pdf等文件轉(zhuǎn)換為word的方法。
工具/原料
CAJViewer 7完整版 (帶OCR組件)
PDF虛擬打印機(jī)(本文以PDF factory 為例)
OCR識別軟件 (本文以ABBYY finereader 9為例)
很多科技文獻(xiàn),論文,都是用 CAJViewer7.0 稱為“電子閱讀器”的一個程序來閱讀的。
但CAJ 文件像 PDF 文件一樣,是些類似圖片格式的文本。這些圖片格式的文本轉(zhuǎn)換成可編輯的真正文本是有點麻煩的。僅僅用“拷貝,粘貼”的辦法,是不行的。需要進(jìn)行一個格式的轉(zhuǎn)換。
需要安裝一個軟件:Office
用 CajViewer 打開所要轉(zhuǎn)的文件,工具欄里選“文件”-“打印”
一般機(jī)器里安裝了Office 之后,會隨著安裝一個虛擬打印機(jī) Microsoft Office Document Imaging,就選擇打印到這個虛擬打印機(jī)上。
先選打印“全部”,然后點“確定”。最后選擇文件保存路徑,但這時,保存的這個文件是 MDI 格式的,打印完后 Microsoft Office Document Imaging 會自動打開你剛才保存的文件。然后在工具欄里選擇“工具”-“將文本發(fā)送到Word” 這樣就可以把 CAJ 格式的文件轉(zhuǎn)變稱為 WORD 格式了。
步驟/方法
1、用CAJviewer 7打開你要轉(zhuǎn)換的文件,如下圖所示如果我們需要第一段的內(nèi)容,那么我們需要點擊CAJViewer 7自帶的OCR功能鍵,如下圖圖中紅色方框框出的按鈕就是OCR識別按鈕(如果你使用的是精簡版的CAJviewer,那么這個按鈕是灰色的,不可用的),我們點擊一下鼠標(biāo)就會變成十字形,然后我們在當(dāng)前頁面上框選出需要的內(nèi)容,稍等一會兒就會彈出一個識別文字的方框,我們可以選擇復(fù)制到剪貼板或者發(fā)送到word,然后關(guān)閉這個識別框就可以了。(OCR識別是有錯誤率的,所以識別后我們需要人工校對)如果我們只需要摘錄一小部分內(nèi)容的話,那么我們用這個方法就可以了,如果想整篇文章都轉(zhuǎn)換成可以編輯的word格式的話,那么我們繼續(xù)往下看。
2、這一步我們的思路是將CAJ、KDH、NH文件轉(zhuǎn)換成PDF,然后再將pdf轉(zhuǎn)換成word格式的方法來轉(zhuǎn)換。那么我們需要現(xiàn)將這樣的文件轉(zhuǎn)成PDF格式。推薦使用PDF虛擬打印機(jī),本文以PDF factory 為例。(PDF Craetor或者foxit 系列軟件的PDF虛擬打印機(jī)可能和CAJviewer 有沖突,轉(zhuǎn)換出來的PDF只有上半頁面,下半個頁面是空白的,所以我這里不推薦大家使用)CAJviewer 軟件菜單 文件----打印------彈出打印界面如上設(shè)置 ,如果你用的是其他的PDF虛擬打印機(jī),選擇相應(yīng)的打印機(jī)即可,其他基本上默認(rèn)就可以,點擊確定,等待轉(zhuǎn)換,然后保存為PDF文件。
3、接下來我們的任務(wù)就是把轉(zhuǎn)換好的PDF文件轉(zhuǎn)成WORD,那么這里我們使用ABBYY finereader這款強(qiáng)大的PDF轉(zhuǎn)換軟件來進(jìn)行OCR轉(zhuǎn)換。(因為從CAJviewer轉(zhuǎn)換過來的PDF文件是圖片形式的PDF文件,所以用其他的PDF轉(zhuǎn)word軟件是無能為力的,必須要帶有OCR功能的轉(zhuǎn)換軟件才可以,這點請大家務(wù)必記住。)我們運行ABBYY finereader軟件,設(shè)置好識別文件的語言種類(可以是多種的)如果不想軟件打開是顯示該頁面,可以勾選“不在顯示此窗口”選項,打開剛才保存的PDF文件,文件自動進(jìn)行OCR識別。
4、識別過程中如果有無法識別部分或者錯誤,軟件有警告提示的。識別完畢后,軟件菜單文件------另存為-------Microsoft word文檔 保存即可。
5、保存以后的WORD文件我們用軟件打開看一下,轉(zhuǎn)換效果如下圖所示:轉(zhuǎn)換的效果基本上還是可以的,版面的還原能力也不錯,剩下的事情就是自己要和原文校核一下,大功告成~~~。
注意事項
文件最后的轉(zhuǎn)換效果和你所用的PDF虛擬打印機(jī)的轉(zhuǎn)換效果有直接的關(guān)系,轉(zhuǎn)換成的PDF文件清晰度越高,最后OCR識別的準(zhǔn)確率越高。
如果你的文件中間包含有大量的數(shù)學(xué)公式、物理公式、三角函數(shù)、各種計算式目前還不能夠被識別,所以這些都需要我們自己用公式編輯器手動輸入,這個也是目前最遺憾的事情。
相關(guān)文章
word怎么單獨導(dǎo)出一頁? word導(dǎo)出部分頁的技巧
在編輯Word文檔時,有時我們只需要導(dǎo)出其中的部分頁面,而不是整個文檔,下面將介紹如何在Word中導(dǎo)出部分頁面2025-04-14問卷星怎么轉(zhuǎn)換成word文檔? 問卷星問卷調(diào)查導(dǎo)出成word的技巧
在日常工作中,我們經(jīng)常需要將問卷星上的問卷內(nèi)容導(dǎo)出為Word格式,以便整理和分析數(shù)據(jù),以下是三種簡單的操作方法2025-04-14word文檔一整頁怎么截屏? word文檔截圖截一張全的圖片技巧
在Word文檔中想將一整頁截屏下來,可以通過使用鍵盤中的Print Screen鍵和Word自帶的截屏功能等多種方法截圖,詳細(xì)如下2025-04-14word開發(fā)工具怎么調(diào)出來? word工具欄添加開發(fā)工具的教程
許多用戶在使用Word時,可能會發(fā)現(xiàn)菜單欄中缺少了“開發(fā)者工具”這一重要選項,這無疑限制了Word的某些高級功能應(yīng)用,詳細(xì)請看下文介紹2025-04-14Word文本框中的數(shù)字和英文字母如何進(jìn)行豎排? word文檔排版技巧
用Word進(jìn)行排版成為我們辦公中的主要方式,偶爾我們也可能會讓文字豎著排版,讓文字豎著排版我們都知道怎么操作,但是如何讓英文字母和數(shù)字也縱向顯示呢?詳細(xì)請看下文介紹2025-03-25word文本框怎么對齊? word多個文本框快速批量對齊的技巧
word中有很多文本框,排列很亂,想要將所有文本框?qū)R,該怎么操作呢?下面我們就來看看詳細(xì)的教程2025-03-21word分欄后如何設(shè)置頁碼? Word同一頁分欄后的文本分別設(shè)置頁碼技巧
在使用Word進(jìn)行文檔排版時,經(jīng)常需要將文檔分欄,并且希望每欄都有不同的頁碼,這種效果在Word默認(rèn)的頁碼樣式中并不存在,需要通過手動插入域來實現(xiàn),以下是詳細(xì)步驟2025-03-13word多級列表怎么修改編號? Word多級列表各級編號格式批量修改技巧
編輯Word長文檔時,為了讓文本之間具有層次性,編號的使用必不可少,那么,對于編號,你會使用了嗎?詳細(xì)如下2025-03-13Word頁面版式設(shè)置:Word創(chuàng)建多級列表常見問題解決辦法
你是否在設(shè)置多級列表時遇到了編號問題?今天來分享創(chuàng)建多級列表的常見問題,別擔(dān)心,這里為你提供全面的解決方案2025-03-13word文檔怎么鎖定排版? 輕松鎖定你的精心布局防止排版錯亂
在 Word 文檔中鎖定排版,防止他人隨意更改格式,可嘗試以下兩種方法,輕松鎖定你的精心布局,詳細(xì)如下文所屬2025-03-11