久久精品色妇熟妇丰满人妻99,久久久网,和少妇疯狂做爰过程,欧美系列亚洲系列国产系列

廊坊新聞網(wǎng)-主流媒體,廊坊城市門戶

天天播報(bào):怎么提取pdf中的文字和內(nèi)容_怎么提取pdf中的文字

2023-06-04 16:46:06 來源:互聯(lián)網(wǎng)


(資料圖)

1、Pdf轉(zhuǎn)化word 1. 第一步:先用Adobe Reader打開想轉(zhuǎn)換的PDF文件,接下來選擇“文件→打印”菜單,在打開的“打印”窗口中將“打印機(jī)”欄中的“名稱”設(shè)置為“Microsoft Office Document Image Writer”,確認(rèn)后將該P(yáng)DF文件輸出為MDI格式的虛擬打印文件。

2、 第二步:運(yùn)行Microsoft Office Document Imaging,并利用它來打開剛才保存的MDI文件,選擇“工具→將文本發(fā)送到Word”菜單,在彈出的窗口中選中“在輸出時(shí)保持圖片版式不變”,確認(rèn)后系統(tǒng)會(huì)提示“必須在執(zhí)行此操作前重新運(yùn)行OCR。

3、這可能需要一些時(shí)間”,不管它,確認(rèn)即可。

4、 2. 情況一:如果pdf文檔本身就是用pagemaker或word轉(zhuǎn)換而來的(文字非常清晰銳利,很容易識(shí)別),那你就方便了。

5、你可以先用acrobat打開,然后點(diǎn)文件——>另存為——>把他保存成rtf文檔,這樣將把所有的pdf頁保存成rtf文檔,在用word打開。

6、注意最好保存成rtf文檔,要不很有可能產(chǎn)生亂碼。

7、小技巧:如果你只想識(shí)別pdf文件中的其中幾頁,那你可以現(xiàn)把那幾頁另存為新的pdf文檔,再進(jìn)行識(shí)別。

8、Ny1 情況二:如果你所得到的pdf文檔是用掃描儀掃進(jìn)去的圖片轉(zhuǎn)換的,那么就麻煩了,不過還是比手輸入快多了,所以繼續(xù)往下看。

9、首先你用acrobat把pdf文件打開,然后點(diǎn)文件——>另存為——>把他保存成圖片格式*.tiff(這是無壓縮圖片格式,以便識(shí)別),然后到網(wǎng)上下載文字識(shí)別軟件,建議用尚書六號(hào)(現(xiàn)在好像出到七號(hào)了,很有名,隨處都可以下到),安裝好后,打開轉(zhuǎn)換好的tiff圖片,點(diǎn)擊識(shí)別,看,文字出來了吧,尚書系列文字識(shí)別軟件功能十分強(qiáng)大,你可以在里面把文字都編輯好了,再保存成rtf或txt文件,然后粘貼到word里就可以使用了,注意過濾回車符。

本文到此分享完畢,希望對(duì)大家有所幫助。

關(guān)鍵詞: