漢王 PDF OCR是一款文字識(shí)別類軟件,軟件支持用戶對(duì)PDF文件進(jìn)行OCR識(shí)別,并將識(shí)別文本進(jìn)格式的轉(zhuǎn)換保存。軟件功能強(qiáng)大,支持上百種字體的識(shí)別,并且還支持對(duì)表格進(jìn)行識(shí)別。軟件還支持批處理模式,可一次性導(dǎo)入多個(gè)文件進(jìn)行識(shí)別處理。
軟件功能
●識(shí)別字符
簡(jiǎn)體字符集:國(guó)標(biāo)GB2312-80的全部一、二級(jí)漢字6800多個(gè)。
純英文字符集。
簡(jiǎn)繁字集:除了簡(jiǎn)體漢字外,還可以混識(shí)臺(tái)灣繁體字5400多個(gè)以及香港繁體字和GBK漢字。
●識(shí)別字體種類
能識(shí)別宋體、仿宋、楷、黑、魏碑、隸書、圓體、行楷等一百多種字體,并支持多種字體混排。
●識(shí)別字號(hào)
初號(hào) 小六號(hào)字體。
●表格識(shí)別
可以自動(dòng)判斷、拆分、識(shí)別和還原各種通用型印刷體表格。
軟件特色
漢王OCR文字識(shí)別軟件具有識(shí)別正確率高,識(shí)別速度快的特點(diǎn)。
支持批量處理功能,避免了單頁(yè)處理的麻煩。
支持處理灰度、彩色、黑白三種色彩的BMP、TIF、JPG、PDF多種格式的圖像文件;
可識(shí)別簡(jiǎn)體、繁體和英文三種語(yǔ)言;
具有簡(jiǎn)單易用的表格識(shí)別功能;
具有TXT、RTF、HTM和XLS多種輸出格式,并有所見即所得的版面還原功能。
安裝方法
1、雙擊從本站下載的安裝包,打開安裝向?qū)?,單擊【下一步】?/p>
2、同意許可證協(xié)議,單擊【是】。
3、單擊【瀏覽】選擇軟件安裝位置,單擊【下一步】。
4、耐心等待一下軟件安裝。
5、安裝完成,單擊【完成】就可以使用軟件了。
使用說(shuō)明
1、在主界面任務(wù)欄左上角【文件】選項(xiàng)中選擇打開圖像,快捷鍵Ctrl+O。
2、查找您需要轉(zhuǎn)換的pdf文件,注意:不需要點(diǎn)打開,你只需要選中就行,然后點(diǎn)擊【pdf轉(zhuǎn)換為TXT文件】。
3、選擇你需要轉(zhuǎn)換的頁(yè)面,也就是你pdf文件里邊的內(nèi)容你需要轉(zhuǎn)換的部分,默認(rèn)是全部轉(zhuǎn)換。然后選擇轉(zhuǎn)換后txt文版的保存地址,點(diǎn)擊【瀏覽】選擇文件夾。
4、轉(zhuǎn)換完成,時(shí)間根據(jù)內(nèi)容的多少來(lái)確定。
常見問題
OCR文字識(shí)別技術(shù)是什么?
光學(xué)字符識(shí)別(英語(yǔ):Optical Character Recognition, OCR)是指對(duì)文本資料的圖像文件進(jìn)行分析識(shí)別處理,獲取文字及版面信息的過(guò)程。OCR的概念是在1929年由德國(guó)科學(xué)家Tausheck最先提出來(lái),并申請(qǐng)了專利。后來(lái)美國(guó)科學(xué)家Handel也提出了利用技術(shù)對(duì)文字進(jìn)行識(shí)別的想法。國(guó)內(nèi)最早的OCR商業(yè)應(yīng)用是由中國(guó)科學(xué)家王慶人教授在南開大學(xué)開發(fā)出來(lái)的,并在美國(guó)市場(chǎng)投入商業(yè)使用。
標(biāo)簽: OCR識(shí)別
下載地址
精品推薦
裝機(jī)必備軟件
網(wǎng)友評(píng)論