|
|
“PDF圖像OCR識別系統(tǒng)”助推中國電子政務(wù) |
|
|
|
|
2007-08-09 記者:周文林 來源:經(jīng)濟(jì)參考報(bào) |
|
|
本報(bào)訊
針對政府機(jī)構(gòu)中大量PDF文檔無法編輯、拷貝和檢索的難題,,近日,,漢王科技推出了“PDF圖像OCR識別系統(tǒng)”。業(yè)內(nèi)專家普遍認(rèn)為,,它的推出使得PDF文檔無法編輯,、拷貝和檢索的難題迎刃而解,將有助于推動中國電子政務(wù)的快速發(fā)展,。 隨著電子政務(wù),、辦公自動化OA工程的全面實(shí)施,“無紙化”辦公的趨勢已經(jīng)不可阻擋,。目前,,在國家各級政府的電子政務(wù)網(wǎng)絡(luò)里,,以PDF為格式的電子文檔得到了廣泛應(yīng)用,全面取代了之前的傳統(tǒng)方式,。大量的政府文檔,、通知、檔案資料,、財(cái)務(wù)報(bào)表都以PDF格式存儲,、傳輸、流轉(zhuǎn),、交換和下發(fā),。相比較而言,PDF具有許多其他電子文檔格式無法相比的優(yōu)點(diǎn),,如完全保持紙質(zhì)文檔原樣,,存貯空間小,便于網(wǎng)絡(luò)傳輸?shù)取?
然而,,作為一種“圖像”格式,,PDF的“只讀”特性使其只能“看”,卻無法進(jìn)行文本編輯,、拷貝和引用,,PDF文檔之間也無法相互引用和檢索。這樣大量文檔只能是一堆“死”的文字,,而不是可應(yīng)用的“流動”信息,。面對不同部門、不同內(nèi)容的PDF文檔,,如果要拷貝,、檢索、整理和歸類,,需要花費(fèi)大量的人力和物力用人工方式重新整理錄入,。 據(jù)悉,新推出的識別系統(tǒng)使政府機(jī)構(gòu)多版本的PDF文檔能成為單一的文本格式,。該系統(tǒng)不但可以整合不同機(jī)構(gòu),、部門的分類信息,打破傳統(tǒng)行政機(jī)關(guān)時間,、空間和部門分隔的制約,,使各級政府的各項(xiàng)監(jiān)管工作更加嚴(yán)密,服務(wù)更加便捷,,而且還加強(qiáng)了對檔案進(jìn)行科學(xué)且高效管理的能力,,能充分實(shí)現(xiàn)各類信息的在線檢索、查詢、瀏覽和閱讀功能,,從而為海量信息的交叉檢索,、深度內(nèi)容的進(jìn)一步發(fā)掘和開拓打開了更為廣闊的天地。 業(yè)內(nèi)人士認(rèn)為,,PDF文檔轉(zhuǎn)換文本文檔產(chǎn)品的普及,,將大大加速電子政務(wù)的進(jìn)程。 |
|
|
|
|
|
|