光學(xué)文字識(shí)別的概念是在1929年由奧地利科學(xué)家Gustav Tauschek最先提出來的 ,后來美國(guó)科學(xué)家Handel也提出了利用技術(shù)對(duì)文字進(jìn)行識(shí)別的想法。而最早對(duì)印刷體漢字識(shí)別進(jìn)行研究的是IBM公司的Casey和Nagy,1966年他們發(fā)表了第一篇關(guān)于漢字識(shí)別的文章,采用了模板匹配法識(shí)別了1000個(gè)印刷體漢字。

早在60、70年代,世界各國(guó)就開始有OCR的研究,而研究的初期,多以文字的識(shí)別方法研究為主,且識(shí)別的文字僅為0至9的數(shù)字。以同樣擁有方塊文字的日本為例,1960年左右開始研究OCR的基本識(shí)別理論,初期以數(shù)字為對(duì)象,直至1965至1970年之間開始有一些簡(jiǎn)單的產(chǎn)品,如印刷文字的郵政編碼識(shí)別系統(tǒng),識(shí)別郵件上的郵政編碼,幫助郵局作區(qū)域分信的作業(yè);也因此至今郵政編碼一直是各國(guó)所倡導(dǎo)的地址書寫方式。

20世紀(jì)70年代初,日本的學(xué)者開始研究漢字識(shí)別,并做了大量的工作。中國(guó)在OCR技術(shù)方面的研究工作起步較晚,在70年代才開始對(duì)數(shù)字、英文字母及符號(hào)的識(shí)別進(jìn)行研究,70年代末開始進(jìn)行漢字識(shí)別的研究,到1986年漢字識(shí)別的研究進(jìn)入一個(gè)實(shí)質(zhì)性的階段,不少研究單位相繼推出了中文OCR產(chǎn)品.早期的OCR軟件,由于識(shí)別率及產(chǎn)品化等多方面的因素,未能達(dá)到實(shí)際要求。同時(shí),由于硬件設(shè)備成本高,運(yùn)行速度慢,也沒有達(dá)到實(shí)用的程度。只有個(gè)別部門,如信息部門、新聞出版單位等使用OCR軟件。1986年以后我國(guó)的OCR研究有了很大進(jìn)展,在漢字建模和識(shí)別方法上都有所創(chuàng)新,在系統(tǒng)研制和開發(fā)應(yīng)用中都取得了豐碩的成果,不少單位相繼推出了中文OCR產(chǎn)品。進(jìn)入20世紀(jì)90年代以后,隨著平臺(tái)式掃描儀的廣泛應(yīng)用,以及我國(guó)信息自動(dòng)化和辦公自動(dòng)化的普及,大大推動(dòng)了OCR技術(shù)的進(jìn)一步發(fā)展,使OCR的識(shí)別正確率、識(shí)別速度滿足了廣大用戶的要求。

OCR字符識(shí)別造價(jià)信息

市場(chǎng)價(jià) 信息價(jià) 詢價(jià)
材料名稱 規(guī)格/型號(hào) 市場(chǎng)價(jià)
(除稅)
工程建議價(jià)
(除稅)
行情 品牌 單位 稅率 供應(yīng)商 報(bào)價(jià)日期
字符顯示終端 品種:字符顯示終端;型號(hào):P3.75;產(chǎn)品說明:P3.75 LED電子雙色屏; 查看價(jià)格 查看價(jià)格

藍(lán)普

m2 13% 云南勇恒科技有限公司
字符疊加器 TC-9101 查看價(jià)格 查看價(jià)格

天地偉業(yè)

臺(tái) 13% 南京天地偉業(yè)數(shù)碼科技有限公司
字符疊加器 TC-9304 查看價(jià)格 查看價(jià)格

臺(tái) 13% 天津天地偉業(yè)數(shù)碼科技有限公司(四川銷售)
字符疊加器 TC-9316 查看價(jià)格 查看價(jià)格

臺(tái) 13% 天津天地偉業(yè)數(shù)碼科技有限公司(四川銷售)
字符疊加器 9304 查看價(jià)格 查看價(jià)格

臺(tái) 13% 天津市嘉安電子技術(shù)有限公司吉林辦事處
字符疊加器 9316 查看價(jià)格 查看價(jià)格

臺(tái) 13% 天津市嘉安電子技術(shù)有限公司吉林辦事處
字符疊加器 WS-DJ1616 查看價(jià)格 查看價(jià)格

臺(tái) 13% 深圳市澳科森電子有限公司
字符疊加器 TC-9316-4H 查看價(jià)格 查看價(jià)格

臺(tái) 13% 大連天地偉業(yè)數(shù)碼科技有限公司
材料名稱 規(guī)格/型號(hào) 除稅
信息價(jià)
含稅
信息價(jià)
行情 品牌 單位 稅率 地區(qū)/時(shí)間
制作地標(biāo).字符 貼附式 大型、小型、箭頭等 查看價(jià)格 查看價(jià)格

m2 東莞市2017年4月信息價(jià)
制作地標(biāo).字符 貼附式 大型、小型、箭頭等 查看價(jià)格 查看價(jià)格

m2 東莞市2017年3月信息價(jià)
制作地標(biāo).字符 大型、小型、箭頭等 查看價(jià)格 查看價(jià)格

m2 東莞市2017年1月信息價(jià)
制作地標(biāo).字符 貼附式 大型、小型、箭頭等 查看價(jià)格 查看價(jià)格

m2 東莞市2016年12月信息價(jià)
制作地標(biāo).字符 貼附式 大型、小型、箭頭等 查看價(jià)格 查看價(jià)格

m2 東莞市2016年7月信息價(jià)
制作地標(biāo).字符 大型、小型、箭頭等 查看價(jià)格 查看價(jià)格

m2 東莞市2016年5月信息價(jià)
制作地標(biāo).字符 大型、小型、箭頭等 查看價(jià)格 查看價(jià)格

m2 東莞市2016年4月信息價(jià)
制作地標(biāo).字符 大型、小型、箭頭等 查看價(jià)格 查看價(jià)格

m2 東莞市2016年3月信息價(jià)
材料名稱 規(guī)格/需求量 報(bào)價(jià)數(shù) 最新報(bào)價(jià)
(元)
供應(yīng)商 報(bào)價(jià)地區(qū) 最新報(bào)價(jià)時(shí)間
快速?zèng)_洗接頭DN32OCr18Ni9 快速?zèng)_洗接頭DN32OCr18Ni9|1個(gè) 3 查看價(jià)格 上海菲航閥門制造有限公司 四川  達(dá)州市 2017-06-13
號(hào)牌識(shí)別軟件能識(shí)別漢字、顏色、字符 識(shí)別漢字、顏色、字符|41套 1 查看價(jià)格 深圳市索威爾科技開發(fā)有限公司 廣東  惠州市 2010-11-09
歷史文化文字雕刻 (1)歷史文化文字雕刻 (2)位置:海船觀景臺(tái)側(cè)壁 (3)材|40m2 3 查看價(jià)格 佛山大衛(wèi)雕塑有限公司 廣東  深圳市 2020-10-21
OCR證件閱讀器 3mm;圖像分辨率:不小于300DPI;色彩深度:24位真彩色;圖像格式:BMP,JPEG,JPEG2000;光源:可見光,紅外光(B900),紫外光(UVA);OCR識(shí)別:可識(shí)別符合ICAO9303文件|20套 1 查看價(jià)格 盛視科技股份有限公司 全國(guó)   2018-11-08
歷史模型 詳見線下技術(shù)要求文件|1套 2 查看價(jià)格 北京紫光基業(yè)科教設(shè)備有限公司 廣東   2022-05-24
歷史 鋼管結(jié)構(gòu)框架,雙面面封5mm鐵板雕空年份,做舊工藝處理表面,3m×2m5厘亞克力字畫框;3mm亞克力UV500mm×400mm;底座20mm厚鐵板預(yù)埋,1350mm×2400mm×765mm×|1組 3 查看價(jià)格 廣東恒創(chuàng)標(biāo)識(shí)廣告有限公司 廣東   2022-10-27
歷史 包括:23 "寬屏液晶顯示器/E2314H/192cm 1080/16:9內(nèi)含如下:DS-ⅠIntel至強(qiáng)四核2.8GHz/2GDDR31600MHz/500GSATA7200/DVDRW/四網(wǎng)口/512M獨(dú)顯(支持雙屏)/USB鍵鼠/XPE/22"寬屏顯示器/三年上門|2面 3 查看價(jià)格 北京均友科技有限公司 全國(guó)   2018-03-20
歷史存儲(chǔ)主服務(wù)器(集群管理) 歷史存儲(chǔ)主服務(wù)器(集群管理)|6個(gè) 2 查看價(jià)格 廣聯(lián)達(dá)科技股份有限公司 全國(guó)   2022-07-19

編輯本段軟件結(jié)構(gòu)由于掃描儀的普及與廣泛應(yīng)用,OCR軟件只需提供與掃描儀的接口,利用掃描儀驅(qū)動(dòng)軟件即可。因此,OCR軟件主要是由下面幾個(gè)部分組成。

1. 圖像輸入、預(yù)處理:

2. 圖像輸入:對(duì)于不同的圖像格式,有著不同的存儲(chǔ)格式,不同的壓縮方式。預(yù)處理:主要包括二值化,噪聲去除,傾斜較正等

3. 二值化:

對(duì)攝像頭拍攝的圖片,大多數(shù)是彩色圖像,彩色圖像所含信息量巨大,對(duì)于圖片的內(nèi)容,我們可以簡(jiǎn)單的分為前景與背景,為了讓計(jì)算機(jī)更快的,更好的識(shí)別文字,我們需要先對(duì)彩色圖進(jìn)行處理,使圖片只前景信息與背景信息,可以簡(jiǎn)單的定義前景信息為黑色,背景信息為白色,這就是二值化圖了。

4. 噪聲去除:

對(duì)于不同的文檔,我們對(duì)噪聲的定義可以不同,根據(jù)噪聲的特征進(jìn)行去噪,就叫做噪聲去除

5. 傾斜較正:

由于一般用戶,在拍照文檔時(shí),都比較隨意,因此拍照出來的圖片不可避免的產(chǎn)生傾斜,這就需要文字識(shí)別軟件進(jìn)行較正。

6. 版面分析:

將文檔圖片分段落,分行的過程就叫做版面分析,由于實(shí)際文檔的多樣性,復(fù)雜性,因此,還沒有一個(gè)固定的,最優(yōu)的切割模型。

7. 字符切割:

由于拍照條件的限制,經(jīng)常造成字符粘連,斷筆,因此極大限制了識(shí)別系統(tǒng)的性能,這就需要文字識(shí)別軟件有字符切割功能。

8. 字符識(shí)別:

這一研究,已經(jīng)是很早的事情了,比較早有模板匹配,后來以特征提取為主,由于文字的位移,筆畫的粗細(xì),斷筆,粘連,旋轉(zhuǎn)等因素的影響,極大影響特征的提取的難度。

9. 版面恢復(fù):

人們希望識(shí)別后的文字,仍然像原文檔圖片那樣排列著,段落不變,位置不變,順序不變,的輸出到word文檔,pdf文檔等,這一過程就叫做版面恢復(fù)。

10. 后處理、校對(duì):

根據(jù)特定的語(yǔ)言上下文的關(guān)系,對(duì)識(shí)別結(jié)果進(jìn)行較正,就是后處理。

編輯本段工作流程一個(gè)OCR識(shí)別系統(tǒng),其目的很簡(jiǎn)單,只是要把影像作一個(gè)轉(zhuǎn)換,使影像內(nèi)的圖形繼續(xù)保存、有表格則表格內(nèi)資料及影像內(nèi)的文字,一律變成計(jì)算機(jī)文字,使能達(dá)到影像資料的儲(chǔ)存量減少、識(shí)別出的文字可再使用及分析,當(dāng)然也可節(jié)省因鍵盤輸入的人力與時(shí)間。

從影像到結(jié)果輸出,須經(jīng)過影像輸入、影像前處理、文字特征抽取、比對(duì)識(shí)別、最后經(jīng)人工校正將認(rèn)錯(cuò)的文字更正,將結(jié)果輸出。國(guó)內(nèi)最有實(shí)力的OCR字符識(shí)別公司有:云脈OCR, 漢王OCR等。

OCR字符識(shí)別由來歷史常見問題

  • 破解版OCR

    已發(fā),請(qǐng)查收!

  • 鐵四指的歷史由來

    在兵器歷史上最早出現(xiàn)的是帶刺或刃的拳劍,歐洲文藝復(fù)興之前,許多盜賊、刺客、角斗士、拳法師、和間諜常用的武器,體積小,易于匿藏,使用方便,拳刃這種武器主要是用來配合拳術(shù)的,使打出的拳頭裝上利刃,增強(qiáng)殺傷...

  • 找不回來歷史工程了

    那你這樣就是沒有辦法了,如果需要只能重做

OCR字符識(shí)別由來歷史文獻(xiàn)

基于BP神經(jīng)網(wǎng)絡(luò)的金屬材料字符識(shí)別研究 基于BP神經(jīng)網(wǎng)絡(luò)的金屬材料字符識(shí)別研究

格式:pdf

大?。?span id="jxolm6f" class="single-tag-height">77KB

頁(yè)數(shù): 3頁(yè)

評(píng)分: 4.5

字符識(shí)別是模式識(shí)別領(lǐng)域的一項(xiàng)傳統(tǒng)課題,其內(nèi)容是模式識(shí)別領(lǐng)域中很多課題的基本內(nèi)容。人工神經(jīng)網(wǎng)絡(luò)的出現(xiàn)為字符識(shí)別的研究提供了一種新的手段,BP神經(jīng)網(wǎng)絡(luò)(Back Propagation Neural Network)作為人工神經(jīng)網(wǎng)絡(luò)的一個(gè)分支,現(xiàn)已成為其最廣泛的應(yīng)用。本文以三層BP網(wǎng)絡(luò)作為模型,并將其應(yīng)用于對(duì)金屬角鐵上的字符識(shí)別。由于角鐵字符為數(shù)字與英文字母混合,文中在對(duì)傳統(tǒng)的BP算法進(jìn)行了改進(jìn)的基礎(chǔ)上,采用了分組神經(jīng)網(wǎng)絡(luò)的設(shè)計(jì)方法,取得了良好的識(shí)別效果。

立即下載
MER方法在工程圖紙字符識(shí)別中的算法研究與應(yīng)用 MER方法在工程圖紙字符識(shí)別中的算法研究與應(yīng)用

格式:pdf

大?。?span id="r9xu66g" class="single-tag-height">77KB

頁(yè)數(shù): 2頁(yè)

評(píng)分: 4.4

如何把數(shù)字圖像中各種長(zhǎng)度和角度書寫的字符或字符串統(tǒng)一識(shí)別、組合并校正成歸一化的水平方向,以供后續(xù)準(zhǔn)確的字模識(shí)別,是工程圖紙數(shù)字圖像字符識(shí)別中必須首先解決的問題。應(yīng)用計(jì)算最小鄰接矩形方法來實(shí)現(xiàn)上述目標(biāo),取得了良好效果。

立即下載

由于掃描儀的普及與廣泛應(yīng)用,OCR軟件只需提供與掃描儀的接口,利用掃描儀驅(qū)動(dòng)軟件即可。因此,OCR軟件主要是由下面幾個(gè)部分組成。

1、圖像輸入、預(yù)處理:

圖像輸入:對(duì)于不同的圖像格式,有著不同的存儲(chǔ)格式,不同的壓縮方式。預(yù)處理:主要包括二值化,噪聲去除,傾斜較正等

2、二值化:

對(duì)攝像頭拍攝的圖片,大多數(shù)是彩色圖像,彩色圖像所含信息量巨大,對(duì)于圖片的內(nèi)容,我們可以簡(jiǎn)單的分為前景與背景,為了讓計(jì)算機(jī)更快的,更好的識(shí)別文字,我們需要先對(duì)彩色圖進(jìn)行處理,使圖片只前景信息與背景信息,可以簡(jiǎn)單的定義前景信息為黑色,背景信息為白色,這就是二值化圖了。

3、噪聲去除:

對(duì)于不同的文檔,我們對(duì)噪聲的定義可以不同,根據(jù)噪聲的特征進(jìn)行去噪,就叫做噪聲去除

4、傾斜較正:

由于一般用戶,在拍照文檔時(shí),都比較隨意,因此拍照出來的圖片不可避免的產(chǎn)生傾斜,這就需要文字識(shí)別軟件進(jìn)行較正。

版面分析:

5、將文檔圖片分段落,分行的過程就叫做版面分析,由于實(shí)際文檔的多樣性,復(fù)雜性,因此,還沒有一個(gè)固定的,最優(yōu)的切割模型。

6、字符切割:

由于拍照條件的限制,經(jīng)常造成字符粘連,斷筆,因此極大限制了識(shí)別系統(tǒng)的性能,這就需要文字識(shí)別軟件有字符切割功能。

7、字符識(shí)別:

這一研究,已經(jīng)是很早的事情了,比較早有模板匹配,后來以特征提取為主,由于文字的位移,筆畫的粗細(xì),斷筆,粘連,旋轉(zhuǎn)等因素的影響,極大影響特征的提取的難度。

8、版面恢復(fù):

人們希望識(shí)別后的文字,仍然像原文檔圖片那樣排列著,段落不變,位置不變,順序不變,的輸出到word文檔,pdf文檔等,這一過程就叫做版面恢復(fù)。

9、后處理、校對(duì):

根據(jù)特定的語(yǔ)言上下文的關(guān)系,對(duì)識(shí)別結(jié)果進(jìn)行較正,就是后處理。

開發(fā)一個(gè)OCR文字識(shí)別軟件系統(tǒng),其目的很簡(jiǎn)單,只是要把影像作一個(gè)轉(zhuǎn)換,使影像內(nèi)的圖形繼續(xù)保存、有表格則表格內(nèi)資料及影像內(nèi)的文字,一律變成計(jì)算機(jī)文字,使能達(dá)到影像資料的儲(chǔ)存量減少、識(shí)別出的文字可再使用及分析,當(dāng)然也可節(jié)省因鍵盤輸入的人力與時(shí)間。

從影像到結(jié)果輸出,須經(jīng)過影像輸入、影像前處理、文字特征抽取、比對(duì)識(shí)別、最后經(jīng)人工校正將認(rèn)錯(cuò)的文字更正,將結(jié)果輸出。2100433B

有批量處理功能,避免了單頁(yè)處理的麻煩;支持處理灰度、彩色、黑白三種色彩的BMP、TIF、JPG、PDF多種格式的圖像文件;可識(shí)別簡(jiǎn)體、繁體和英文三種語(yǔ)言;具有簡(jiǎn)單易用的表格識(shí)別功能;具有TXT、RTF、HTM和XLS多種輸出格式,并有所見即所得的版面還原功能。新增打開與識(shí)別PDF文件功能,支持文字型PDF的直接轉(zhuǎn)換和圖像型PDF的OCR識(shí)別,既可以采用OCR的方式將PDF文件轉(zhuǎn)換為可編輯文檔,也可以采用格式轉(zhuǎn)換的方式直接轉(zhuǎn)換文字型PDF文件為RTF文件或文本文件。

光學(xué)文字識(shí)別的概念是在1929年由德國(guó)科學(xué)家Tausheck最先提出來的,后來美國(guó)科學(xué)家Handel也提出了利用技術(shù)對(duì)文字進(jìn)行識(shí)別的想法。而最早對(duì)印刷體漢字識(shí)別進(jìn)行研究的是IBM公司的Casey和Nagy,1966年他們發(fā)表了第一篇關(guān)于漢字識(shí)別的文章,采用了模板匹配法識(shí)別了1000個(gè)印刷體漢字。

早在60、70年代,世界各國(guó)就開始有OCR的研究,而研究的初期,多以文字的識(shí)別方法研究為主,且識(shí)別的文字僅為0至9的數(shù)字。以同樣擁有方塊文字的日本為例,1960年左右開始研究OCR的基本識(shí)別理論,初期以數(shù)字為對(duì)象,直至1965至1970年之間開始有一些簡(jiǎn)單的產(chǎn)品,如印刷文字的郵政編碼識(shí)別系統(tǒng),識(shí)別郵件上的郵政編碼,幫助郵局作區(qū)域分信的作業(yè);也因此至今郵政編碼一直是各國(guó)所倡導(dǎo)的地址書寫方式。

20世紀(jì)70年代初,日本的學(xué)者開始研究漢字識(shí)別,并做了大量的工作。中國(guó)在OCR技術(shù)方面的研究工作起步較晚,在70年代才開始對(duì)數(shù)字、英文字母及符號(hào)的識(shí)別進(jìn)行研究,70年代末開始進(jìn)行漢字識(shí)別的研究,到1986年漢字識(shí)別的研究進(jìn)入一個(gè)實(shí)質(zhì)性的階段,不少研究單位相繼推出了中文OCR產(chǎn)品.早期的OCR軟件,由于識(shí)別率及產(chǎn)品化等多方面的因素,未能達(dá)到實(shí)際要求。同時(shí),由于硬件設(shè)備成本高,運(yùn)行速度慢,也沒有達(dá)到實(shí)用的程度。只有個(gè)別部門,如信息部門、新聞出版單位等使用OCR軟件。

1986年以后我國(guó)的OCR研究有了很大進(jìn)展,在漢字建模和識(shí)別方法上都有所創(chuàng)新,在系統(tǒng)研制和開發(fā)應(yīng)用中都取得了豐碩的成果,不少單位相繼推出了中文OCR產(chǎn)品。

進(jìn)入20世紀(jì)90年代以后,隨著平臺(tái)式掃描儀的廣泛應(yīng)用,以及我國(guó)信息自動(dòng)化和辦公自動(dòng)化的普及,大大推動(dòng)了OCR技術(shù)的進(jìn)一步發(fā)展,使OCR的識(shí)別正確率、識(shí)別速度滿足了廣大用戶的要求。其中以O(shè)CR為科技核心的云脈技術(shù)不斷創(chuàng)新進(jìn)取,研發(fā)了一系列OCR軟件產(chǎn)品,并且運(yùn)用在醫(yī)院,學(xué)校,企業(yè)等各大市場(chǎng)。

OCR字符識(shí)別相關(guān)推薦
  • 相關(guān)百科
  • 相關(guān)知識(shí)
  • 相關(guān)專欄

最新詞條

安徽省政采項(xiàng)目管理咨詢有限公司 數(shù)字景楓科技發(fā)展(南京)有限公司 懷化市人民政府電子政務(wù)管理辦公室 河北省高速公路京德臨時(shí)籌建處 中石化華東石油工程有限公司工程技術(shù)分公司 手持無線POS機(jī) 廣東合正采購(gòu)招標(biāo)有限公司 上海城建信息科技有限公司 甘肅鑫禾國(guó)際招標(biāo)有限公司 燒結(jié)金屬材料 齒輪計(jì)量泵 廣州采陽(yáng)招標(biāo)代理有限公司河源分公司 高鋁碳化硅磚 博洛尼智能科技(青島)有限公司 燒結(jié)剛玉磚 深圳市東海國(guó)際招標(biāo)有限公司 搭建香蕉育苗大棚 SF計(jì)量單位 福建省中億通招標(biāo)咨詢有限公司 泛海三江 威海鼠尾草 Excel 數(shù)據(jù)處理與分析應(yīng)用大全 廣東國(guó)咨招標(biāo)有限公司 甘肅中泰博瑞工程項(xiàng)目管理咨詢有限公司 山東創(chuàng)盈項(xiàng)目管理有限公司 當(dāng)代建筑大師 廣西北纜電纜有限公司 拆邊機(jī) 大山檳榔 上海地鐵維護(hù)保障有限公司通號(hào)分公司 甘肅中維國(guó)際招標(biāo)有限公司 舌花雛菊 華潤(rùn)燃?xì)猓ㄉ虾#┯邢薰? 湖北鑫宇陽(yáng)光工程咨詢有限公司 GB8163標(biāo)準(zhǔn)無縫鋼管 中國(guó)石油煉化工程建設(shè)項(xiàng)目部 韶關(guān)市優(yōu)采招標(biāo)代理有限公司 莎草目 建設(shè)部關(guān)于開展城市規(guī)劃動(dòng)態(tài)監(jiān)測(cè)工作的通知 電梯平層準(zhǔn)確度 廣州利好來電氣有限公司 四川中澤盛世招標(biāo)代理有限公司