光學文字識別的概念是在1929年由德國科學家Tausheck最先提出來的,后來美國科學家Handel也提出了利用技術(shù)對文字進行識別的想法。而最早對印刷體漢字識別進行研究的是IBM公司的Casey和Nagy,1966年他們發(fā)表了第一篇關(guān)于漢字識別的文章,采用了模板匹配法識別了1000個印刷體漢字。

早在60、70年代,世界各國就開始有OCR的研究,而研究的初期,多以文字的識別方法研究為主,且識別的文字僅為0至9的數(shù)字。以同樣擁有方塊文字的日本為例,1960年左右開始研究OCR的基本識別理論,初期以數(shù)字為對象,直至1965至1970年之間開始有一些簡單的產(chǎn)品,如印刷文字的郵政編碼識別系統(tǒng),識別郵件上的郵政編碼,幫助郵局作區(qū)域分信的作業(yè);也因此至今郵政編碼一直是各國所倡導(dǎo)的地址書寫方式。

20世紀70年代初,日本的學者開始研究漢字識別,并做了大量的工作。中國在OCR技術(shù)方面的研究工作起步較晚,在70年代才開始對數(shù)字、英文字母及符號的識別進行研究,70年代末開始進行漢字識別的研究,到1986年漢字識別的研究進入一個實質(zhì)性的階段,不少研究單位相繼推出了中文OCR產(chǎn)品.早期的OCR軟件,由于識別率及產(chǎn)品化等多方面的因素,未能達到實際要求。同時,由于硬件設(shè)備成本高,運行速度慢,也沒有達到實用的程度。只有個別部門,如信息部門、新聞出版單位等使用OCR軟件。

1986年以后我國的OCR研究有了很大進展,在漢字建模和識別方法上都有所創(chuàng)新,在系統(tǒng)研制和開發(fā)應(yīng)用中都取得了豐碩的成果,不少單位相繼推出了中文OCR產(chǎn)品。

進入20世紀90年代以后,隨著平臺式掃描儀的廣泛應(yīng)用,以及我國信息自動化和辦公自動化的普及,大大推動了OCR技術(shù)的進一步發(fā)展,使OCR的識別正確率、識別速度滿足了廣大用戶的要求。其中以O(shè)CR為科技核心的云脈技術(shù)不斷創(chuàng)新進取,研發(fā)了一系列OCR軟件產(chǎn)品,并且運用在醫(yī)院,學校,企業(yè)等各大市場。

OCR文字識別造價信息

市場價 信息價 詢價
材料名稱 規(guī)格/型號 市場價
(除稅)
工程建議價
(除稅)
行情 品牌 單位 稅率 供應(yīng)商 報價日期
背景音樂 品種:背景音樂系統(tǒng);說明:含1臺主機、2個喇叭、P3C、套裝; 查看價格 查看價格

LifeSmart云起

13% 昆明全橙智能科技有限公司
背景 H300XW300mm/PG-BJZ003 背景磚系列 查看價格 查看價格

13% 佛山市南海盤古雕塑藝術(shù)工藝廠河南銷售
背景 H200XW200mm/PG-BJZ005 背景磚系列 查看價格 查看價格

13% 佛山市南海盤古雕塑藝術(shù)工藝廠河南銷售
背景 H300XW300mm/PG-BJZ011 背景磚系列 查看價格 查看價格

13% 佛山市南海盤古雕塑藝術(shù)工藝廠河南銷售
背景 H300XW300mm/PG-BJZ001 背景磚系列 查看價格 查看價格

13% 佛山市南海盤古雕塑藝術(shù)工藝廠河南銷售
背景 H300XW300mm/PG-BJZ015 背景磚系列 查看價格 查看價格

13% 佛山市南海盤古雕塑藝術(shù)工藝廠河南銷售
背景 H300XW300mm/PG-BJZ007 背景磚系列 查看價格 查看價格

13% 佛山市南海盤古雕塑藝術(shù)工藝廠河南銷售
背景 H300XW300mm/PG-BJZ006 背景磚系列 查看價格 查看價格

13% 佛山市南海盤古雕塑藝術(shù)工藝廠河南銷售
材料名稱 規(guī)格/型號 除稅
信息價
含稅
信息價
行情 品牌 單位 稅率 地區(qū)/時間
背景音樂系統(tǒng) BJ-FT6408/500(含VCD及500W功放) 查看價格 查看價格

珠海市2005年4月信息價
背景音樂系統(tǒng) BJ-FT6408/500(含VCD及500W功放) 查看價格 查看價格

珠海市2005年3月信息價
背景音樂系統(tǒng) BJ-FT6408/150(含VCD及150W功放) 查看價格 查看價格

珠海市2005年1月信息價
背景音樂系統(tǒng) BJ-FT6408/500(含VCD及500W功放) 查看價格 查看價格

珠海市2005年1月信息價
背景音樂系統(tǒng) BJ-FT6408/500 查看價格 查看價格

湛江市2005年1月信息價
背景音樂系統(tǒng) BJ-FT6408/500(含VCD及500W功放) 查看價格 查看價格

珠海市2005年6月信息價
背景音樂系統(tǒng) BJ-FT6408/150(含VCD及150W功放) 查看價格 查看價格

珠海市2005年5月信息價
背景音樂系統(tǒng) BJ-FT6408/500(含VCD及500W功放) 查看價格 查看價格

珠海市2005年5月信息價
材料名稱 規(guī)格/需求量 報價數(shù) 最新報價
(元)
供應(yīng)商 報價地區(qū) 最新報價時間
歷史文化文字雕刻 (1)歷史文化文字雕刻 (2)位置:海船觀景臺側(cè)壁 (3)材|40m2 3 查看價格 佛山大衛(wèi)雕塑有限公司 廣東  深圳市 2020-10-21
視頻文字識別模塊 按圖片|1臺 1 查看價格 杰創(chuàng)智能科技股份有限公司 廣東   2017-10-20
文字 文字高100、寬90、線寬10|1套 3 查看價格 佛山市虹霞創(chuàng)展廣告燈飾器材有限公司 廣東  韶關(guān)市 2022-06-06
文字 1.文字,按圖紙訂制 2.其他詳見圖紙設(shè)計要求|32個 3 查看價格 廣州點宜點廣告有限公司 廣東  佛山市 2019-03-15
快速沖洗接頭DN32OCr18Ni9 快速沖洗接頭DN32OCr18Ni9|1個 3 查看價格 上海菲航閥門制造有限公司 四川  達州市 2017-06-13
OCR證件閱讀器 3mm;圖像分辨率:不小于300DPI;色彩深度:24位真彩色;圖像格式:BMP,JPEG,JPEG2000;光源:可見光,紅外光(B900),紫外光(UVA);OCR識別:可識別符合ICAO9303文件|20套 1 查看價格 盛視科技股份有限公司 全國   2018-11-08
文字絲印 文字絲印在不銹鋼板面,文字高度為20cm|700個 1 查看價格 中山市東升鎮(zhèn)安達裝飾工程部 廣東  江門市 2015-10-13
文字絲印 文字絲印在不銹鋼板面,文字高度為10cm|500個 1 查看價格 中山市東升鎮(zhèn)安達裝飾工程部 廣東  江門市 2015-10-13

由于掃描儀的普及與廣泛應(yīng)用,OCR軟件只需提供與掃描儀的接口,利用掃描儀驅(qū)動軟件即可。因此,OCR軟件主要是由下面幾個部分組成。

1、圖像輸入、預(yù)處理:

圖像輸入:對于不同的圖像格式,有著不同的存儲格式,不同的壓縮方式。預(yù)處理:主要包括二值化,噪聲去除,傾斜較正等

2、二值化:

對攝像頭拍攝的圖片,大多數(shù)是彩色圖像,彩色圖像所含信息量巨大,對于圖片的內(nèi)容,我們可以簡單的分為前景與背景,為了讓計算機更快的,更好的識別文字,我們需要先對彩色圖進行處理,使圖片只前景信息與背景信息,可以簡單的定義前景信息為黑色,背景信息為白色,這就是二值化圖了。

3、噪聲去除:

對于不同的文檔,我們對噪聲的定義可以不同,根據(jù)噪聲的特征進行去噪,就叫做噪聲去除

4、傾斜較正:

由于一般用戶,在拍照文檔時,都比較隨意,因此拍照出來的圖片不可避免的產(chǎn)生傾斜,這就需要文字識別軟件進行較正。

版面分析:

5、將文檔圖片分段落,分行的過程就叫做版面分析,由于實際文檔的多樣性,復(fù)雜性,因此,還沒有一個固定的,最優(yōu)的切割模型。

6、字符切割:

由于拍照條件的限制,經(jīng)常造成字符粘連,斷筆,因此極大限制了識別系統(tǒng)的性能,這就需要文字識別軟件有字符切割功能。

7、字符識別:

這一研究,已經(jīng)是很早的事情了,比較早有模板匹配,后來以特征提取為主,由于文字的位移,筆畫的粗細,斷筆,粘連,旋轉(zhuǎn)等因素的影響,極大影響特征的提取的難度。

8、版面恢復(fù):

人們希望識別后的文字,仍然像原文檔圖片那樣排列著,段落不變,位置不變,順序不變,的輸出到word文檔,pdf文檔等,這一過程就叫做版面恢復(fù)。

9、后處理、校對:

根據(jù)特定的語言上下文的關(guān)系,對識別結(jié)果進行較正,就是后處理。

開發(fā)一個OCR文字識別軟件系統(tǒng),其目的很簡單,只是要把影像作一個轉(zhuǎn)換,使影像內(nèi)的圖形繼續(xù)保存、有表格則表格內(nèi)資料及影像內(nèi)的文字,一律變成計算機文字,使能達到影像資料的儲存量減少、識別出的文字可再使用及分析,當然也可節(jié)省因鍵盤輸入的人力與時間。

從影像到結(jié)果輸出,須經(jīng)過影像輸入、影像前處理、文字特征抽取、比對識別、最后經(jīng)人工校正將認錯的文字更正,將結(jié)果輸出。2100433B

OCR文字識別歷史背景常見問題

  • APEC會議的歷史背景

    1991年11月在韓國漢城舉行的APEC第三屆部長級會議,通過了《漢城宣言》,正式確立APEC的宗旨和目標為“相互依存,共同利益,堅持開放的多邊貿(mào)易體制和減少區(qū)域貿(mào)易壁壘”。APEC精神----APE...

  • 遷安的歷史背景如何

    遷安市隸屬于河北省,位于河北省東北部,燕山南麓,灤河岸邊,地理坐標為:東經(jīng)118°37′~118°55′,北緯39°51′~40°15′之間,轄12個鎮(zhèn)、7個鄉(xiāng)、1個街道,總面積1208平方公里。19...

  • 明清建筑的歷史背景

    元朝嚴酷的統(tǒng)治終被推翻,中國又恢復(fù)了漢人掌權(quán)。但一心想恢復(fù)漢唐雄威的明朝皇帝并沒有給中國帶來另一次輝煌——封建制度沒落的頹勢已無法挽回。在明朝,中央集權(quán)發(fā)展到極點,宰相被廢除,皇帝成為官僚之長。特務(wù)政...

OCR文字識別歷史背景文獻

“天花板”現(xiàn)象背后的歷史背景 “天花板”現(xiàn)象背后的歷史背景

格式:pdf

大小:959KB

頁數(shù): 2頁

評分: 4.6

焦點官場"天花板"現(xiàn)象為什么會成為問題?中共中央黨校黨建部教授張榮臣:改革開放30多年來,我們的干部人事制度改革取得的成績是巨大的,但也要承認,干部制

立即下載
裝配式建筑的歷史背景(中國篇1) 裝配式建筑的歷史背景(中國篇1)

格式:pdf

大?。?span id="v1zz55x" class="single-tag-height">959KB

頁數(shù): 5頁

評分: 4.6

裝配式建筑的歷史背景(中國篇 1) 一、歷史影響 數(shù)千年來,甚至可以追溯到遠古時代, 歷史上外部因素對于中國建筑的結(jié)構(gòu)、材料和建造方式等, 幾乎沒有任何影響(圖 1)。? ?圖 1 二、古代中國的裝配式 建筑 (一)河姆渡文化 華夏民族的先祖?zhèn)冮_始從舊石器時 代的魚獵、采集、逐水草而居的游牧生活,轉(zhuǎn)向了以農(nóng)耕為 主的定居生活。中國在遠古( B.C.7000 ,河姆渡文化)就開 創(chuàng)了“梁柱式”建筑的“榫卯結(jié)構(gòu)”,開始實施“裝配式建筑”。圖 2 是在浙江余姚河姆渡新石器文化遺址中發(fā)掘出來的 B.C.5000 ~B.C.3300 年的木構(gòu)榫卯。是至今為止,世界上 考古發(fā)現(xiàn)的最早預(yù)制裝配式建筑構(gòu)件。 ?圖 2 河姆渡遺址 出土許多樁柱、立柱、梁、板等建筑木構(gòu)件,構(gòu)件上有加工 成的榫、卯(孔) 、企口、銷釘?shù)?,顯示當時木作技術(shù)的杰 出(圖 3)。柱子兩端凸出的小方形稱為榫、柱上鑿出可將榫 插入的孔為

立即下載

光學文字識別的概念是在1929年由奧地利科學家Gustav Tauschek最先提出來的 ,后來美國科學家Handel也提出了利用技術(shù)對文字進行識別的想法。而最早對印刷體漢字識別進行研究的是IBM公司的Casey和Nagy,1966年他們發(fā)表了第一篇關(guān)于漢字識別的文章,采用了模板匹配法識別了1000個印刷體漢字。

早在60、70年代,世界各國就開始有OCR的研究,而研究的初期,多以文字的識別方法研究為主,且識別的文字僅為0至9的數(shù)字。以同樣擁有方塊文字的日本為例,1960年左右開始研究OCR的基本識別理論,初期以數(shù)字為對象,直至1965至1970年之間開始有一些簡單的產(chǎn)品,如印刷文字的郵政編碼識別系統(tǒng),識別郵件上的郵政編碼,幫助郵局作區(qū)域分信的作業(yè);也因此至今郵政編碼一直是各國所倡導(dǎo)的地址書寫方式。

20世紀70年代初,日本的學者開始研究漢字識別,并做了大量的工作。中國在OCR技術(shù)方面的研究工作起步較晚,在70年代才開始對數(shù)字、英文字母及符號的識別進行研究,70年代末開始進行漢字識別的研究,到1986年漢字識別的研究進入一個實質(zhì)性的階段,不少研究單位相繼推出了中文OCR產(chǎn)品.早期的OCR軟件,由于識別率及產(chǎn)品化等多方面的因素,未能達到實際要求。同時,由于硬件設(shè)備成本高,運行速度慢,也沒有達到實用的程度。只有個別部門,如信息部門、新聞出版單位等使用OCR軟件。1986年以后我國的OCR研究有了很大進展,在漢字建模和識別方法上都有所創(chuàng)新,在系統(tǒng)研制和開發(fā)應(yīng)用中都取得了豐碩的成果,不少單位相繼推出了中文OCR產(chǎn)品。進入20世紀90年代以后,隨著平臺式掃描儀的廣泛應(yīng)用,以及我國信息自動化和辦公自動化的普及,大大推動了OCR技術(shù)的進一步發(fā)展,使OCR的識別正確率、識別速度滿足了廣大用戶的要求。

編輯本段軟件結(jié)構(gòu)由于掃描儀的普及與廣泛應(yīng)用,OCR軟件只需提供與掃描儀的接口,利用掃描儀驅(qū)動軟件即可。因此,OCR軟件主要是由下面幾個部分組成。

1. 圖像輸入、預(yù)處理:

2. 圖像輸入:對于不同的圖像格式,有著不同的存儲格式,不同的壓縮方式。預(yù)處理:主要包括二值化,噪聲去除,傾斜較正等

3. 二值化:

對攝像頭拍攝的圖片,大多數(shù)是彩色圖像,彩色圖像所含信息量巨大,對于圖片的內(nèi)容,我們可以簡單的分為前景與背景,為了讓計算機更快的,更好的識別文字,我們需要先對彩色圖進行處理,使圖片只前景信息與背景信息,可以簡單的定義前景信息為黑色,背景信息為白色,這就是二值化圖了。

4. 噪聲去除:

對于不同的文檔,我們對噪聲的定義可以不同,根據(jù)噪聲的特征進行去噪,就叫做噪聲去除

5. 傾斜較正:

由于一般用戶,在拍照文檔時,都比較隨意,因此拍照出來的圖片不可避免的產(chǎn)生傾斜,這就需要文字識別軟件進行較正。

6. 版面分析:

將文檔圖片分段落,分行的過程就叫做版面分析,由于實際文檔的多樣性,復(fù)雜性,因此,還沒有一個固定的,最優(yōu)的切割模型。

7. 字符切割:

由于拍照條件的限制,經(jīng)常造成字符粘連,斷筆,因此極大限制了識別系統(tǒng)的性能,這就需要文字識別軟件有字符切割功能。

8. 字符識別:

這一研究,已經(jīng)是很早的事情了,比較早有模板匹配,后來以特征提取為主,由于文字的位移,筆畫的粗細,斷筆,粘連,旋轉(zhuǎn)等因素的影響,極大影響特征的提取的難度。

9. 版面恢復(fù):

人們希望識別后的文字,仍然像原文檔圖片那樣排列著,段落不變,位置不變,順序不變,的輸出到word文檔,pdf文檔等,這一過程就叫做版面恢復(fù)。

10. 后處理、校對:

根據(jù)特定的語言上下文的關(guān)系,對識別結(jié)果進行較正,就是后處理。

編輯本段工作流程一個OCR識別系統(tǒng),其目的很簡單,只是要把影像作一個轉(zhuǎn)換,使影像內(nèi)的圖形繼續(xù)保存、有表格則表格內(nèi)資料及影像內(nèi)的文字,一律變成計算機文字,使能達到影像資料的儲存量減少、識別出的文字可再使用及分析,當然也可節(jié)省因鍵盤輸入的人力與時間。

從影像到結(jié)果輸出,須經(jīng)過影像輸入、影像前處理、文字特征抽取、比對識別、最后經(jīng)人工校正將認錯的文字更正,將結(jié)果輸出。國內(nèi)最有實力的OCR字符識別公司有:云脈OCR, 漢王OCR等。

有批量處理功能,避免了單頁處理的麻煩;支持處理灰度、彩色、黑白三種色彩的BMP、TIF、JPG、PDF多種格式的圖像文件;可識別簡體、繁體和英文三種語言;具有簡單易用的表格識別功能;具有TXT、RTF、HTM和XLS多種輸出格式,并有所見即所得的版面還原功能。新增打開與識別PDF文件功能,支持文字型PDF的直接轉(zhuǎn)換和圖像型PDF的OCR識別,既可以采用OCR的方式將PDF文件轉(zhuǎn)換為可編輯文檔,也可以采用格式轉(zhuǎn)換的方式直接轉(zhuǎn)換文字型PDF文件為RTF文件或文本文件。

OCR文字識別相關(guān)推薦
  • 相關(guān)百科
  • 相關(guān)知識
  • 相關(guān)專欄

最新詞條

安徽省政采項目管理咨詢有限公司 數(shù)字景楓科技發(fā)展(南京)有限公司 懷化市人民政府電子政務(wù)管理辦公室 河北省高速公路京德臨時籌建處 中石化華東石油工程有限公司工程技術(shù)分公司 手持無線POS機 廣東合正采購招標有限公司 上海城建信息科技有限公司 甘肅鑫禾國際招標有限公司 燒結(jié)金屬材料 齒輪計量泵 廣州采陽招標代理有限公司河源分公司 高鋁碳化硅磚 博洛尼智能科技(青島)有限公司 燒結(jié)剛玉磚 深圳市東海國際招標有限公司 搭建香蕉育苗大棚 SF計量單位 福建省中億通招標咨詢有限公司 泛海三江 威海鼠尾草 Excel 數(shù)據(jù)處理與分析應(yīng)用大全 廣東國咨招標有限公司 甘肅中泰博瑞工程項目管理咨詢有限公司 山東創(chuàng)盈項目管理有限公司 當代建筑大師 廣西北纜電纜有限公司 拆邊機 大山檳榔 上海地鐵維護保障有限公司通號分公司 甘肅中維國際招標有限公司 舌花雛菊 華潤燃氣(上海)有限公司 湖北鑫宇陽光工程咨詢有限公司 GB8163標準無縫鋼管 中國石油煉化工程建設(shè)項目部 韶關(guān)市優(yōu)采招標代理有限公司 莎草目 建設(shè)部關(guān)于開展城市規(guī)劃動態(tài)監(jiān)測工作的通知 電梯平層準確度 廣州利好來電氣有限公司 四川中澤盛世招標代理有限公司