表格、表單、名片數(shù)據(jù)采集
時(shí)間:2009-8-11 16:27:13 人氣指數(shù): 【 大 中 小 】
北京天潤智力采用先進(jìn)的數(shù)據(jù)處理技術(shù),對(duì)各類調(diào)查問卷、表格數(shù)據(jù)進(jìn)行數(shù)字化處理,尤其擅長處理以下類型的調(diào)查數(shù)據(jù):
·固定表格:稅務(wù)報(bào)表、保險(xiǎn)單、調(diào)查問卷、試卷等。 ·半結(jié)構(gòu)化文檔:發(fā)票、訂購單、支付票據(jù)、裝箱單、名片等。 ·非結(jié)構(gòu)化文檔:合同、條款、信函、租借協(xié)議和其它純文本文檔等。根據(jù)客戶數(shù)據(jù)的具體格式和需求,對(duì)表格數(shù)據(jù)進(jìn)行初步整理,設(shè)置好數(shù)據(jù)庫字段,并搭建數(shù)據(jù)采集局域網(wǎng),實(shí)現(xiàn)網(wǎng)絡(luò)化數(shù)據(jù)采集。
(1)管理員端:用來控制整體表格處理過程, 通過文件模板編輯準(zhǔn)備表格模板,并且對(duì)預(yù)期結(jié)果進(jìn)行測(cè)試,統(tǒng)一表格模式。
(2)操作員端:錄入/掃描表格,文字識(shí)別,對(duì)識(shí)別結(jié)果進(jìn)行檢驗(yàn)和存儲(chǔ)。
1、對(duì)于手寫文字、非結(jié)構(gòu)化表格,采用雙錄軟件進(jìn)行兩遍錄入,人工核對(duì)數(shù)據(jù);
2、對(duì)于結(jié)構(gòu)化表格,采用“批量掃描 + OCR識(shí)別 + 文字校對(duì)”的模式進(jìn)行處理。
技術(shù)人員采用OCR功能模塊成功的識(shí)別技術(shù)基礎(chǔ)上提供當(dāng)前最高的精確度和穩(wěn)定性。
·圖象增強(qiáng)處理,提高識(shí)別效果,如糾偏、去噪。 ·數(shù)據(jù)文字提取,借助OCR識(shí)別技術(shù)精確提取相應(yīng)的數(shù)據(jù)和文字信息。 ·自動(dòng)數(shù)據(jù)校驗(yàn),內(nèi)置檢驗(yàn)準(zhǔn)則,在自動(dòng)識(shí)別期間用來增加識(shí)別精確度。軟件提供校對(duì)界面,將識(shí)別結(jié)果和原始圖像進(jìn)行對(duì)照,人工校對(duì)和錄入,包括縱向校對(duì)和橫向校對(duì)兩個(gè)模式。
圖像文件直接存放到對(duì)應(yīng)目錄下,便于客戶存放;數(shù)據(jù)文件存放到Excel表格或Access數(shù)據(jù)庫中,可以進(jìn)行查詢、統(tǒng)計(jì)等操作