身份证复印件扫描识别采集方案

身份证复印件扫描识别采集方案

 

 

 

社会保障卡系统建设工作中,参保人员的数据采集和照片采集及数据勘误是件烦琐而繁重的工作。将人脸检测技术和文字OCR识别技术运用到数据采集中,将可以大大提高数据采集效率和采集准确率。

由于参保人员数量多、区域分散、不好集中等特点,我们建议前期通过当地公安部门尽可能多地获取参保人员的基本信息和照片信息,但是如果因为各种原因得不到公安部门的二代证数据,或因为公安部门没有这部分人员数据,我们可以通过上交的身份证复印件采用《海量证件自动识别录入系统》重新建立人员信息库,减轻手工录入工作量。

为方便复印件的收集和处理,以及同时完成人员照片的采集工作,我们建议参保人员将身份证复印在普通A4纸左上角,同时在复印件右边相临处粘贴彩色照片后上交(图1)。

 

(图1

 

对上交的A4纸张,批量扫描时截取左上角包含身份证复印件和彩色照片原件部分(如图2)。

 

(图2

 

在《海量证件自动识别录入系统》中打开指定的存放图2扫描件的文件夹和跟身份证复印件字段信息一致的数据库文件(access文件),通过软件提供的“开始识别”等功能即可识别出身份证复印件上的文字信息,并自动提取头像。对识别错误的文字可肉眼核对并手工修改。

 成功识别并核对正确无误后的信息可以直接存入事先打开的数据库文件,同时保存提取的头像图片,完成重新建库工作和照片采集工作,极大减轻手工录入工作量,提高准确率。

 如果社保中心已有部分人员数据,需要进行自动比对勘误。系统也可以将扫描的身份证复印件图片批量识别,然后跟已有数据进行关键字段(卡面数据)的自动比对,比对一致的已有数据当正确数据处理,直接制卡;比对不一致或有遗漏的数据再重新肉眼核对勘误、补充建库;这样可以极大减少核对工作量。