Captura de Datos: Métodos automatizados de ingreso de datos

modelos datos

Captura de Datos: Métodos automáticos

Múltiples métodos están disponibles para capturar datos de documentos no estructurados (cartas, facturas, correo electrónico, fax, formularios, etc.).

La lista de métodos identificados a continuación no es exhaustiva, pero es una guía del uso apropiado de cada método al abordar proyectos de automatización de procesos comerciales.

Además de considerar el método de captura de datos, debe tenerse debidamente en cuenta el origen de los documentos que se deben capturar, para ver si los documentos están disponibles en su formato electrónico original, que tiene el potencial de aumentar enormemente los datos.

La precición de la captura elimina la necesidad de imprimir y escanear. Los métodos de captura de documentos en formato electrónico se identifican a continuación.

Siempre que se considere un método de captura, es recomendable en primer lugar considerar los documentos originales, para determinar si el documento o el formulario se pueden actualizar para mejorar el proceso y método de captura / reconocimiento.

La investigación de la línea de sistemas de negocios existente, puede determinar qué metadatos adicionales se pueden extraer de forma gratuita utilizando una sola referencia, y puede proporcionar ventajas significativas.

El (los) método (s) correcto (s) de captura de metadatos para un proyecto de automatización de procesos de negocio en particular, considerará todos los métodos identificados a continuación y el uso de uno o un número puede ser apropiado.

Introducción manual

La inroducción manual de metadatos a partir de datos no estructurados es apropiada para datos que se reciben en volúmenes bajos. 

La introducción de metadatos es la más adecuada por las siguientes razones:

  • Grandes volúmenes de documentos individuales donde el nivel de reconocimiento logrado mediante el uso de productos inteligentes de captura de datos es bajo (puede incluir documentos con un alto nivel de datos escritos a mano).
  • Posiblemente capturar los datos que no se han capturado con éxito utilizando un producto de captura de datos inteligente.
  • Alto volumen de documentos individuales donde los datos que se extraerán no son consistentes de página a página.
  • Puede ser muy rentable en función de los menores costos de mano de obra que se pueden lograr.

Reconocimiento óptico de caracteres (OCR)

El OCR como tecnología proporciona la capacidad de capturar con éxito caracteres  en zonas preestablecidas o a página completa.

Los sistemas OCR pueden reconocer muchas fuentes de OCR diferentes, así como caracteres de máquina de escribir y caracteres impresos por computadora.

Dependiendo de las capacidades del producto OCR en particular, esto se puede utilizar para capturar volúmenes de datos bajos a altos, donde la información se encuentra en ubicaciones consistentes en los documentos. 

Reconocimiento inteligente de caracteres (ICR)

ICR es la traducción informática de caracteres impresos y escritos a mano. Los datos se ingresan desde formularios impresos a mano a través de un escáner, y la imagen de los datos capturados luego se analiza y se traduce mediante sofisticados software ICR.

ICR es similar al reconocimiento óptico de caracteres (OCR), pero es un proceso más difícil ya que OCR proviene del texto impreso, a diferencia de los caracteres escritos a mano. 

Reconocimiento de código de barras

Dependiendo del tipo de código de barras que se use, la cantidad de metadatos que se pueden incluir es alta, al igual que el nivel de reconocimiento.

La aplicación de códigos de barras individuales o múltiples a determinados tipos de documentos, los formularios de membresía, formularios de solicitud, etc., puede aumentar drásticamente la efectividad de un proceso comercial.

Captura inteligente basada en plantillas

Los productos más avanzados pueden identificar los caracteres escritos a máquina y, en menor grado, los manuscritos que están contenidos en áreas particulares de un documento.

Estas aplicaciones se utilizan cuando la cantidad de tipos de documentos que se reciben es relativamente baja (por lo general, hasta 30 tipos diferentes de documentos) pero consistentes.

Se utiliza en aplicaciones como censos, transferencias interbancarias y formularios de solicitud. 

Reconocimiento inteligente de documentos (IDR)

El nivel de capacidad depende del producto individual. Estas aplicaciones se utilizan para capturar metadatos de documentos basados ​​en reglas. Por ejemplo, el producto identificará códigos postales, logotipos, palabras clave, números de registro de IVA y, a través de un proceso de aprendizaje continuo, capturará información de múltiples tipos de documentos.

Este tipo de captura se utiliza para el procesamiento de facturas de gran volumen y aplicaciones de correo digital, donde la clasificación y la indexación de documentos entrantes es clave.

Las aplicaciones de software IDR usan reglas para identificar y capturar información de documentos semiestructurados. Las reglas, especificadas por los usuarios finales, buscan texto específico en un documento para identificar el tipo de documento y, a partir de ese momento, se pueden aplicar reglas adicionales a cada tipo diferente, extrayendo diferentes campos de metadatos de cada tipo.

Existen aplicaciones especializadas para proyectos departamentales, como el procesamiento de facturas o boletas.

Las aplicaciones IDR pueden contener información sobre proveedores generados a partir de otros sistemas de línea de negocio y hacer coincidir facturas con esa información, utilizando texto reconocido como número de IVA, número de teléfono, código postal, etc.

La aplicación busca identificadores de palabras clave en la factura y extrapola el valor cercano. A continuación, se aplican las reglas de validación, por ejemplo, el importe NETO más el importe del IVA debe ser igual al importe bruto, lo que minimiza la posibilidad de errores.

Captura de voz

La captura de registros de voz puros y formularios de voz se está volviendo tan importante para las empresas como otras formas de comunicación (correo electrónico, formularios web, fax).

Aplicaciones brindan la capacidad de capturar comandos de voz para iniciar procesos comerciales, almacenar registros de voz junto con otras formas de comunicación para referencia futura en un sistema de administración de documentos y convertir voz a texto.

En el caso de voz a texto, esto brinda la oportunidad de utilizar la tecnología OCR, ICR, IDR para respaldar las necesidades del negocio.

Los centros de atención ofrecen un buen ejemplo de dónde se encontrarán la combinación de voz, mensajería instantánea, correo electrónico, fax y formularios web para respaldar un proceso comercial común.

Más Recursos