lunes, 18 de abril de 2011
Códigos de Procesamiento de Imágenes y Bar - Selección de El Código de Barras Derecho Con Binarización de imágenes
Códigos de Procesamiento de Imágenes y Bar - Selección de El Código de Barras Derecho Con Binarización de imágenes
Contar palabras:
1216
Resumen:
Los documentos que se analizan en busca de procesamiento de imágenes o de almacenamiento se han capturado a 8 bits por pixel. Estos
se conocen como imágenes en escala de grises en la que 256 niveles de gris son capaces de ser representados en la imagen. La
capacidad para representar tonos de gris que se requiere para capturar fielmente fotografías y gráficos, pero normalmente no es
necesaria para el texto. En consecuencia, las imágenes escaneadas se han binarized. Este proceso implica la selección de un valor de
umbral y luego cambiando todo pix ...
Palabras clave:
procesamiento de imágenes, código de barras, herramientas de desarrollo de software
Cuerpo del artículo:
Los documentos que se analizan en busca de procesamiento de imágenes o de almacenamiento se han capturado a 8 bits por pixel. Estos
se conocen como imágenes en escala de grises en la que 256 niveles de gris son capaces de ser representados en la imagen. La
capacidad para representar tonos de gris que se requiere para capturar fielmente fotografías y gráficos, pero normalmente no es
necesaria para el texto. En consecuencia, las imágenes escaneadas se han binarized. Este proceso implica la selección de un valor
umbral y luego cambiar todos los valores de los píxeles por debajo de ese umbral en negro y todos los valores de los píxeles por
encima del umbral de blanco. Esto comprime la imagen con sólo requiere un bit por píxel en lugar de 8 bits por píxel. Por ejemplo,
un 8,5 pulgadas por 11 pulgadas de documentos escaneados a 200 muestras por pulgada, tiene su caída necesidades de almacenamiento de
3,6 MB a 450 kilobytes. Binarización también se produce cuando los documentos se envíen por fax como se crean las imágenes que se
representan con 1 bit por píxel también.
Teniendo en cuenta un umbral adecuado, las imágenes que contienen texto binarized normalmente puede seguir siendo leído por uno de
los ojos humanos o algoritmos de OCR. De hecho, algunos algoritmos de OCR comenzar el proceso de OCR por binarizing la imagen como
el texto es oscuro contra un fondo más claro. Sin embargo, si los códigos de barras están presentes dentro de la imagen binarized,
pueden por lo suficientemente alterado por el proceso de binarización para causar dificultad para un algoritmo de decodificación. La
imagen de la izquierda (http://www.omniplanar.com/_upload/CodePics/Code39-GreyscaleWeb.gif) muestra parte del patrón de inicio de un
código 39 códigos de barras lineales. La parte superior muestra la imagen representada en 8 bits por píxel, mientras que la parte
inferior muestra una versión binarized con un umbral de 100. Tenga en cuenta que las transiciones suaves de blanco a negro en la
imagen en escala de grises se han transformado en los bordes irregulares que tienen más o menos una variabilidad píxel. Como
resultado, el ancho de cada barra o espacio puede variar más o menos 2 píxeles. Dado que la información en los códigos de barras
lineales se encuentra en el ancho de las barras y los espacios, los problemas de decodificación puede resultar en función del tamaño
y tipo del símbolo de código de barras original. El resto de este artículo se centrará en dos cuestiones que deben considerarse para
mejorar la velocidad de lectura de códigos de barras binarized: densidad de la muestra y el tipo de simbología.
Densidad de la muestra
la densidad de la muestra es el número de muestras por unidad de área que se captura la imagen. Densidades típicas de la muestra
utilizada para el rango de documento de procesamiento de 200 a 300 muestras por pulgada (puntos por pulgada o DPI). La transmisión
por fax puede variar desde 100 hasta 400 DPI. En la descodificación de códigos de barras, un parámetro más importante a considerar
es las muestras por el módulo, donde el tamaño del módulo es el tamaño de la característica más pequeña del código de barras. Esta
distancia también se conoce como la dimensión X. Este parámetro incluye tanto la densidad de la muestra del dispositivo de captura
de imágenes junto con el tamaño del código de barras que se escanea. Si un código de barras de herramientas de software de
decodificación requiere un mínimo de 1,6 píxeles por módulo de códigos de barras lineales en una imagen en escala de grises. Desde
arriba, si el ancho de una barra o espacio puede variar de 2 píxeles después de binarización, uno puede ver que los problemas pueden
existir en los anchos de corto a esta densidad de la muestra. En consecuencia, se recomienda que un valor típico de 4 píxeles por
módulo de códigos de barras que se binarized. Para que un documento escaneado a 200 ppp, esto requiere un tamaño mínimo en el módulo
de código de barras impreso de 0.020 milésimas de pulgada o inchs 20. El aumento de las muestras por el módulo más allá de 4 También
se recomienda para las imágenes que pasan por varios procesos de binarización como documentos que serán enviados por fax en
múltiples ocasiones.
Simbología Tipo
La elección de la simbología utilizada para codificar los datos también deben ser considerados cuidadosamente. Lineal (o 1D) los
códigos de barras se pueden clasificar en dos grupos distintos: ancho / estrecho códigos y los códigos de ancho múltiples. En un
código de ancho / estrecho, cada barra o espacio sólo puede ser estrecho o ancho. La amplia relación de estrecha, que da la
proporción de tamaño entre los dos anchos, por lo general oscila entre 2 y 3. simbologías más populares que utilizan solamente 2
anchuras incluyen el código 39 y 2 interpolados de 5. Múltiples códigos de ancho tiene más de dos opciones posibles para los anchos
de las barras y espacios. simbologías populares que emplean a más de dos anchuras posibles incluyen la UPC y el código 128, los
cuales permiten un bar o un espacio para ser 1, 2, 3 ó 4 módulos. Habida cuenta de las mismas muestras por módulo, ancho / estrecho
simbologías normalmente sobreviven el proceso de binarización con un rendimiento más alto índice de lectura que sus homólogos de
ancho múltiples. Esto es simplemente debido al hecho de que en la presencia de variación borde debido a binarización, es más fácil
determinar si una carrera es X o 3 veces de ancho (donde X es la longitud de un módulo y una supuesta variedad de reducir proporción
de 3) o si se trata de 1X, 2X, 3X y 4X como es el caso de múltiples simbologías de ancho. La siguiente tabla clasifica algunos
simbologías lineales populares en las dos clases mencionadas anteriormente.
Banda ancha / estrecha
Codabar
Código 39
Interleaved 2 de 5
Parche para el código
Múltiples Ancho
Código 128
Código 93
RSS
UPC
Mientras ancho / estrecho simbologías se prefieren en aplicaciones donde binarización se producirá, no tienen generalmente como una
alta densidad de datos (los datos almacenados por unidad de longitud) en comparación con múltiples simbologías de ancho con la misma
dimensión X. Esto puede ser un problema por el espacio limitado en el documento se proporciona con el código de barras.
Simbologías 2D
2D (o de dos dimensiones) simbologías matriz suelen ser la presencia / ausencia de códigos. Ellos usan una malla regular de las
posiciones de células posible, y la presencia o ausencia de una celda en una ubicación red codifica los datos. símbolos de dos
dimensiones tienen una densidad mucho mayor de datos de códigos 1D como la información se almacena en las dos dimensiones del
símbolo. Además, que normalmente proporcionan la corrección de errores para proporcionar redundancia en caso de que algunos valores
de datos de la celda no se puede determinar. Cuando un símbolo 2D es binarized con muestras suficientes por módulo (del tamaño de
una posición en la parrilla), tienden a hacer mejor que los códigos lineales como la información del borde no es tan crítica: es la
posición del centro de la celda que es más importantes. software de descodificación puede requerir un mínimo de 2,75 puntos por
módulo en una imagen en escala de grises para un funcionamiento fiable. Si las muestras adicionales por cada módulo se proporciona
más allá de 2,75, el rendimiento sigue mejorando y es una buena opción para las imágenes que serán sometidos a binarizations
múltiples. Una densidad de la muestra de 5 píxeles o más para simbologías 2D matriz ofrece un buen rendimiento después de leer
binarización. Matriz de códigos 2D más populares incluyen Data Matrix, Código QR y el código Aztec.
PDF417 se refiere a menudo como una simbología 2D. Sin embargo, no es un verdadero código de la matriz. Es un código apilados
lineal, que consiste en varias filas de corto palabras en clave lineal. Permite a los bares y espacios para tener hasta 6 diferentes
anchos y, como tal, puede verse afectado negativamente por binarización a menor muestras por el módulo.
Resumen
En aplicaciones en las que los documentos digitalizados que contiene los códigos de barras se binarized, tasa de rendimiento de
lectura se puede mejorar mediante el uso de simbologías lineales que ocupan únicamente de ancho / estrecho opciones para las barras
y espacios a lo largo de por lo menos con cuatro o más píxeles por módulo. códigos de la matriz de dos dimensiones son una buena
opción cuando binarización se utiliza con un minimumof 5 píxeles por módulo, y proporcionan el beneficio adicional de incrementar la
densidad de datos del símbolo de código de barras.