La Contraloría General de la República, en cumplimiento de su misión de ejercer seguimiento y control de las entidades que realizan gestión fiscal, se enfrenta a una realidad actual, información en masa; las auditorías inexorablemente recaen en gran medida en el análisis documental, sea de seguimiento o de control. De igual manera, toda incidencia fiscal ha de ser analizada, evaluada y documentada, para llegar a la mejor condición de evidencia.

Hoy, para un ente fiscal superior, en donde cada movimiento informático es un dato, surge la siguiente reflexión: ¿cómo valorar y analizar la información de big data para llegar a consolidar auditorías que no se vean limitadas por el tamaño de la información, en la capacidad de considerar la totalidad del panorama y, en consecuencia, actuar de manera correcta? Así mismo, se pretende describir cómo se utilizó el big data y también identificar los beneficios, limitaciones y ventajas de herramientas de inteligencia artificial e inteligencia de visualización y algoritmos de pronóstico forense del pasado con redes bayesianas (Hugin Expert) para el proceso auditor de la Contraloría General de la República. Finalmente, se genera una metodología con el objeto de explorar nuevas herramientas para ejercer el control fiscal.

Como big data se conoce a los datos que se generan con cierta velocidad y variedad, dando lugar al crecimiento de datos en volumen debido al gran avance y uso de tecnologías de información. Aplica a la información que no puede ser procesada o analizada mediante procesos tradicionales, como las herramientas comunes de gestión de bases de datos o prácticas tradicionales de auditoría.

En Colombia, el tema del big data adquiere especial relevancia en abril del año 2018, a partir de la adopción de la política de explotación de datos hecha por el Consejo Nacional de Política Económica y Social (CONPES) mediante el documento 3920. En este documento se expresa que big data aportará al cumplimiento de los Objetivos de Desarrollo Sostenible, concretamente a las metas relacionadas con el desarrollo de la innovación en los países, con un entorno normativo propicio a la adición de valor a los productos básicos, la promoción del acceso público a la información, y el aumento significativo de datos oportunos, ables y de alta calidad.

Jay Forrester, máximo exponente de la dinámica de sistemas y referente de los diagramas causa efecto, hace entender que el uso de información aplicada a propósitos de auditoría requiere: 1) técnicas y tecnologías, implicando personal, representación y análisis de datos para tener valor agregado de la información; 2) escala extrema de datos; y 3) valor económico haciendo que las soluciones sean asequibles.

Recurriendo en condiciones viables a herramientas, procesos y procedimientos que permitan crear, manipular y gestionar los conjuntos de datos de big data y las instalaciones de almacenamiento, se consolida toda la información de una organización y se pone al servicio del proceso de auditoría, por medio de ideas extendidas, toma de decisiones y automatización del
proceso a partir del procesamiento de la información. Claramente, los inventarios de datos de gran tamaño y no estructurados proporcionan una cantidad de conocimiento especialmente importante para las entidades que ejercen control fiscal, facilitando el cumplimiento de auditorías de manera eficiente y eficaz, a través del mejoramiento de la gestión de las entidades sujetos de control, una vez transformados y ordenados, se puede extraer y analizar información de especial interés.

Entendimiento, escalamiento y dimensiones de big data

Existen estas dimensiones o características propias de la información: volumen, velocidad, variedad, valor, veracidad y visualización. La primera de estas corresponde al aumento significativo de los datos creados por personas y máquinas, la variedad viene dada de acuerdo con el desarrollo de la tecnología, y a las formas de representar los datos; este es el caso de los datos estructurados y no estructurados.

Los datos estructurados hacen referencia a las colecciones de elementos ordenados en formatos conformados por estructuras específicas. Esta característica facilita la administración de la información, dado que mejora el acceso a datos, ya sean estáticos (array, cadena de caracteres y registros) o dinámicos (listas, pilas, colas, árboles, archivos) debido a que se almacenan de manera relacional. Por otra parte, los datos no estructurados no se encuentran sujetos a formatos de nidos, ni contienen datos de nidos como es el caso de documentos de texto e imágenes, entre otros. Estos últimos son los de mayor frecuencia de aparición en un proceso tradicional de auditoría. La velocidad está medida en el aumento de productos de desarrollo de software como páginas web, archivos de búsqueda, redes sociales, foros, correos electrónicos, entre otros. Por otra parte, el valor reside en el análisis de datos y el conocimiento que puede obtener; de la última característica mencionada viene dada la veracidad relacionada con el nivel de certeza y exactitud de los datos, dependiendo de la fuente de la información, en especial cuando se trata de entrada de datos automatizados. La visualización se genera dada la necesidad de representar la información de manera dinámica y comprensible para facilitar así la toma de decisiones.

Análisis y aplicaciones típicas de big data

    Identificación de patrones

    El reconocimiento de las grandes cantidades de datos tiene como objetivo descubrir información relevante y útil para la auditoría, por ejemplo, conexiones y patrones ocultos en la información. Este análisis se lleva a cabo por medio de tecnologías de bases de datos como NoSQL, Hadoop y MapReduce.
    Tecnologías de big data

    Dado que estos datos son no estructurados es necesario el uso de técnicas y tecnologías diseñadas para el manejo de indexación de texto y búsqueda bibliográfica, es decir, que permita realizar búsquedas dentro de documentos, esto obliga a la Contraloría a desarrollar el diseño de procesos para hacer minería de textos que hagan correlaciones válidas.

    Debido a la necesidad de aplicar prácticas de auditoría con sentido big data, es inexorable desarrollar el concepto de data science al interior de la Contraloría, como ciencia de los datos, basada en el tratamiento y manipulación de información con enfoque estadístico e investigativo, para así generar entendimiento y conocimiento de los datos llevando a cabo soluciones de análisis y toma de decisiones.

    Con tal propósito se hizo una adaptación a la arquitectura empresarial de la entidad para implementar este tipo de tecnología en las situaciones de manejo de datos masivos, dado que se requiere del entendimiento de los datos, la segmentación de los mismos y los objetivos del proceso, para así darle tratamiento a la información de forma que se obtengan gráficas de análisis y con ello trabajar en paralelo con el sistema que está funcionando, siendo flexible con la técnica y las herramientas disponibles.

    El almacenamiento, procesamiento y correcto aprovechamiento de los datos son los objetivos principales para el manejo de esta información. Por esta razón, herramientas de inteligencia artificial e inteligencia de visualización (Watson - I2 IMB Analyst`s Notebook) proporciona a los analistas funciones de visualización multidimensional de los datos para agilizar los descubrimientos de conexiones y patrones derivados de la información. Esta solución proporciona visualización de redes y análisis de redes sociales, junto a una vista temporal y geoespacial de la información, permitiendo un entorno flexible de visualización y modelación de datos e identificar personas y sucesos clave a partir del tratamiento de datos por medio de vistas temporales, estadísticas y asociaciones destacando estructura, jerarquía y métodos de funcionamiento de las redes.

    Lea la versión completa en la edición impresa

RELACIONADOS