¿Quién no ha oído hablar en los últimos meses del big data? ¿Cómo podría ayudarnos en nuestra profesión? Intentaremos en este post poner nuestro granito de arena para ayudar a difundir qué es big data y dar algunos ejemplos que podrían ser de utilidad.
¿Qué es big data?
Según Forbes, el concepto big data se define como “el proceso de recolección y análisis de grandes cantidades de información. La complejidad y el gran volumen de datos impiden que estos puedan ser analizados por los medios tradicionales”.
Se incluye en este proceso información heterogénea y procedente de diferentes orígenes, como por ejemplo documentos de texto, imágenes, posts de redes sociales, podcasts o grabaciones de voz, ficheros de audio, vídeos, historiales médicos, presentaciones, datos geolocalizados, datos de perfiles de navegación, y mensajes instantáneos entre otros muchos.
Las principales características del big data, según describe Ernst & Young son las conocidas como cuatro V’s, que son las siguientes:
- Volumen: la cantidad masiva de información que es posible manejar en la actualidad era imposible hace pocos años. La tecnología ya lo permite.
- Variedad: los datos provienen de diferentes fuentes que pueden ser tanto alimentadas tanto por humanos como por máquinas (IoT)..
- Velocidad: toda esta información se está generando en este mismo momento, nunca para, Internet nunca duerme.
- Veracidad: el hecho de que la información provenga de diferentes fuentes hace que seamos capaces de contrastar su calidad.
Gigabytes, terabytes, petabytes, exabytes,….Forbes estima que “más de 150 zettabytes serán necesarios para realizar análisis de datos en 2025”.
Ejemplos de Big data
Netflix. ¿Quién no ha pensado alguna vez en cómo sus algoritmos recolectan información personal de sus clientes para ofrecernos certeras recomendaciones? Netfilx es una empresa de data. Según su departamento de recolección, modelado y análisis de información capturan más de un millón de eventos al día, tiene casi 3 Petabytes en su pipeline y en algunas puntas pueden registrar 8 millones de eventos por segundo! Imaginemos la arquitectura y el equipo-esfuerzo dedicado para poder gestionarlo. Su machine learning se alimenta de los gustos, inclinaciones e interacciones, horarios, días y tipos de contenido, dispositivos y geolocalización, comportamiento social con tus amigos, etc.
¿Cómo afecta esto a la auditoría?
Según CPA Practice Advisor, «el big data impacta de lleno en auditoría, impuestos y consultoría. Las firmas tienen una gran oportunidad, la clave está en cómo estarán capacitadas con recursos humanos y herramientas cualificadas para sacar el máximo provecho”.
Desafíos del Big data para auditoría (según CPA Journal)
- Incompatibilidad de datos: big data incluye información no estructurada, difícil de identificar y manejar. Los auditores deberán invertir tiempo para determinar qué información es realmente relevante.
- Seguridad del almacenamiento: los auditores necesitan conseguir la confidencialidad tanto de sus clientes como del organismo regulador porque el big data incluye información sensible.
- Formación de equipos: el big data integration depende directamente de las personas que lo manejan. Los auditores tienen que aprender a usar nuevo software, desarrollar profundas capacidades analíticas y comprender cómo gestionar y almacenar grandes cantidades de datos.
- Nivel de user-friendliness: el tiempo invertido en aprender a usar software de big data.
- Peligro de sobreinformación: demasiada información puede impedir al auditor realizar predicciones debido a la capacidad de proceso.
Ventajas del big data
- Ampliar la suficiencia, fiabilidad y relevancia de las evidencias de auditoría.
- Mejorar la precisión de las predicciones..
- Fortaleza de las técnicas de análisis de datos contra el fraude.
- Permitir a los auditores recoger y analizar información no financiera, como informes online o noticias.