-
Edgar F. Codd inventó la base de datos relacional, la cual permitió a las empresas guardar y estructurar grandes volúmenes de datos de manera más segura y eficiente.
-
Lanzamiento de SQL para acceder y manipular datos de manera más eficiente.
-
Creación de TCP/IP para transferir grandes cantidades de datos a través de la red.
-
El término "Big Data" se acuñó por primera vez. (Laney, 2001)
-
Doug Cutting y Mike Cafarella desarrollan Hadoop, un sistema de almacenamiento y procesamiento distribuido para Big Data. (Cutting & Cafarella, 2005)
-
Google publica un artículo sobre Google File System (GFS) para el almacenamiento y procesamiento distribuido de datos.
-
Google publica un artículo sobre MapReduce para el procesamiento paralelo de grandes conjuntos de datos agrupados.
-
Amazon lanza S3, que permite a empresas almacenar y acceder a grandes conjuntos de datos en línea.
-
El proyecto de código abierto Hadoop se convierte en el proyecto de principal de Apache.
-
Facebook lanza la base de datos Cassandra, una base de datos NoSQL para grandes cantidades de datos.
-
La cantidad de datos digitales creados, reproducidos y consumidos supera un zettabyte por primera vez.
-
La campaña presidencial de Barack Obama usa Big Data y análisis predictivo para su reelección.
-
La industria del Big Data se centra en el aprendizaje automático y en la inteligencia artificial.
-
Más del 90% de la información mundial se ha producido en los últimos dos años.
-
La UE introduce el Reglamento General de Protección de Datos (GDPR) para nuevas regulaciones de privacidad de datos personales.
-
Se lanza la primera red de datos 5G, que permite una mayor velocidad y capacidad de procesamiento de datos.
-
La Pandemia de COVID-19 aumenta la necesidad de análisis de información en tiempo real y pronósticos predictivos.
-
La proporción de datos en la nube continúa creciendo. Aparecen herramientas de gestión de metadatos y catálogos.
-
Startups emergentes desafían la hegemonía de Airflow con nuevas tecnologías de programación.
-
"Lakehouse" se inicia como una plataforma que combina datalake y data warehouse. Databricks, Snowflake y Google se posicionan.