-
El surgimiento de las bases de datos relacionales
Edgar F. Codd inventó la base de datos relacional, la cual permitió a las empresas guardar y estructurar grandes volúmenes de datos de manera más segura y eficiente. -
Lanzamiento de SQL
Lanzamiento de SQL para acceder y manipular datos de manera más eficiente. -
TCP/IP: Transferencia de datos en la red.
Creación de TCP/IP para transferir grandes cantidades de datos a través de la red. -
Acuñando "Big Data"
El término "Big Data" se acuñó por primera vez. (Laney, 2001) -
Hadoop revoluciona almacenamiento
Doug Cutting y Mike Cafarella desarrollan Hadoop, un sistema de almacenamiento y procesamiento distribuido para Big Data. (Cutting & Cafarella, 2005) -
Google File System (GFS)
Google publica un artículo sobre Google File System (GFS) para el almacenamiento y procesamiento distribuido de datos. -
MapReduce en Google
Google publica un artículo sobre MapReduce para el procesamiento paralelo de grandes conjuntos de datos agrupados. -
Amazon lanza S3
Amazon lanza S3, que permite a empresas almacenar y acceder a grandes conjuntos de datos en línea. -
Hadoop se convierte en Apache
El proyecto de código abierto Hadoop se convierte en el proyecto de principal de Apache. -
Facebook lanza Cassandra
Facebook lanza la base de datos Cassandra, una base de datos NoSQL para grandes cantidades de datos. -
Superando zettabyte
La cantidad de datos digitales creados, reproducidos y consumidos supera un zettabyte por primera vez. -
Obama y Big Data
La campaña presidencial de Barack Obama usa Big Data y análisis predictivo para su reelección. -
Enfoque en IA
La industria del Big Data se centra en el aprendizaje automático y en la inteligencia artificial. -
Explosión de información
Más del 90% de la información mundial se ha producido en los últimos dos años. -
GDPR y privacidad
La UE introduce el Reglamento General de Protección de Datos (GDPR) para nuevas regulaciones de privacidad de datos personales. -
Red 5G potencia Big Data
Se lanza la primera red de datos 5G, que permite una mayor velocidad y capacidad de procesamiento de datos. -
Pandemia y análisis en tiempo real
La Pandemia de COVID-19 aumenta la necesidad de análisis de información en tiempo real y pronósticos predictivos. -
Datos en la nube
La proporción de datos en la nube continúa creciendo. Aparecen herramientas de gestión de metadatos y catálogos. -
Desafíando Airflow
Startups emergentes desafían la hegemonía de Airflow con nuevas tecnologías de programación. -
Nacimiento de Lakehouse
"Lakehouse" se inicia como una plataforma que combina datalake y data warehouse. Databricks, Snowflake y Google se posicionan.