Análisis

Historia y cronograma de macrodatos

single-image

El big data ha revolucionado el entorno empresarial moderno en los últimos años. Big data es una combinación de datos estructurados, semiestructurados y no estructurados y una colección de información que las organizaciones pueden obtener con fines comerciales a través del aprendizaje automático, el modelado predictivo y otras aplicaciones avanzadas de análisis de datos.

El concepto de big data solía parecer una palabra de moda, pero la realidad es que el impacto de big data en el mundo que nos rodea ha sido enorme. Como puede ver en esta línea de tiempo, que cubre la historia de Big Data, el análisis de Big Data se basa en conceptos que han existido durante siglos.

El análisis de datos históricos que condujo al análisis avanzado de macrodatos de hoy comenzó ya en el siglo XVII en Londres. Comencemos nuestro viaje.

La base del big data

Una fase de puesta en marcha en la que las personas inteligentes empezaron a ver el valor de utilizar estadísticas y análisis para comprender el mundo que les rodea.

1663

John Graunt introduce el análisis de datos estadísticos con la peste bubónica. El comerciante de mercería de Londres publicó la primera colección de registros de salud cuando registró las tasas de mortalidad y sus fluctuaciones durante la peste bubónica en Inglaterra.

1865

Richard Millar Devens acuñó el término «Business Intelligence». Tal como lo entendemos hoy, la inteligencia empresarial es el proceso mediante el cual los datos se analizan y luego se utilizan para proporcionar información utilizable. En su «Cyclopedia of Commercial and Business Ancdotes», Devens describió cómo un banquero usaba la información de su entorno para obtener ganancias.

1884

Herman Hollerith inventa el tabulador de tarjetas perforadas y marca el comienzo del procesamiento de datos. El tabulador desarrollado por Hollerith se utilizó para procesar datos del censo de 1890 de EE. UU. Más tarde, en 1911, fundó la Compañía de Computación, Tabulación y Grabación, que luego se convirtió en IBM.

1926

Nikola Tesla predice que algún día las personas tendrán acceso a grandes cantidades de datos a través de un instrumento que se puede «transportar». [one’s] Bolsillo del chaleco. «Tesla logró predecir nuestra afinidad moderna por los teléfonos inteligentes y otros dispositivos portátiles basándose en su comprensión de cómo la tecnología inalámbrica transformaría las partículas:» Cuando la tecnología inalámbrica se aplica a la perfección, toda la tierra se convierte en un cerebro gigante, que es en realidad lo que es la caída. Es el caso de que todas las cosas son partículas de un todo real y rítmico. Podremos comunicarnos instantáneamente sin importar la distancia. »

1928

Fritz Pfleumer inventa una forma de almacenar información en cinta. El método de Pfleumer de aplicar tiras de metal al papel magnético eventualmente lo llevó a crear una cinta magnética que formó la base para casetes de video, rollos de película y más.

1943

Gran Bretaña creó una computadora teórica y una de las primeras máquinas de procesamiento de datos para descifrar los códigos nazis durante la Segunda Guerra Mundial. El llamado coloso realizó operaciones booleanas y de conteo para analizar grandes cantidades de datos.

Colossus fue la primera computadora electrónica programable del mundo
Colossus: La primera computadora electrónica programable.

1959

Arthur Samuel, programador de IBM y pionero de la inteligencia artificial, acuñó el término aprendizaje automático (ML).

1965

Estados Unidos planea construir el primer edificio de centro de datos que almacenará millones de declaraciones de impuestos y huellas dactilares en cinta magnética.

1969

Se creó la red de agencias para proyectos de investigación avanzada (ARPANET), la primera red de área amplia con control distribuido y protocolos TCI / IP. Esto formó la base de Internet de hoy.

La era de Internet: el comienzo de Big Data

A medida que las computadoras intercambian información a tasas exponencialmente más altas debido a Internet, está tomando forma la siguiente etapa en la historia del big data.

1989 y 1990

Tim Berners-Lee y Robert Cailliau encontraron la World Wide Web y desarrollaron HTML, URL y HTTP mientras trabajaban para el CERN. Está comenzando la era de Internet con un acceso fácil y generalizado a los datos.

1996

El almacenamiento de datos digitales es más barato que almacenar información en papel por primera vez en 1996, según informaron RJT Morris y BJ Truskowski en 2003 Revista de sistemas de IBM Ponencia «La evolución de los sistemas de almacenamiento».

1997

El dominio google.com se registra un año antes del lanzamiento, lo que inicia el auge del motor de búsqueda para dominar y desarrollar muchas otras innovaciones tecnológicas, incluido el aprendizaje automático, los macrodatos y la analítica.

1998

Carlo Strozzi desarrolla NoSQL, una base de datos relacional de código abierto que puede almacenar y recuperar datos modelados de manera diferente a los métodos tabulares tradicionales en bases de datos relacionales.

1999

Basado en datos de 1999, la primera edición del influyente libro, Cuanta informacion, de Hal R. Varian y Peter Lyman (publicado en 2000), intenta cuantificar la cantidad de información digital actualmente disponible en todo el mundo.

Big data en el siglo XXI

El big data tal como lo conocemos finalmente está llegando, y la explosión asociada de ingenio no puede ser subestimada. Todos y todo se ve afectado.

2001

Doug Laney, de la firma de analistas Gartner, da forma a las 3V (volumen, variedad y velocidad) y define las dimensiones y propiedades de big data. Las V encapsulan la verdadera definición de big data y marcan el comienzo de un nuevo período en el que los big data pueden verse como una característica dominante del siglo XXI. Vs adicionales, como Veracidad, Valor y Variabilidad, se han agregado a la lista.

Las seis V del Big Data
Big Data recopila datos de varias fuentes humanas o de máquinas definidas con precisión o vagamente definidas.

2005

Los informáticos Doug Cutting y Mike Cafarella crean Apache Hadoop, el marco de código abierto para almacenar y procesar grandes cantidades de datos, con un equipo de ingenieros que ha sido subcontratado por Yahoo.

2006

Amazon Web Services (AWS) ahora ofrece servicios de infraestructura de computación basados ​​en la web, ahora conocidos como computación en la nube. AWS domina actualmente la industria de servicios en la nube con alrededor de un tercio de la cuota de mercado global.

Componentes principales de Hadoop
La capacidad de Hadoop para ejecutarse en servidores básicos, la escalabilidad, la flexibilidad y la velocidad lo convierten en una parte importante del ecosistema de big data.

2008

Las CPU del mundo procesan más de 9,57 zettabytes (o 9,57 billones de gigabytes) de datos, lo que equivale aproximadamente a 12 gigabytes por persona. Se estima que la producción mundial de nueva información es de 14,7 exabytes.

2009

Gartner afirma que la inteligencia empresarial es una de las principales prioridades de los CIO. Con las empresas que atraviesan un período de volatilidad económica e incertidumbre debido a la Gran Recesión, obtener el valor de sus datos es de suma importancia.

2011

McKinsey informa que EE. UU. Enfrentará una escasez de talento analítico hasta 2018. Hay una falta de entre 140.000 y 190.000 empleados con amplias habilidades analíticas y otros 1,5 millones de analistas y gerentes capaces de tomar decisiones precisas basadas en datos.

Además, Facebook está iniciando el proyecto Open Compute para intercambiar especificaciones para centros de datos energéticamente eficientes. El objetivo de la iniciativa es aumentar la eficiencia energética en un 38% con costos un 24% más bajos.

2012

La administración de Obama anuncia una iniciativa de investigación y desarrollo de Big Data con un compromiso de $ 200 millones para la seguridad y la transformación del aprendizaje. El acrónimo ahora ha cambiado a STEAM, agregando una A para incluir las artes.

Harvard Business Review nombra al científico de datos como el trabajo más sexy del siglo XXI. A medida que más empresas se dieron cuenta de la necesidad de clasificar y extraer información de datos no estructurados, aumentó la demanda de científicos de datos.

2013

El mercado global de big data alcanza los $ 10 mil millones.

2014

Por primera vez en los EE. UU., Hay más dispositivos móviles que acceden a Internet que computadoras de escritorio. El resto del mundo sigue dos años después, en 2016.

2016

El noventa por ciento de los datos del mundo se crearon solo en los últimos dos años, e IBM informa que cada día se crean 2,5 billones de bytes de datos (es decir, 18 ceros).

2017

IDC predice que el mercado de análisis de big data alcanzará los 203.000 millones de dólares en 2020.

2020

Allied Market Research informa que el mercado de big data y análisis de negocios alcanzó los $ 193,14 mil millones en 2019 y estima que crecerá a $ 420,98 mil millones para 2027, con una tasa de crecimiento anual promedio del 10,9%. El dólar crecerá.

La informática de borde tiene como objetivo revisar cómo se administran y procesan los datos para industrias críticas. La computación de borde, que se refiere a la computación que se realiza cerca de la fuente de adquisición de datos y no en la nube o en un centro de datos central, es la próxima frontera para el big data.

Cómo funciona la computación en el borde
La computación de borde procesa los datos más cerca de la fuente.

El futuro del big data: ¿a dónde va el big data desde aquí?

Con la explosión de los dispositivos conectados, nuestra creciente dependencia de la nube y la inminente revolución de la informática de punta, el big data todavía tiene mucho por hacer, entre otras cosas.

Las tecnologías como el aprendizaje automático, la inteligencia artificial y el análisis de IoT están estableciendo nuevos estándares al mejorar en gran medida nuestra capacidad para procesar, analizar y responder a los datos.

Espere avances significativos en big data y análisis en un clip más rápido. Los próximos años podrían hacer que lo que hemos visto en los últimos 20 años parezca una obviedad.

 

También te gustará