Actualidad e importancia de la implementación de Big Data utilizando las herramientas Hadoop y Spark

Lina María Montoya-Suárez, Gustavo Andrés Gil-Restrepo

Resumen


En el presente artículo se realizó una revisión sobre la actualidad e importancia del Big data a través de las herramientas Hadoop y Spark, en principio se contextualiza el concepto Big Data desde diferentes autores y haciendo referencia a su importancia en las diferentes organizaciones, teniendo como premisa las tres V que deben estar presentes a la hora de implementar Big Data (Volumen, Variedad y Velocidad).

Luego se analizan las herramientas Hadoop y Spark, identificando su capacidad de hacer más eficiente el procesamiento de grandes volúmenes de datos, de diferentes tipos de datos y a gran velocidad dando solución a los problemas que se presentaban antes cuando se iba a trabajar sobre muchos datos.

Por último, se hace una reflexión sobre la importancia del Big Data en la toma de decisiones de una organización, teniendo en cuenta que la toma de decisiones permite que una organización sea competitiva y pueda perdurar en el tiempo.   


Palabras clave


Open Data; Volumen; Variedad; Velocidad; Hadoop; Spark; Map Reduce; HDFS; Minería de datos

Texto completo:

PDF

Referencias


V. M. Schönberger and K. Cukier, Big data: la revolución de los datos masivos. Turner, 2013.

J. Serrano-Cobos, “Big data y analítica web. Estudiar las corrientes y pescar en un océano de datos,” El Prof. la Inf., vol. 23, no. 6, pp. 561–565, 2014.

L. J. Aguilar, Big Data, Análisis de grandes volúmenes de datos en organizaciones. Alfaomega Grupo Editor, 2016.

J. G. Cantero, “Nuevas estrategias de gestión de la información,” Big Data, vol. 95, p. 51, 2013.

A. Ferrer-Sapena and E. Sánchez-Pérez, “Open data, big data:?` hacia dónde nos dirigimos?,” Anu. ThinkEPI 2013, vol. 7, pp. 150–156, 2013.

A. López Borrull and A. Canals, “La colaboración científica en el marco de nuevas propuestas científicas: Open Science, e-Science y Big Data,” La Colab. científica una aproximación Multidiscip. Val. Nau Llibres, pp. 91–100, 2013.

M. A. Murazzo, N. R. Rodriguez, M. J. Guevara, and F. G. Tinetti, “Identificación de algoritmos de cómputo Intensivo para big data y su implementación en clouds,” in XVIII Workshop de Investigadores en Ciencias de la Computación (WICC 2016, Entre Ríos, Argentina), 2016.

M. Coto-Jiménez, “Minería de datos: concepto y aplicaciones,” Una ojeada a Clasif. del suelo Globos Cantolla II vuelo Vert. Arduino uno para prototipado rápido Gener. números aleatorios El bosón Higgs, la partícula divina, p. 60, 2014.

A. C. C. Herráez, “Big data con Hadoop-I,” 2015.

B. Sarmiento, M. Hernández, and X. Gómez, “Herramientas y antecedentes Big Data,” Rev. Investig. y Desarro. en TIC, vol. 5, no. 2, 2017.

A. Hernández Dominguez and A. Hernández Yeja, “Acerca de la aplicación de MapReduce+ Hadoop en el tratamiento de Big Data,” Rev. Cuba. Ciencias Informáticas, vol. 9, no. 3, pp. 49–62, 2015.

L. F. Vásquez Rugel, L. A. Caviedes Ruiz, and others, “Sistema de archivos por capas en Hadoop HDFS,” Espol, 2017.

J. L. Larroque, “Indexado de Wikipedia a través de una arquitectura Map Reduce,” Facultad de Informática, 2017.

A. Fenna Víchez, “Captura y gestión de open data en entornos de smart city,” 2017.

M. Niño and A. Illarramendi, “ENTENDIENDO EL BIG DATA: ANTECEDENTES, ORIGEN Y DESARROLLO POSTERIOR,” DYNA New Technol., vol. 2, no. 1, pp. 1–8, 2015.

S. A. Valenzuela, C. L. Vidal, J. D. Morales, and L. P. López, “Ejemplos de Aplicabilidad de Giraph y Hadoop para el Procesamiento de Grandes Grafos,” Inf. tecnológica, vol. 27, no. 5, pp. 171–180, 2016.

K. Esser, W. Hillebrand, D. Messner, J. Meyer-Stamer, and others, “Competitividad sistémica: nuevo desafío para las empresas y la política,” Rev. la CEPAL, vol. 59, no. 8, pp. 39–52, 1996.

D. Cohen Karen, E. Asin Lares, D. G. Lankenau Caballero, and D. Alanis Davila, “Sistemas de informacion para los negocios: Un enfoque para la toma de decisiones.,” 2005.

G. Ponjuán Dante, “Gestión de información en las organizaciones: principios, conceptos y aplicaciones,” 1998.

H. Orallo, J. RAMIREZ, C. R. QUINTANA, M. Josej. H. Orallo, M. J. R. Quintana, and C. F. Ramírez, Introducción a la Minería de Datos. Pearson Prentice Hall, 2004.

A. Blázquez Manzano, “La información y comunicación, claves para la gestión del conocimiento empresarial,” 2013.




DOI: https://doi.org/10.21501/21454086.2403

Enlaces refback

  • No hay ningún enlace refback.




Copyright (c) 2018 Lámpsakos

 
Directora/Editora - Ingrid Durley Torres Pardo

ISSN (En línea): 2145-4086

DOI de la revista: https://doi.org/10.21501/issn.2145-4086

Universidad Católica Luis Amigó - Transversal 51A #67B 90. Medellín - Colombia.

 


 © 2019 Universidad Católica Luis Amigó

    

La revista y los textos individuales que en esta se divulgan están protegidos por las leyes de copyright y por los términos y condiciones de la Licencia Creative Commons Atribución-No Comercial-Sin Derivar 4.0 Internacional. Permisos que vayan más allá de lo cubierto por esta licencia pueden encontrarse en http://www.funlam.edu.co/modules/fondoeditorial/

Derechos de autor. El autor o autores pueden tener derechos adicionales en sus artículos según lo establecido en la cesión por ellos firmada.

 

Se recomienda visualizar este contenido con los navegadores: Mozilla Firefox, Google Chrome, Safari.