Introducción al manejo de grandes volúmenes de datos y datos no estructurados

By Yanina Bellini Saibene in Community Education Español rstats

February 4, 2024

Español

Esquema de un grafico de con cuatro barras. La primera dice Audio y esta 1/4 completa, las segunda dice imagenes y esta completa a la mitad, la tercera esta completa 3/4 y dice Texto y la ultima dice APIs y esta completa un poco menos que un 1/4. Arriba del grafico dice Datos Masivos y No estructurados

Fundamentación

Ante la necesidad de cualquier persona que practique la ciencia de datos de manipular distintos volúmenes de datos, la gestión de los mismos cobra gran importancia. En este curso abordaremos el tema de la gestión de datos no estructurados principalmente desde el punto de vista teórico y práctico, incluyendo estudios de casos y actividades para brindarles las herramientas necesarias para continuar con su formación.

Programa sintético

  • Introducción a Big Data y una serie de conceptos relacionados.
  • Datos estructurados y no estructurados. Dimensiones de los datos. Información.
  • Analizar casos de uso de datos masivos y no estructurados en empresas e instituciones.
  • Conocer soluciones de software para el tratamiento de datos estructurados, no estructurados y masivos.
  • El lenguaje de programación R para el tratamiento de datos no estructurados.
  • Introducción a OpenRefine y Arrow.

Objetivos

Los objetivos de la materia son:

  • Adquirir nociones sobre la generación y origen de los datos, formas de almacenamiento y su organización.
  • Diferenciar datos estructurados de datos no estructurados.
  • Definir Big Data, Ciencia de Datos, Minería de Texto, Aprendizaje Automático e Inteligencia Artificial.
  • Identificar como estas disciplinas pueden influir en la vida de las personas, especialmente en el ámbito de las políticas públicas.
  • Manipular datos de texto con lenguaje R y OpenRefine.
  • Manipular datos de sensores remotos con R.
  • Manipular un conjunto de datos masivo con R.
  • Consumir APIs utilizando R.

Licencia

Esta obra está bajo licencia Atribución-NoComercial 4.0 Internacional (CC BY-NC 4.0).

¿Cómo citar este trabajo?

Yanina Bellini Saibene. (2023, December 28). Introducción al manejo de grandes volúmenes de datos y datos no estructurados. Zenodo. https://doi.org/10.5281/zenodo.10440059