Saltar la navegación

2. El poder de los datos

Diccionario

Bloque

Imagen que describe bloques de programación en Scratch

Definición:

Unidad básica que permite realizar programas uniendo diferentes bloques sin necesidad de saber programar.

Ejemplo:

Scratch es un lenguaje de programación que utiliza el concepto de bloque para construir los programas.

Datos

Imagen de la lengua de signos que significa hola

Definición:

Los datos hacen referencia a la información que necesita la Inteligencia Artificial para crear modelos para el aprendizaje automático.

Ejemplo:

Esta imagen en la lengua de signos significa hola.

Programa

Imagen de código de programación informática

Definición:

Conjunto de ordenes escritas en un lenguaje determinado, que un ordenador es capaz de interpretar y ejecutar.

Ejemplo:

Una lavadora utiliza un programa para ejecutar la orden de lavar la ropa. Este programa podrá variar en función de las necesidades de cada persona.

Retor dice

  

Seguro que estás deseando comenzar con tu asistente turístico virtual, pero antes de hacerlo es muy importante recordar algunos aspectos que quizás reconozcas y que vas a necesitar.

Veremos qué se entiende por datos y cómo se convierten en información valiosa.

Estoy seguro de que después de todo esto tendrás una idea muy exacta de lo que es big data.

Pero no te preocupes, te mostraré la información de una forma sencilla. Además, siempre tendrás ayuda para poder continuar.

¡Vamos que empezamos!

0. ¿3r3s cpaaz d3 l33r etso?

Imagen que describe a una persona realizando una lecturaVamos a trabajar en grupo el siguiente ejercicio sobre el proceso de reconocimiento de textos que realiza nuestro cerebro de forma automática cuando leemos y que ni siquiera somos conscientes de su complejidad.

A continuación, te presento tres frases, intenta leerlas y escribir el texto que entiendes en tu cuaderno, tableta u ordenador.

Frase 1

54BI45 QU3 EL C3R38RO 450C14 L05 5IM80L05 94R3C1DO5 4 L45 

L3TR45 QU3 CON0C3M05 Y 451 L06R4M05 L33R C0N F4C1L1D4D.

Frase 2

En etsa frsae lo uinco bein ecsrtio es la pmrirea y la utlima ltera, el rsteo peude etsar mal, preo no ipomrta pquore no lemeos cdaa ltrea en si msima, snio la paalbra cmoo un todo.

Frase 3

Imagen que describe una frase mal escrita para su lectura

Contesta a las siguientes cuestiones:

  1. ¿Cuál de las tres frases te ha costado más leer y por qué? 
  2. ¿Haz conseguido reconocer todas las palabras?
  3. Piensa cómo ha sido el proceso que has seguido para conseguir reconocer las palabras de los tres textos
  4. ¿Crees que un ordenador podría reconocer estos textos?

N0 35 N4D4 F4C1L 93R0 51 MUY D1V3RT1D0

Comparte tu experiencia con tus compañeras y compañeros de clase.

1. Buscando información con los datos...

En esta actividad grupal vamos a buscar en un conjunto de datos que por separados no son relevantes, pero si los procesamos podemos componer una frase que los convierte en una información...

Imagen que describe un conjunto de datos desordenados

Veréis que es más fácil de lo que parece. ¡Ánimo!

Imagen de la lengua de signos que significa hola

Definición:

Los datos hacen referencia a la información que necesita la Inteligencia Artificial para crear modelos para el aprendizaje automático.

Ejemplo:

Esta imagen en la lengua de signos significa hola.

Lumen dice Me encanta poder ayudarte, veamos...

La frase empieza por Andalucía...

2. Pero ¿qué diferencia hay entre dato, información y conocimiento?

Los datos se han convertido en el nuevo petróleo del siglo XXI.  Debido a la gran cantidad de datos que se generan hoy en día, se puede afirmar que la sociedad actual es rica en datos y pobre de conocimiento.

A continuación, aprendamos un poco más sobre los datos.

¿Dato, información o conocimiento?

Entendemos que un dato es un valor que representa un fragmento de una descripción o palabra, cantidad o medida que por sí solo no tienen mucho significado

  • Los datos son la mínima unidad de significado que por sí solos son irrelevantes y no dicen nada importante para la toma de decisiones.
  • Información son datos que han sido agrupados o clasificados para configurar un mensaje que puede ser entendido e interpretado por el receptor. Así que los datos sólo tienen utilidad después de ser procesados según su relevancia e interés.
  • Conocimiento integra los datos y la información con la experiencia, valores y personalidad, permitiendo ser aplicado por las personas en la toma de decisiones. Conocimiento también podría decirse que es el conjunto de informaciones relacionadas sobre algo o alguien en concreto. 

Estos tres términos se relacionan en la denominada pirámide del conocimiento:

Imagen que describe la pirámide del conocimiento

Ejemplos

Ejemplo 1:

  • Dato: 8 (por sí sólo es irrelevante).
  • Información: 8 provincias (el 8 tiene más sentido, se trata del número de provincias y se convierte en una información).
  • Conocimiento: La Comunidad Autónoma de Andalucía está compuesta por 8 provincias. 

Ejemplo 2:

  • Dato: número de personas, sexo, edad, estudios, nivel de estudio de los habitantes de una población.
  • Información: con este conjunto de datos se puede generar información sobre las características de los habitantes de esa población.
  • Conocimiento: se combinan esta información con otras y se utilizan para la planificación de acciones concretas sobre la población en estudio. 

Tipos de datos

Podemos encontrarnos distintos tipos de datos según su origen y estructura:

Imagen que representa los tipos de datos según la ordenación que presentan

  • Datos estructurados: aquellos que ya se diseñan, están ordenados y normalmente provienen de una misma fuente, por ejemplo datos ordenados en una hoja de cálculo, fichas estandarizadas.
  • Datos semiestructurados: presentan cierto orden, aunque no siguen una estructura estandarizada.
  • Datos no estructurados: se reciben diversos datos de distintas fuentes que no están ordenados. Se reciben por email, documentos, encuestas...
  • Base de datos:  es un conjunto organizado de información, de datos estructurados.
  • Motor de base de datos: software que permite almacenar, buscar, extraer información de las bases de datos.

Ciclo de vida de los datos

  1. Se capturan los datos.
  2. Almacenamiento de los datos.
  3. Proceso y análisis de los datos. Aquí toca encontrar patrones, creamos un algoritmo para buscarlos pudiendo encontrar patrones que ni siquiera nos imaginábamos
  4. Exploración y visualización: todos los datos se muestran en los patrones detectados sobre un tablero, gráfico...para que se tengan en cuenta en la toma de decisiones. 

Imagen de un algoritmo

Definición:

Conjunto de instrucciones colocadas de forma correcta que permitan la solución de un problema.

Ejemplo:

En nuestro caso puede ser el programa que creemos para clasificar una palabra en un grupo.

Kardia dice ¿Quieres aprender qué son los metadatos?

El térmico metadatos es usado para referirse a los datos sobre los datos. Por ejemplo cuando un sensor de temperatura envía continuas lecturas de temperatura, también remite la fecha y la hora de cada lectura, siendo estos los metadatos de los datos que toma.

3. Vamos a practicar con los datos

Vamos a trabajar en pareja para poner en práctica lo que sabes sobre los datos.

Clasifica el siguiente conjunto de datos usando el medio que te resulte más adecuado.

Imagen de un conjunto de datos no estructurados

Lumen dice ¿Necesitas ayuda con este ejercicio?

A veces necesitamos un pequeño empujón para poder continuar, no os preocupéis.

Empieza por organizar los datos en subgrupos de forma que su contenido sea similar, puedes organizar los datos similares en columnas de una tabla y nombrar cada subgrupo de forma que su nombre sea representativo de su contenido.

Para facilitarte el trabajo puedes usar cualquiera de los archivos siguientes:

Aprender ¿Qué es el data scraping?

Data scraping

Una de las técnicas usadas en la primera fase de tratamiento de los datos del big data es el data scraping (arañar datos, raspar datos, en español), se refiere a la técnica en la que un programa informático extrae datos del resultado generado por otro programa para analizarlos o utilizarlos en otra parte. Normalmente estos programas simulan la navegación de una persona en internet.

El ejemplo más utilizado es el web scraping que utiliza una aplicación informática para leer y extraer datos valiosos de sitios web de forma automatizada, simulando la navegación web que haría una persona. En el caso de búsqueda de imágenes, el proceso se denomina Image Scraping.

En esta práctica has realizado una tarea similar a la que hace un ordenador cuando ejecuta el data scraping, ya que has obtenido una serie de datos a partir de una imagen y los has analizado, clasificándolos.

4. Datos por todas partes

En la sociedad actual, se están generando multitud de datos de distintas fuentes constantemente.

Imaginad que hablamos de millones de correos electrónicos, fotos, vídeos, operaciones de compra y venta, mensajes de texto, etc, que circulan diariamente por internet.

A continuación os propongo que veáis el siguiente vídeo sobre big data que contiene información muy interesante.

En solo 2 minutos vais a ser conscientes de la enorme cantidad de datos que generamos hoy en día, como por ejemplo:

  • ¿Cuánto tiempo usas al día un smartphone?
  • ¿Por medio de qué acciones generas datos en la red?
  • ¿Por medio de qué dispositivos generamos datos en la red?

¡Increíble! Seguro que os parece muy interesante.

Cuando terminéis de ver este vídeo, os propongo que realicéis de forma individual el siguiente cuestionario. Encontraréis cinco preguntas sobre el Big Data.

4. ¿Cuánto sabes sobre los datos?

Pregunta

1. Por la gran cantidad de datos que se generan en la actualidad, se dice que estamos viviendo una...

Respuestas

a. Revolución nanotecnológica.

b. Revolución analógica.

c. Revolución de datos masivos.

d. transición entre la era analógica y digital.

Pregunta

2. Para alcanzar los 50 millones de usuarios la radio tardó...

Respuestas

a. 2 años.

b. 38 años.

c. 13 años.

d. 4 años.

Pregunta

3. La edición de un periódico digital diario contiene más palabras que las leídas por una persona del siglo XVII durante toda su vida.

Respuestas

a. Verdadero.

b. Falso.

Pregunta

4. La información que generas hoy en día en la web proviene de acciones como:

Respuestas

a. Escribir un diario en papel.

b. Caminar por la arena de la playa.

c. Salir a la calle a jugar con la pelota.

d. Subir un vídeo o foto a Instagram.

Pregunta

5. Hay muchos más bits de información en el mundo que estrellas hay en el Universo.

Respuestas

a. Verdadero.

b. Falso.

Habilitar JavaScript

5. El cuestionario en Google

Una vez que has practicado, accede con tu cuenta y verás un cuestionario debajo. Contesta a las preguntas. ¡Conocerás el resultado al instante!

También puedes acceder desde tu cuenta de Classroom o a través de este enlace (con tu cuenta del instituto)

Creado con eXeLearning (Ventana nueva)