Aprendizaje automatizado y análisis predictivo, ¿qué es?
El aprendizaje automatizado o automático (también conocido como machine learning), hace referencia a un tipo de inteligencia artificial (IA) que proporciona a las computadoras la capacidad de aprender por sí solas, sin necesidad de ser programadas explícitamente. Además, se centra en el desarrollo de software que sea capaz de reprogramarse una vez que se expone a nuevos datos de entrada.
De igual forma, el análisis predictivo es un concepto que hace referencia al conjunto de procesos que hacen uso de distintas técnicas computacionales para predecir el futuro utilizando datos del pasado.
El machine learning es la vía de transformación principal que nos está llevando a repensar todo lo que hacemos. Sundai Pichai CEO de Google.
Fuentes de datos para el machine learning
Dado que el aprendizaje automatizado hace uso de datos, a continuación, se presentan una serie de fuentes de datos útiles para el análisis:
- Conjunto de datos de Amazon: contiene un gran número de conjuntos de datos sobre distintas áreas, desde recursos ecológicos hasta transporte público. Ofrece a los usuarios la posibilidad de llevar a cabo filtros con el fin de encontrar el conjunto de datos que está buscando junto con ejemplos de cómo utilizarlo. Cabe destacar que los conjuntos de datos se almacenan en recursos de Amazon Web Services (AWS).
- Conjunto de datos de Microsoft: contiene un repositorio de datos en la nube que tiene por finalidad, la colaboración de la comunidad de investigación global, siendo conocido como Microsoft Research Open Data. Fue lanzado en julio del año 2018.
- Conjunto de datos del Gobierno: Muchos gobiernos de distintos países han lanzado plataformas en las cuáles, es posible obtener datos de muchos tipos de áreas, desde festivales culturales hasta geolocalizaciones de puntos de recogida verde. Éstos tipos de datos se conocen como Open data.
- Motor de búsqueda de datos de Google: Al igual que Microsoft, en el año 2018 Google lanzó una herramienta que facilita el acceso a conjuntos de datos buscados por su nombre. Su principal objetivo es unificar repositorios de datos con la finalidad de que los datos sean accesibles de forma más sencilla.
Gmail, un ejemplo de aplicación que usa aprendizaje automatizado
Muchas veces, cuando comenzamos a escribir un correo electrónico haciendo uso del correo de Google (Gmail), éste nos comienza a autocompletar las frases, adelantándose a lo que queríamos escribir. Es ahí donde entra la predicción de futuro de Google, ya que se basa en correos que hemos escrito anteriormente.