Una serie temporal (o cronológica) conforma un conjunto de datos u observaciones que han sido medidos en determinados momentos y que además, han sido ordenados cronológicamente. Dichos datos pueden encontrarse espaciados a intervalos iguales o diferentes.
Características de las series temporales
Las características que presentan las series temporales se enumeran a continuación:
- El orden de los datos importa. Hay que diferenciar qué tipo de datos son datos del pasado, y cuáles son datos del futuro. El almacén de datos tiene una calidad temporal. El tiempo es la única dimensión importante que deben soportar todos los almacenes de datos. Los datos para el análisis de múltiples fuentes contienen múltiples puntos de tiempo (por ejemplo, vistas diarias, semanales, mensuales).
- Las observaciones de datos no son independientes, es decir, los datos del pasado importan en el futuro. Por ejemplo el PIB (Producto Interior Bruto) actual depende de los datos del PIB de hace años, en cambio, al lanzar un dado, no interviene en ningún caso los números que hayan salido en anteriores tiradas.
Series temporales aplicadas a los negocios
Un ejemplo de aplicación de las series temporales en inteligencia de negocios se encuentra dentro de la previsión de ventas. Las series temporales suelen ser representadas a través de un diagrama cartesiano (un plano que cuenta con el eje X o abscisas y con el eje Y u ordenada) donde se sitúan los datos.
El eje de las abscisas representa la variable semanas, meses o años y el eje de las ordenadas los datos del fenómeno.
La proyección de series de temporales
Con el pronóstico de series temporales, los datos son una serie de valores de la misma variable que se captura y almacena a lo largo del tiempo. Estos datos se utilizan para desarrollar modelos para extrapolar los valores futuros del mismo fenómeno.
El pronóstico de valores futuros utilizando datos históricos es un enfoque metodológico común, desde una simple extrapolación hasta métodos estocásticos sofisticados como ARIMA.
Identificacion de anomalías
Un valor atípico en un conjunto de datos temporal representa una anomalía. Ya sea que se desee (por ejemplo, margen de beneficio) o no (por ejemplo, costo), los valores atípicos detectados en un conjunto de datos pueden ayudar a prevenir consecuencias no deseadas.
Los 4 elementos a identificar en una serie temporal
Existen cuatro elementos que deben ser identificados en una serie temporal:
● Tendencia. Representa el crecimiento o decrecimiento de los valores a largo plazo. Por ejemplo, el crecimiento de usuarios que hacen uso de una aplicación.
● Variaciones cíclicas. Representan las variaciones de tendencia que se producen en plazos mayores a un año. Por ejemplo, los beneficios al año de una empresa.
● Variaciones estacionales. Representan las variaciones de tendencia que se producen en menos de un año. Por ejemplo, las ventas en primavera.
● Variaciones residuales. Representan las variaciones de tendencia que se producen de manera aleatoria ya sea por falta de datos o por sucesos inesperados. Por ejemplo, un suceso meteorológico inesperado.
Ventajas e inconvenientes de las series temporales:
Las series temporales presentan, como todas las herramientas de análisis, ventajas e inconvenientes. Los siguientes puntos describen la principal ventaja y desventaja:
Ventaja
Una gran ventaja que presentan las series temporales es la posibilidad de proporcionar un análisis bastante amplio de datos cuantitativos acumulados a lo largo de un periodo de tiempo, lo que permite llevar a cabo pronósticos.
Desventaja
En muchas ocasiones, el uso de series temporales no suele ser muy útil debido a la escasez de datos longitudinales donde pueden existir variaciones residuales que compliquen los análisis.
Lecturas relacionadas con técnicas de data mining:
Arboles de decisión
Clustering
Regresión
Redes neuronales – ANN