Antes de continuar, es importante comprender las técnicas de evaluación del modelo de serie temporal. Esto le ayuda a saber qué tan bueno es el rendimiento de su modelo en un conjunto de datos no visto.
Objetivos de aprendizaje
- Evaluación de modelos de series temporales
- Diferentes Métricas para Evaluar Modelos de Series Temporales
Evaluación del modelo de serie temporal
La evaluación de un modelo de series de tiempo tiene ciertas similitudes con la evaluación de algoritmos generales de aprendizaje automático, pero también tiene ciertas complejidades que son muy singulares debido al componente de tiempo involucrado en este caso.
Si recuerda los modelos generales de aprendizaje automático, para evaluarlos, lo primero que hicimos fue dividir el conjunto de datos usando train_test_split, que dividía aleatoriamente el conjunto de datos en conjuntos de entrenamiento y validación. En los modelos normales de aprendizaje automático, el orden de los datos no era muy importante.
Pero en el caso de las series temporales, hemos estado observando que el orden de los datos es lo más importante. Entonces, en este caso, no podemos usar train_test_split para dividir el conjunto de datos en conjuntos de entrenamiento y validación. Si recuerda la implementación del modelo autorregresivo en la lección anterior, el tutor había tomado el primer 80 % de los datos en secuencia como conjunto de tren y el 20 % restante en secuencia como conjunto de validación. Esta forma de dividir el conjunto de datos para la evaluación del modelo funciona para datos de series temporales.
Métricas de evaluación para datos de series temporales
Las series de tiempo generalmente se enfocan en predecir valores reales, llamados problemas de regresión. Por lo tanto, las medidas de rendimiento utilizadas para los problemas de regresión normales también funcionan para los problemas de series de tiempo. Algunas de las métricas estándar se enumeran a continuación:
- Error cuadrático medio (MSE)
- Error cuadrático medio (RMSE)
- Error Absoluto Medio (MAE)
- Raíz del error cuadrático logarítmico medio (RMSLE)
Este curso asume que conoce todas las métricas de evaluación utilizadas para el análisis de regresión. Por lo tanto, no profundizaremos en estas métricas.