En esta sesión explicaremos la arquitectura de los modelos secuenciales (RNNs y LSTMs) y cómo aplicarlos a casos prácticos como la resolución de un problema de clasificación.
Notebook
Recursos adicionales
- Understanding The Recurrent Neural Network | Post by Amit Shekhar
- Recurrent Neural Networks and LSTM explained | Post by Purnasai Gudikandula
- Understanding LSTM and its diagrams | Post by Shi Yan
- How do LSTM networks solve the Problem of Vanishing Gradients | Post by Nir Arbel
- How RNNs and LSTMs work | Video by Brandon Rohrer
Papers
- Long Short-Term Memory: paper donde se introdujeron las LSTMs.
➡️ Siguiente sesión:Arquitectura Transformer