Introducción al machine learning con aplicaciones al riesgo de crédito

El uso de modelos estadísticos para predecir riesgo bancario es una práctica estandarizada en el sector financiero. Entre las herramientas más usadas destacan los modelos de regresión, sobre todo, para la predicción de impago y la construcción de scores de crédito. Sin embargo, la explotación, la generación y disponibilidad de datos en los últimos veinte años conjuntamente con el desarrollo de nuevos modelos cuantitativos, han permitido utilizar los datos para obtener un mejor desempeño en la predicción del riesgo. En efecto, la evidencia sugiere que los métodos de Machine Learning pueden lograr una mayor asertividad que los modelos tradicionales, principalmente, a través de estimaciones funcionales más flexibles. Este hallazgo no es trivial ya que incluso pequeñas mejoras en el desempeño de los modelos pueden traducirse en aumentos significativos de rentabilidad.

Facilitador: José Antonio Pellerano

Con más de 15 años de experiencia como econometrista aplicado ha participado en diversos proyectos de consultoría e investigación incluyendo colaboraciones con Nestlé Dominicana, Banco Mundial, Banco Interamericano de Desarrollo, la Empresa Eléctrica de Quito, la Dirección General de Impuestos Internos, la Vicepresidencia de la República, el Ayuntamiento del Distrito Nacional, el Sistema Único de Beneficiarios, Analytica, entre otros. También ha impartido docencia a nivel de grado en los Estados Unidos y a nivel de posgrado en la República Dominicana. Obtuvo su doctorado en Economía de la Universidad de Texas A&M, una maestría en Economía de la Pontificia Universidad Católica de Chile y una licenciatura en Economía de la Pontificia Universidad Católica Madre y Maestra. Sus investigaciones y consultorías más recientes se concentran en la aplicación de métodos experimentales y cuasiexperimentales con el objetivo principal de fomentar la toma de decisiones basada en evidencia tanto a nivel público como privado. Asimismo, también ha desarrollado diferentes iniciativas de Data Science para promover la capacitación y explotación de datos en el país en un sentido amplio.

Objetivo:

El objetivo principal de este curso es que el participante sea capaz de desarrollar sus primeros modelos de Machine Learning aplicados a riesgo de crédito. Más allá, se busca fomentar la curiosidad y el empoderamiento del participante de tal forma que pueda adaptar el conocimiento adquirido a las necesidades de su institución. La metodología está basada en la discusión y aplicación de códigos con ejemplos prácticos (learning by doing). El formato del curso es presencial con el objetivo de promover la discusión entre los participantes. El curso será desarrollado en “R” e incluye una introducción a este lenguaje de programación por lo que no se requiere conocimiento previo, aunque es recomendable

Contenido certificación por módulos:

1- INTRODUCCIÓN AL MACHINE LEARNING

a) Machine Learning, Inteligencia Artificial y Ciencia de Datos

b) Conceptos básicos de Machine Learning

c) Ejemplo práctico

2- INTRODUCCIÓN A “R”

a) Manejo y descripción de datos

b) Visualización de datos

c) Códigos con ejemplos

3- MODELACIÓN ESTADÍSTICA

a) Modelo logístico

b) Modelos de Machine Learning

c) Conceptos importantes

i-   Cross Validation

ii-  Tuning

iii- Overfitting

d) Métricas de desempeño de modelos

e) Aplicaciones:

i-  Modelo de originación de crédito

ii- Modelo de comportamiento crediticio (Behavioral Scoring)