Banca d’Italia ha pubblicato un approfondimento relativo ai modelli di machine-learning per l’identificazione delle anomalie in AnaCredit.
Lo studio affronta il tema dell’identificazione di valori anomali nella rilevazione granulare dei prestiti erogati dalle banche dell’area euro (AnaCredit). Il metodo è basato sul confronto delle informazioni contenute in tale rilevazione con quelle più aggregate presenti in altre fonti (segnalazioni Balance Sheet Item e Financial Reporting).
I risultati sono ottenuti tramite un algoritmo che combina le previsioni (“stacking”) formulate da diversi algoritmi di machine learning.
La metodologia proposta consente di identificare in modo più accurato i potenziali valori anomali presenti nella rilevazione AnaCredit rispetto ai singoli modelli che vengono combinati. Inoltre è agevole determinare la causa dell’anomalia in quanto il controllo è ricondotto a un esercizio di confronto tra AnaCredit e altre basi dati.