Ecco come vengono addestrati gli algoritmi che guidano le nostre vite

La definizione di AI rilevante nel contesto regolatorio europeo si rinviene nell’articolo 3 del AI Act, che fornisce il perimetro concettuale per distinguere i sistemi di intelligenza artificiale che richiedono specifiche tutele e obblighi.

AI Act definisce:

“…si intende un sistema basato su macchine, progettato per operare con diversi livelli di autonomia e che può manifestare capacità di adattamento dopo la sua messa in servizio, e che, sulla base di obiettivi espliciti o impliciti, deduce – a partire dagli input che riceve – come generare output quali previsioni, contenuti, raccomandazioni o decisioni in grado di influenzare ambienti fisici o virtuali”.

In termini pratici, questa definizione sottolinea tre elementi essenziali: l’autonomia del sistema, la capacità di apprendimento o adattamento dopo la distribuzione e la produzione di output con effetti sul mondo fisico o digitale. Tali caratteristiche orientano la classificazione del rischio e gli obblighi di conformità imposti ai fornitori e agli utilizzatori.

Principali modalità di addestramento dei sistemi di intelligenza artificiale

Esistono diverse metodologie per addestrare un sistema di intelligenza artificiale, ciascuna con specifiche implicazioni tecnologiche, operative e normative. Di seguito sono illustrate le principali, insieme ai loro punti di forza, limiti e casi d’uso tipici.

Apprendimento supervisionato: è la tecnica più diffusa per problemi di classificazione e regressione. Il modello viene addestrato su dataset etichettati in cui gli input corrispondono a output desiderati; la qualità e la rappresentatività delle etichette determinano in larga misura l’accuratezza e i bias del sistema.

Apprendimento non supervisionato: il modello esplora strutture e pattern nei dati senza etichette predefinite. Viene utilizzato per raggruppamenti (clustering), riduzione della dimensionalità e scoperta di anomalie; è utile quando le etichette sono costose o impossibili da ottenere.

Apprendimento per rinforzo: il sistema apprende interagendo con un ambiente e ricevendo feedback sotto forma di ricompense o penalità. È la metodologia scelta per problemi sequenziali o per l’ottimizzazione di politiche decisionali complesse, come robotica o giochi strategici.

Apprendimento auto-supervisionato: combina aspetti di supervisione e non supervisione creando compiti proxy (pretext tasks) dai dati non etichettati. Questa tecnica è particolarmente efficace per il pretraining di modelli di linguaggio e visione, riducendo la dipendenza da grandi dataset etichettati manualmente.

Transfer learning: consiste nel riutilizzare un modello preaddestrato su un dominio diverso e adattarlo a compiti specifici mediante una fase di fine-tuning. Questo approccio accelera l’apprendimento e riduce i requisiti di dati specifici per il nuovo compito.

Federated learning: permette l’addestramento distribuito di modelli senza centralizzare i dati sensibili. I singoli dispositivi o nodi aggiornano il modello localmente e inviano soltanto pesi o aggiornamenti aggregati, migliorando la privacy e la conformità a normative sulla protezione dei dati.

Apprendimento online: il modello si aggiorna continuamente con nuovi dati in ingresso, adattandosi a cambiamenti del contesto o della distribuzione. È utile in scenari dinamici ma impone controlli rigorosi per evitare deriva indesiderata e degradazione delle prestazioni.

Fine-tuning e pretraining: il pretraining su grandi corpora fornisce una base generale; il fine-tuning successivo specializza il modello per compiti concreti. Questa combinazione è alla base di molti sistemi contemporanei di linguaggio e visione artificiale.

Aspetti tecnici, etici e normativi rilevanti

La scelta della tecnica di addestramento influisce direttamente su rischi come discriminazione, perdita di privacy, vulnerabilità a manipolazioni e opacità decisionale. Per questo motivo, il AI Act e le politiche nazionali richiedono requisiti specifici in relazione alla governance dei dati, alla documentazione (ad esempio model cards), ai test di robustezza e alla trasparenza delle prestazioni.

La Commissione Europea e le autorità degli Stati membri promuovono un approccio basato sul rischio: sistemi con potenziali impatti significativi sulla sicurezza, sui diritti fondamentali o sulla salute pubblica sono soggetti a obblighi stringenti di valutazione e sorveglianza prima dell’immissione sul mercato.

Dal punto di vista operativo, le organizzazioni devono implementare processi di gestione del ciclo di vita del modello che comprendano la selezione e la pulizia dei dati, strategie per mitigare i bias, piani di monitoraggio post-deployment e procedure per interventi correttivi. L’adozione di pratiche come la validazione indipendente e audit tecnici rafforza la responsabilità e la conformità.

Implicazioni pratiche per fornitori e utilizzatori

I fornitori di soluzioni devono progettare pipeline di addestramento replicabili e documentate, dimostrando l’origine e la qualità dei dataset. Gli utilizzatori finali, soprattutto in settori regolamentati (sanità, trasporti, pubblica amministrazione), devono valutare i rischi residui e richiedere garanzie contrattuali sulla provenienza dei modelli e sui processi di aggiornamento.

Inoltre, la diffusione di metodologie come il federated learning e l’auto-supervisionato sta cambiando i confini della responsabilità: pur migliorando la protezione della privacy, introducono complessità nel controllo della qualità e nella tracciabilità degli aggiornamenti del modello.

Prospettive e raccomandazioni

Per ridurre i rischi e favorire un’adozione responsabile del machine learning, è consigliabile che organizzazioni e istituzioni:

1. sviluppino e mantengano documentazione trasparente sui dataset e sulle pipeline di addestramento;

2. adottino pratiche di testing e validazione indipendenti, comprensive di analisi di bias e scenari avversi;

3. implementino meccanismi di monitoraggio continuo e di rollback per intervenire tempestivamente in caso di degrado o di comportamenti non previsti;

4. considerino soluzioni tecniche e organizzative per la protezione dei dati e la minimizzazione dei rischi, conciliando innovazione e tutela dei diritti fondamentali.

Queste misure, connesse a un quadro normativo in evoluzione, mirano a garantire che i benefici derivanti dall’impiego di intelligenza artificiale siano massimizzati minimizzando al contempo rischi sistemici e impatti negativi sulla società.



Author: Tony
Redazione Finanza Flash. Notizie di finanza, mercati, borsa e macroeconomia in tempo reale. Aggiornamenti su investimenti, banche, BCE ed economia italiana.