Ecco come vengono addestrati gli algoritmi che guidano le nostre vite
- 18 Novembre 2025
- Posted by: Tony
- Categoria: Aziende
La definizione di AI rilevante nel contesto regolatorio europeo si rinviene nell’articolo 3 del AI Act, che fornisce il perimetro concettuale per distinguere i sistemi di intelligenza artificiale che richiedono specifiche tutele e obblighi.
AI Act definisce:
“…si intende un sistema basato su macchine, progettato per operare con diversi livelli di autonomia e che può manifestare capacità di adattamento dopo la sua messa in servizio, e che, sulla base di obiettivi espliciti o impliciti, deduce – a partire dagli input che riceve – come generare output quali previsioni, contenuti, raccomandazioni o decisioni in grado di influenzare ambienti fisici o virtuali”.
In termini pratici, questa definizione sottolinea tre elementi essenziali: l’autonomia del sistema, la capacità di apprendimento o adattamento dopo la distribuzione e la produzione di output con effetti sul mondo fisico o digitale. Tali caratteristiche orientano la classificazione del rischio e gli obblighi di conformità imposti ai fornitori e agli utilizzatori.
Principali modalità di addestramento dei sistemi di intelligenza artificiale
Esistono diverse metodologie per addestrare un sistema di intelligenza artificiale, ciascuna con specifiche implicazioni tecnologiche, operative e normative. Di seguito sono illustrate le principali, insieme ai loro punti di forza, limiti e casi d’uso tipici.
Apprendimento supervisionato: è la tecnica più diffusa per problemi di classificazione e regressione. Il modello viene addestrato su dataset etichettati in cui gli input corrispondono a output desiderati; la qualità e la rappresentatività delle etichette determinano in larga misura l’accuratezza e i bias del sistema.
Apprendimento non supervisionato: il modello esplora strutture e pattern nei dati senza etichette predefinite. Viene utilizzato per raggruppamenti (clustering), riduzione della dimensionalità e scoperta di anomalie; è utile quando le etichette sono costose o impossibili da ottenere.
Apprendimento per rinforzo: il sistema apprende interagendo con un ambiente e ricevendo feedback sotto forma di ricompense o penalità. È la metodologia scelta per problemi sequenziali o per l’ottimizzazione di politiche decisionali complesse, come robotica o giochi strategici.
Apprendimento auto-supervisionato: combina aspetti di supervisione e non supervisione creando compiti proxy (pretext tasks) dai dati non etichettati. Questa tecnica è particolarmente efficace per il pretraining di modelli di linguaggio e visione, riducendo la dipendenza da grandi dataset etichettati manualmente.
Transfer learning: consiste nel riutilizzare un modello preaddestrato su un dominio diverso e adattarlo a compiti specifici mediante una fase di fine-tuning. Questo approccio accelera l’apprendimento e riduce i requisiti di dati specifici per il nuovo compito.
Federated learning: permette l’addestramento distribuito di modelli senza centralizzare i dati sensibili. I singoli dispositivi o nodi aggiornano il modello localmente e inviano soltanto pesi o aggiornamenti aggregati, migliorando la privacy e la conformità a normative sulla protezione dei dati.
Apprendimento online: il modello si aggiorna continuamente con nuovi dati in ingresso, adattandosi a cambiamenti del contesto o della distribuzione. È utile in scenari dinamici ma impone controlli rigorosi per evitare deriva indesiderata e degradazione delle prestazioni.
Fine-tuning e pretraining: il pretraining su grandi corpora fornisce una base generale; il fine-tuning successivo specializza il modello per compiti concreti. Questa combinazione è alla base di molti sistemi contemporanei di linguaggio e visione artificiale.
Aspetti tecnici, etici e normativi rilevanti
La scelta della tecnica di addestramento influisce direttamente su rischi come discriminazione, perdita di privacy, vulnerabilità a manipolazioni e opacità decisionale. Per questo motivo, il AI Act e le politiche nazionali richiedono requisiti specifici in relazione alla governance dei dati, alla documentazione (ad esempio model cards), ai test di robustezza e alla trasparenza delle prestazioni.
La Commissione Europea e le autorità degli Stati membri promuovono un approccio basato sul rischio: sistemi con potenziali impatti significativi sulla sicurezza, sui diritti fondamentali o sulla salute pubblica sono soggetti a obblighi stringenti di valutazione e sorveglianza prima dell’immissione sul mercato.
Dal punto di vista operativo, le organizzazioni devono implementare processi di gestione del ciclo di vita del modello che comprendano la selezione e la pulizia dei dati, strategie per mitigare i bias, piani di monitoraggio post-deployment e procedure per interventi correttivi. L’adozione di pratiche come la validazione indipendente e audit tecnici rafforza la responsabilità e la conformità.
Implicazioni pratiche per fornitori e utilizzatori
I fornitori di soluzioni devono progettare pipeline di addestramento replicabili e documentate, dimostrando l’origine e la qualità dei dataset. Gli utilizzatori finali, soprattutto in settori regolamentati (sanità, trasporti, pubblica amministrazione), devono valutare i rischi residui e richiedere garanzie contrattuali sulla provenienza dei modelli e sui processi di aggiornamento.
Inoltre, la diffusione di metodologie come il federated learning e l’auto-supervisionato sta cambiando i confini della responsabilità: pur migliorando la protezione della privacy, introducono complessità nel controllo della qualità e nella tracciabilità degli aggiornamenti del modello.
Prospettive e raccomandazioni
Per ridurre i rischi e favorire un’adozione responsabile del machine learning, è consigliabile che organizzazioni e istituzioni:
1. sviluppino e mantengano documentazione trasparente sui dataset e sulle pipeline di addestramento;
2. adottino pratiche di testing e validazione indipendenti, comprensive di analisi di bias e scenari avversi;
3. implementino meccanismi di monitoraggio continuo e di rollback per intervenire tempestivamente in caso di degrado o di comportamenti non previsti;
4. considerino soluzioni tecniche e organizzative per la protezione dei dati e la minimizzazione dei rischi, conciliando innovazione e tutela dei diritti fondamentali.
Queste misure, connesse a un quadro normativo in evoluzione, mirano a garantire che i benefici derivanti dall’impiego di intelligenza artificiale siano massimizzati minimizzando al contempo rischi sistemici e impatti negativi sulla società.