top of page

L’AI al servizio della salute dei lavoratori: la nuova frontiera della refertazione assistita nella medicina del lavoro

  • Pietro Giovanni Verga
  • 12 feb
  • Tempo di lettura: 5 min

Negli ultimi anni si è assistito ad un rapido incremento nell’adozione di strumenti di Intelligenza Artificiale, anche in ambito medico ed ospedaliero. Questa rivoluzione è nata dall’esigenza di una tecnologia capace di elaborare grandi quantità di dati in modo più rapido ed efficiente rispetto alle capacità umane. Secondo alcune stime, gli algoritmi di AI in campo sanitario avrebbero il potenziale di migliorare gli esiti dei pazienti dal 30% al 40% e di ridurre i costi di trattamento fino al 50%. Tra le principali aree di applicazione di questa tecnologia si menzionano: diagnosi e rilevamento precoce di malattie, personalizzazione dei trattamenti (medicina di precisione), scoperta di farmaci ed efficientamento del flusso di lavoro clinico tramite l’automatizzazione di alcune attività di assistenza non diretta al paziente. Nonostante le incoraggianti premesse, l’implementazione dell’AI nel contesto reale incontra diversi ostacoli: qualità e disponibilità dei dati, bias, trasparenza e la possibilità di ripercorrere il processo decisionale, oltre che l’accettazione di tali tecnologie da parte del personale sanitario.

In questa prospettiva si inserisce la Medicina del Lavoro, una disciplina scientifica che studia le relazioni tra il lavoro, la professione e la salute umana, incluse le malattie e gli infortuni. Lo scopo principale di questa disciplina è la prevenzione dei danni alla vita e alla salute dei lavoratori. In medicina del lavoro, gli esami e le visite mediche mirano a valutare l’idoneità del lavoratore alla mansione specifica e a monitorare la sua salute in relazione ai rischi professionali.

Nel corso del 2025, presso Kryax, abbiamo sviluppato dei modelli di Deep Learning per supportare il medico nella fase di valutazione e refertazione di due esami chiave nella medicina del lavoro: l’audiometria e la spirometria.

Nello specifico:


  • Esame audiometrico (o audiometria) è una tecnica diagnostica impiegata per misurare l’udito e valutare i deficit uditivi. La prevalenza dell’ipoacusia (perdita dell’udito) varia con l’età ma l’ipoacusia da rumore risulta essere la più frequente malattia professionale, a testimonianza del fatto che il rumore è l’inquinante più diffuso negli ambienti di lavoro. Durante l’esame audiometrico a toni puri e di ricerca della soglia si determina il suono più debole (soglia uditiva) che il paziente può udire al 50% delle volte per ciascuna frequenza. Tali informazioni vengono riportate, al termine di ogni esame, in un audiogramma: un grafico che rappresenta le soglie uditive per ogni frequenza. L’esito dell’esame è associato alla classificazione delle soglie audiometriche secondo il sistema MPB (Merluzzi, Pira, Bosio).


  • Esame spirometrico (o spirometria) è un test fisiologico che misura i volumi massimi di aria che un individuo può inspirare ed espirare e la velocità con cui può farlo, in funzione del tempo. Si tratta di un test che dipende in maniera preponderante dalla collaborazione del paziente, che deve eseguire delle manovre respiratorie mentre è collegato con la bocca al boccaglio dello spirometro. La manovra eseguita ai fini dell’esame prevede: inspirazione massimale fino alla capacità polmonare totale (TLC), blast di espirazione, espirazione completa continua fino ad un massimo di 15 secondi o fino al raggiungimento di un plateau ed inspirazione massimale dopo l’espirazione forzata. Durante l’esecuzione di una spirometria, oltre alla rilevazione di alcuni parametri, vengono generati due grafici: volume-tempo (gas esalato in funzione del tempo) e flusso-volume (velocità del flusso in funzione del volume espirato). La comparazione di alcuni dei parametri misurati (FVC, FEV1, FEV1/VC, PEF, FEF25-75) con dei valori di riferimento consente l’individuazione di ostruzioni delle vie aeree (asma o broncopneumopatia cronica ostruttiva) oppure suggerire un pattern polmonare restrittivo.


A seguito dell’acquisizione e dell’anonimizzazione dei dati, sono stati costruiti i dataset per le due tipologie di esame: circa 37000 esami audiometrici e circa 51000 esami spirometrici corredati da informazioni mediche su ogni paziente.

La maggior parte del lavoro si è configurata durante le operazioni di pre-processing dei dati. In particolare, sono stati effettuati: sostituzione dei valori mancanti di conduzione ossea ed aerea tramite interpolazione lineare, eliminazione delle righe con valori mancanti, riformulazione delle feature audiometriche in un formato maggiormente generalizzabile, normalizzazione dei dati e filtraggio del dataset. Considerato l’elevato sbilanciamento degli outcome clinici verso le classi di normalità, sono state sperimentate tecniche di oversampling sintetico delle classi minoritarie e di weighted sampling.

Una volta predisposti i dataset per il training, sono stati sviluppati ed addestrati i modelli predittivi, considerando più architetture e valutandone le performance. È stato sviluppato un sistema a cascata per entrambi gli esami strumentali: in una prima fase un modello binario distingue tra situazioni di normalità e non normalità, seguito da un sistema multiclasse per identificare le specifiche condizioni patologiche. In tutti i casi sono state sperimentate delle reti Multi-Layer Perceptron con tre hidden layer da 128, 64 e 32 neuroni, Batch Normalization e Dropout. Per la classificazione multiclasse degli esami audiometrici è stato infine sperimentato un framework per dati tabellari che codifica ogni riga del dataset in un embedding e utilizza un’architettura di tipo transformer con self-attention multi-head e meccanismi di gating.

In aggiunta ai modelli realizzati, è stato predisposto un sistema di valutazione della qualità delle curve spirometriche, in grado di attribuire un punteggio ad ogni esame in relazione ad alcuni aspetti definiti nelle linee guida ATS/ERS e ad osservazioni tecniche dedotte dal set di dati: BEV e tempo di espirazione conforme agli standard, Dip Then Rise (individuazione di discese e successive risalite elevate del flusso, indicatore di possibili artefatti), monotonia della curva, basso rumore e raggiungimento del plateau (cambiamento di volume inferiore a 0.025L per almeno 1 secondo al termine dell’espirazione). Tale sistema ha consentito di trarre importanti considerazioni in merito alle modalità di acquisizione degli esami, richiamando l’attenzione sull’importanza della correttezza dei referti e l’adozione delle best-practice cliniche.


I risultati dei modelli di AI hanno evidenziato prestazioni elevate in termini di F1-score ponderato, confermando l’efficacia delle architetture adottate nei diversi scenari clinici analizzati:

  • Nelle audiometrie, la classificazione binaria tra condizioni normali e patologiche raggiunge il miglior risultato complessivo, con un F1-score ponderato pari a 0.95 ottenuto mediante architettura MLP. Nella classificazione multiclasse dei diversi livelli di perdita uditiva le performance si mantengono solide con un F1-score ponderato fino a 0.92 con l’approccio basato su transformer, garantendo risultati lievemente superiori rispetto all’impiego dell’architettura MLP.

  • Nelle spirometrie, limitatamente alla classificazione binaria, l’architettura MLP consente di ottenere un F1-score ponderato fino a 0.94, indicando comunque una performance elevata e consistente. L’estensione ad un approccio multiclasse non è stata approfondita poiché le categorie erano numerose e fortemente sottorappresentate, rendendo difficile addestrare un modello stabile e garantire predizioni affidabili per tutte le classi.

I sistemi di Intelligenza Artificiale proposti rappresentano strumenti di supporto alla decisione clinica e richiedono pertanto un’interazione continua tra AI e medico. In questo contesto assume rilevanza il concetto di dominio tecnologico, ossia l’influenza che un sistema di AI può esercitare sul giudizio umano. Parallelamente, la qualità e la standardizzazione dei dati nei processi clinici rivestono un ruolo fondamentale, al fine di garantire uniformità e accuratezza delle predizioni.


bottom of page