2.1 - Laryngeal high-speed video classification (attivo)

Pagina 6 di 11

Laryngeal high-speed video classification (Classificazione video ad alta velocità della laringe)

L'identificazione automatica dei disordini della voce è uno dei particolari campi di interesse del lavoro di Daniel Voigt. Registrazioni audio del segnale acustico della voce sono analizzate con software specializzati nel quantificare la quantità di perturbazione (rumore) nel segnale. Attraverso la funzione automatica di estrazione dalle registrazioni ed il successivo apprendimento automatico, gli schemi di movimento della laringe possono essere quantitativamente catturati ed automaticamente classificati secondo le diverse categorie diagnostiche.

Un particolare campo di interesse in questo contesto medico è il riconoscimento automatico dei disturbi vocali, con conseguente raucedine percepibile. Comunemente, per questo scopo, le registrazioni audio del segnale acustico vocale sono analizzate con software specializzati nel quantificare il disturbo (rumore) del segnale. Tuttavia, questo tipo di analisi acustica non consente la chiara attribuzione di determinati quadri clinici in una serie distinta di parametri di disturbo.

Un approccio per la diagnosi della voce consiste in un esame endoscopico della produzione del suono delle corde vocali nella laringe per mezzo di telecamere digitali ad alta velocità. Queste telecamere sono in grado di registrare i movimenti della laringe ad un frame rate di diverse migliaia di immagini al secondo consentendo l'analisi in tempo reale. Tuttavia, il compito di analizzare manualmente il video ad alta velocità risultante è lungo e soggetto a errori. Attraverso la funzione automatica di estrazione dalle registrazioni ed il successivo apprendimento automatico, gli schemi di movimento della laringe possono essere quantitativamente catturati ed automaticamente classificati secondo diverse categorie diagnostiche (es. funzionali od organici disfonie).

Attraverso l'infrastruttura distributedDataMining, abbiamo valutato un gran numero di paradigmi di apprendimento automatico (ad esempio macchine a vettori di supporto, Reti Neurali Artificiali) e le corrispondenti strategie di ottimizzazione dei parametri (ad esempio ricerca Grid, la strategia di Evolution, algoritmi genetici). Questa fase di valutazione preliminare ci ha permesso di individuare alcuni sistemi di apprendimento e parametri che sono particolarmente adatti per l'attività clinica di classificazione. Dettagli sulla metodologia proposta e dei risultati di classificazione ottenuti possono essere trovati in [1] , [2] e [3] .

Referenze

Voigt D. Objective Analysis and Classification of Vocal Fold Dynamics from Laryngeal High-Speed Recordings. Aachen: Shaker Verlag GmbH; 2010.
Voigt D, Döllinger M, Braunschweig T, Yang A, Eysholdt U, Lohscheller J. Classification of functional voice disorders based on phonovibrograms. Artificial Intelligence in Medicine. 2010;49(1):51-9.
Voigt D, Lohscheller J, Döllinger M, Yang A, Eysholdt U. Automatic diagnosis of vocal fold paresis by employing phonovibrogram features and machine learning methods. Comput Methods Programs Biomed. 2010;99(3):275-88.

Distributed DataMining - 2.1 - Laryngeal high-speed video classification (attivo)

Indice articoli

Referenze

Articoli

Approfondimenti

Iniziative

Blog