Valutazione attuale: 0 / 5

Stella inattivaStella inattivaStella inattivaStella inattivaStella inattiva
 
banner_edges




Patient Readmission Application

Frequentemente il ricovero di un paziente ha significative conseguenze organizzative per gli ospedali. Quindi il ricovero d'urgenza di un paziente può essere utilizzato come un indicatore in un quadro di valutazione delle prestazioni dove gli ospedali sono classificati sulla base sul loro livello di ricoveri.

Sfida
Nel contesto della profilazione degli ospedali, utilizzare un dataset completo non è pratico.Tuttavia, un'analisi di un gruppo gerarchico viene eseguita su tutti i pazienti di un gruppo con similarità basate sulla forma della funzione di distribuzione cumulativa della durata del ricovero (Lenght of Stay - LOS) nella communità prima del ricovero. Perciò un dataset veramente grande è decomposto in raggruppamenti di sottogruppi di pazienti che hanno un LOS simile. Questi raggruppamenti di sottogruppi di pazienti sono poi campionati ed un valore di rank (basato su un modello di transizione multilivello) è assegnato per ogni ospedale in ogni campione. Infine, i risultati provenienti dai diversi campionamenti sono aggregati per arrivare al risultato finale.
Al fine di raggiungere il livello desiderato di accuratezza, la procedura di campionamento e ranking è ripetuta diverse volte, tipicamente nell'ordine di migliaia per ciclo di produzione, e può richiedere giorni per essere completato su un singolo processore. Tuttavia, come questi campionamenti e le loro seguenti analisi sono indipendenti da ogni altra, l'elaborazione di loro può essere parallelizzata utilizzando il modello master-lavoratore ed un'infrastruttura Desktop Grid.

pra_infrastructure

 

 

 

 

 

 

 

 

Utenti
Gli utenti primari dell'applicazione sono i ricercatori del Gruppo di Modellazione della Salute e della Cura Sociale dell'Università di Westminster. Tuttavia, modelli statistici basati sul pacchetto statistico R è ampiamente utilizzato in diverse discipline. Quindi l'implementazione con il progetto EDGeS può servire come un'implementazione di riferimento per altri compiti simili.

Soluzione
L'applicazione è stata portata ed eseguita sulla UK National Grid Service (NGS) prima del progetto EDGeS. Questa implementazione utilizza la versione 2.5 del portale P-GRADE grid ed implementa un flusso di lavoro con parametro mobile per esecuzioni multiple degli script d'analisi R. L'applicazione può solamente utilizzare due siti NGS (Rutherford e Westminster) dove il pacchetto R è stato pre-distribuito. Come le risorse del gruppo di destinazione potrebbe facilmente diventare un collo di bottiglia per l'esecuzione, le risorse desktop offerte da EDGeS forniscono una soluzione adatta ad eseguire l'applicazione più veloce.
Nella versione desktop grid l'applicazione master ottiene il file del gruppo con tutti i dati relativi ai pazienti. Il master, poi, estende lo script R puro con un file di comandi specfici, crea le workunit contenenti lo script R e il file del gruppo come input. L'applicazione worker risolve i file di input ed esegue lo script R nei tempi specificati su campionamenti casuali del file del gruppo. Una volta terminato, il worker spedisce i file generati in zip indietro all'applicazione master. Il master raccoglie i file di output ed esegue uno script che sintetizza gli output.

Risultati
La prestazione dell'applicazione è stata testata sul Westminster Local Desktop Grid (WLDG) con un database pazienti che contiene circa 1 milione di record. Una iterazione, che è l'analisi statistica di 1000 record casuali, è stata eseguita 100, 1000, 10000, 30000 e 100000 volte. Il massimo incremento raggiunto utilizzando le risorse desktop è stato di 300.
L'applicazione è distribuita a livello produzione sul WLDG e le versioni EGEE e BOINC sono scaricabili dal repository produzione di EDGeS.

Background
Il Dipartimento della Salute del Regno Unito rilascia annualmente il suo database nazionale, l'Hospital Episode Statistics (HES). Il dataset HES descrive un periodo di 7 anni finanziari e contiene approssimativamente 80 milioni di episodi anonimi in totale. Il Gruppo di Modellazione della Salute e della Cura Sociale dell'Università di Westminster utilizza questi dati per definire un quadro per la classifica delle prestazioni ospedaliere.
Il dataset HES è memorizzato su un database MySQL. I raggruppamenti sono estratti utilizzando algoritmi con diverse proprietà e fornisce file sotto forma di CSV (Coma Separated Variables) per campionamento ed analisi. L'analisi dei campionamenti utilizza R, un linguaggio ed ambiente per l'elaborazione statistica e grafica.

L'EDGeS Application Development Method (EADM) Ë un metodo che standardizza il porting delle applicazioni ad un complesso ambiente Grid. Il metodo assicura che Ë il miglior percorso possibile da scegliere per il porting.

application_developmentLa metodologia EDGes Application Development utilizzata nel porting dell'applicazione al Grid.

 

 

 

 

 

 

Il progetto EDGeS mantiene una infrastruttura Grid che connette Desktop Grid e Service Grid.

infrastruttura_edgesL'infrastruttura Grid di EDGeS.

 

 

 

 

 

 



Per commentare questo post nel forum devi effettuare il login

Articoli

Written on 31/05/2020, 10:32 by boboviz
multisessioni-boinc-su-pcIn questa guida vedremo come creare dei client multipli su una distribuzione GNU/Linux tramite l’utilizzo dei container Docker. E come gestirli tramite...

Ultime dal Blog

Written on 19/06/2017, 14:38 by boboviz
addio-lugano-bellaCari sodali scaccolatori,come alcuni di voi sanno, il sottoscritto, oltre ad essere appassionato di Boinc, è anche "appassionato" di HPC e, visto che il...