SIMAP

AMBITO: Biologia, Medicina

STATO: ATTIVO

ATTACH: http://boincsimap.org/boincsimap

VOTO: ( 7 )

Lo scopo del progetto è quello di creare un database pubblico di somiglianze proteiche. Il confronto fra sequenze proteiche è infatti il più potente strumento della biologia computazionale per caratterizzare una proteina. I domini proteici si sono spesso mantenuti quasi invariati durante l'evoluzione. Scoprire che una proteina X ha una sequenza simile ad un'altra di cui si conosce già la funzione ci può dare indicazioni sulla funzione della proteina in esame.
Il database SIMAP contiene circa tutte le sequenze proteiche attualmente pubblicate ed è continuamente aggiornato. Però ogni giorno vengono sequenziate nuove proteine e lo sforzo computazionale per tenere SIMAP aggiornato cresce costantemente. Elaborando i dati di SIMAP sui nostri PC permettiamo il suo costante aggiornamento.

SIMAP è un progetto congiunto tra il GSF National Research Center for Environment and Health, Neuherberg and Technical University Munich, Center of Life and Food Science Weihenstephan (entrambi in Germania).

Per ulteriori informazioni visitate il thread ufficiale presente nel nostro forum.

Cos’è SIMAP?
SIMAP è un database di somiglianze tra proteine e di domini proteici. Contiene quasi tutte le sequenze proteiche ad oggi pubblicate ed è continuamente aggiornato. Le somiglianze tra proteine sono calcolate usando l’algoritmo FASTA che fornisce un’ottima velocità e sensibilità. I domini proteici sono calcolati usando i metodi e le banche dati InterPro. SIMAP è a nostro sapere l’unico progetto che combina la vasta conoscenza di tutte le proteine conosciute e la capacità di aggiornarle progressivamente.

Per cosa è usato SIMAP?
A causa dell’enorme numero di sequenze proteiche conosciute nelle banche dati pubbliche risulta chiaro che molte di queste non verranno studiate sperimentalmente nel prossimo futuro. Tuttavia, le proteine che si sono evolute da un comune antenato (le cosiddette ortologhe) spesso presentano la stessa funzione. Così è possibile intuire la funzione di una proteina non ancora studiata da una sua ortologa di cui si conosce la funzione. Un ben noto esempio è l’indagine sui geni e le proteine del topo. In molti casi i risultati sono validi anche per i geni e le proteine umane. Le somiglianze tra proteine ci danno informazioni sulle relazioni tra le proteine e sono necessarie per la predizione degli ortologhi.
I domini delle proteine (spesso chiamati domini funzionali) sono i mattoni strutturali delle proteine. Sono responsabili dell’attività di una certa proteina, come per esempio legare piccole molecole, catalizzare le reazioni o legare altre proteine per creare complessi più grandi. La conoscenza dei domini proteici è tenuta in enormi depositi come l’InterPro database. La predizione dei domini nelle nuove proteine sequenziate è basata su questi databases e fornisce un'automatica annotazione funzionale di queste proteine. Quindi calcoliamo i domini proteici per tutte le proteine all’interno di SIMAP, così da fornire il più grande sistema al mondo di predizione della funzione delle proteine.
Esistono molti metodi bioinformatici a cui ci si può collegare per ciò che concerne la somiglianza proteica e i domini. Il nostro database di somiglianze tra proteine fornisce dati sulle somiglianze e domini già calcolati e rappresenta lo spazio delle proteine conosciute. Questo apre nuove prospettive rispetto al metodo comunemente utilizzato che consiste nel ricalcolare in maniera ripetitiva questo tipo di dati. SIMAP è regolarmente aggiornato. La matrice di somiglianze viene semplicemente estesa se si presentano nuove sequenze. L’utilizzo di SIMAP è completamente disponibile per scopi educativi e ricerche pubbliche.

Perché abbiamo bisogno del calcolo distribuito per SIMAP?
I costi computazionali per calcolare i dati delle somiglianze dipendono dal quadrato delle sequenze contenute. Quindi lo sforzo computazionale per tenere la matrice aggiornata cresce costantemente. La nostra risorsa interna che esegue calcoli per SIMAP da anni non è più sufficiente per tenere conto di tutte le nuove sequenze. E’ per questo che abbiamo implementato per la piattaforma BOINC il client di SIMAP che è basato sull’algoritmo FASTA per scoprire la somiglianze tra sequenze.
La situazione per i domini proteici è diversa ma di complessità simile. I costi computazionali sono proporzionali al numero di sequenze e al numero di tipi di domini. A causa della crescita dello spazio delle frequenze e dei continui aggiornamenti nei database dei domini lo sforzo computazionale per tenere aggiornata la predizione dei domini cresce costantemente.

Stato del progetto: progetto attivo

Iscrizione libera.

Requisiti minimi: nessuno

Gli sviluppatori non segnalano requisiti minimi da rispettare. Tuttavia va segnalato che la durata delle WU e l’utilizzo della memoria RAM sono così basse che questo progetto può essere adatto anche a PC relativamente datati.

Screensaver: non disponibile

Assegnazione crediti: fissati per singola WU/ variabili in base al tempo di elaborazione

Quorum = 2 (se è >1 le WU dovranno essere convalidate confrontando i risultati con quelli di altri utenti).

Applicazioni e WU disponibili: vedi scheda "Link"

Cliccare sulle icone relative alle "Applicazioni"

e allo "Stato del server"

Da segnalare che le nuove WU vengono rilasciate all’inizio di ogni mese in seguito all’aggiornamento del progetto presso i database proteici più importanti. Le WU terminano tutte generalmente entro un paio di settimane dal rilascio.

Sistemi operativi supportati: vedi scheda "Info tecniche"

Dati specifici sull'elaborazione: vedi scheda "Info tecniche"

Per ottenere dati sulla durata media dell'elaborazione, la RAM necessaria e la dead line, consultare la scheda "Info tecniche" qui a destra. Per informazioni particolareggiate (specifiche per applicazione e sistema operativo, intervallo di backup e crediti assegnati) rifarsi alla pagina dei risultati del progetto WUprop@home.

Problemi comuni: nessuno

Non si riscontrano problemi significativi.

Supporto al progetto: supportato

Per unirsi al team BOINC.Italy consultare la scheda "Link" qui a destra cliccando sull'icona relativa al "JOIN"