Indice articoli

Valutazione attuale: 5 / 5

Stella attivaStella attivaStella attivaStella attivaStella attiva
 
SIMAP_banner

 

AMBITO: Biologia, Medicina
STATO:  ATTIVO 
VOTO: ( 7 )

 

Lo scopo del progetto è quello di creare un database pubblico di somiglianze proteiche. Il confronto fra sequenze proteiche è infatti il più potente strumento della biologia computazionale per caratterizzare una proteina. I domini proteici si sono spesso mantenuti quasi invariati durante l'evoluzione. Scoprire che una proteina X ha una sequenza simile ad un'altra di cui si conosce già la funzione ci può dare indicazioni sulla funzione della proteina in esame.
Il database SIMAP contiene circa tutte le sequenze proteiche attualmente pubblicate ed è continuamente aggiornato. Però ogni giorno vengono sequenziate nuove proteine e lo sforzo computazionale per tenere SIMAP aggiornato cresce costantemente. Elaborando i dati di SIMAP sui nostri PC permettiamo il suo costante aggiornamento.

 

 

SIMAP è un progetto congiunto tra il GSF National Research Center for Environment and Health, Neuherberg and Technical University Munich, Center of Life and Food Science Weihenstephan (entrambi in Germania).

 

Per ulteriori informazioni visitate il thread ufficiale presente nel nostro forum.


SIMAP_banner




Cos’è SIMAP?
SIMAP è un database di somiglianze tra proteine e di domini proteici. Contiene quasi tutte le sequenze proteiche ad oggi pubblicate ed è continuamente aggiornato. Le somiglianze tra proteine sono calcolate usando l’algoritmo FASTA che fornisce un’ottima velocità e sensibilità. I domini proteici sono calcolati usando i metodi e le banche dati InterPro. SIMAP è a nostro sapere l’unico progetto che combina la vasta conoscenza di tutte le proteine conosciute e la capacità di aggiornarle progressivamente.

Per cosa è usato SIMAP?

A causa dell’enorme numero di sequenze proteiche conosciute nelle banche dati pubbliche risulta chiaro che molte di queste non verranno studiate sperimentalmente nel prossimo futuro. Tuttavia, le proteine che si sono evolute da un comune antenato (le cosiddette ortologhe) spesso presentano la stessa funzione. Così è possibile intuire la funzione di una proteina non ancora studiata da una sua ortologa di cui si conosce la funzione. Un ben noto esempio è l’indagine sui geni e le proteine del topo. In molti casi i risultati sono validi anche per i geni e le proteine umane. Le somiglianze tra proteine ci danno informazioni sulle relazioni tra le proteine e sono necessarie per la predizione degli ortologhi.
I domini delle proteine (spesso chiamati domini funzionali) sono i mattoni strutturali delle proteine. Sono responsabili dell’attività di una certa proteina, come per esempio legare piccole molecole, catalizzare le reazioni o legare altre proteine per creare complessi più grandi. La conoscenza dei domini proteici è tenuta in enormi depositi come l’InterPro database. La predizione dei domini nelle nuove proteine sequenziate è basata su questi databases e fornisce un'automatica annotazione funzionale di queste proteine. Quindi calcoliamo i domini proteici per tutte le proteine all’interno di SIMAP, così da fornire il più grande sistema al mondo di predizione della funzione delle proteine.
Esistono molti metodi bioinformatici a cui ci si può collegare per ciò che concerne la somiglianza proteica e i domini. Il nostro database di somiglianze tra proteine fornisce dati sulle somiglianze e domini già calcolati e rappresenta lo spazio delle proteine conosciute. Questo apre nuove prospettive rispetto al metodo comunemente utilizzato che consiste nel ricalcolare in maniera ripetitiva questo tipo di dati. SIMAP è regolarmente aggiornato. La matrice di somiglianze viene semplicemente estesa se si presentano nuove sequenze. L’utilizzo di SIMAP è completamente disponibile per scopi educativi e ricerche pubbliche.

Perché abbiamo bisogno del calcolo distribuito per SIMAP?

I costi computazionali per calcolare i dati delle somiglianze dipendono dal quadrato delle sequenze contenute. Quindi lo sforzo computazionale per tenere la matrice aggiornata cresce costantemente. La nostra risorsa interna che esegue calcoli per SIMAP da anni non è più sufficiente per tenere conto di tutte le nuove sequenze. E’ per questo che abbiamo implementato per la piattaforma BOINC il client di SIMAP che è basato sull’algoritmo FASTA per scoprire la somiglianze tra sequenze.
La situazione per i domini proteici è diversa ma di complessità simile. I costi computazionali sono proporzionali al numero di sequenze e al numero di tipi di domini. A causa della crescita dello spazio delle frequenze e dei continui aggiornamenti nei database dei domini lo sforzo computazionale per tenere aggiornata la predizione dei domini cresce costantemente.

 


SIMAP_banner




Stato del progetto: progetto attivo
Iscrizione libera.

 

Requisiti minimi: nessuno
Gli sviluppatori non segnalano requisiti minimi da rispettare. Tuttavia va segnalato che la durata delle WU e l’utilizzo della memoria RAM sono così basse che questo progetto può essere adatto anche a PC relativamente datati.

 

Screensaver: non disponibile

 

Assegnazione crediti: fissati per singola WU/ variabili in base al tempo di elaborazione
Quorum = 2 (se è >1 le WU dovranno essere convalidate confrontando i risultati con quelli di altri utenti).

 

Applicazioni e WU disponibili: vedi scheda "Link"
Cliccare sulle icone relative alle "Applicazioni" ico32_applicazioni e allo "Stato del server" ico32_server.
Da segnalare che le nuove WU vengono rilasciate all’inizio di ogni mese in seguito all’aggiornamento del progetto presso i database proteici più importanti. Le WU terminano tutte generalmente entro un paio di settimane dal rilascio.

 

Sistemi operativi supportati: vedi scheda "Info tecniche"

 

Dati specifici sull'elaborazione: vedi scheda "Info tecniche"
Per ottenere dati sulla durata media dell'elaborazione, la RAM necessaria e la dead line, consultare la scheda "Info tecniche" qui a destra. Per informazioni particolareggiate (specifiche per applicazione e sistema operativo, intervallo di backup e crediti assegnati) rifarsi alla pagina dei risultati del progetto WUprop@home.

 

Problemi comuni: nessuno
Non si riscontrano problemi significativi.

 


SIMAP_banner




Supporto al progetto: supportato
Per unirsi al team BOINC.Italy consultare la scheda "Link" qui a destra cliccando sull'icona relativa al "JOIN" ico32_bi.

 

Referente/i: morse
Se sei interessato al progetto e vuoi dare una mano diventando referente, contatta i moderatori in privato o attraverso le pagine del forum.

 

Posizione del team nelle classifiche modiali:



Andamento dei crediti giornalieri:



Andamento del RAC:



Statistiche interne: vedi scheda "Link"
Cliccare sulle icone relative alle "Statistiche progetto" ico32_stats o alla "Classifica utenti" ico32_classutenti (solo per iscritti al team).

 

Statistiche BOINC.Stats: vedi scheda "Link"
Cliccare sulle icone relative alle "Statistiche del team sul progetto" ico32_boincstats o alla "Classifica dei team italiani" ico32_statita.

Accedi per commentare

Articoli

Written on 17/01/2022, 14:43 by boboviz
rosetta-e-virtualboxDa un po' di tempo il progetto Rosetta@Home sembra aver decisamente puntato sull’applicativo VirtualBox (Phyton), lasciando spesso vuote le code per gli...

Ultime dal Blog

Written on 03/08/2021, 22:27 by boboviz
foldit-e-alphafoldLa "svolta" AlphaFold è una delle più importanti degli ultimi anni, motivo per cui ho deciso di tradurre l'articolo che parla della sua implementazione in...