Stella inattivaStella inattivaStella inattivaStella inattivaStella inattiva
 

Ciao a tutti, con Sophie e Richard abbiamo redatto un resoconto delle analisi di aggancio dei 168 complessi proteici del dataset Mintseris testato nella fase 1. Il documento è in esame in questo momento e vi daremo il link non appena verrà pubblicato.

L'analisi del dataset dei 168 complessi proteici non è ancora finito! In realtà, cerchiamo di migliorare i segnali per la rilevazione di partenariato. Ci sono due punti principali che bisogna tenere a mente. Nella  fase 2 non si conosce il partner reale e abbiamo dovuto usare le previsioni dei siti di interazione per  eseguire MaXDO. Questo perché lo spazio di ricerca su una superficie di proteine ​​non poteva essere  esplorato esaustivamente, anche con l'aiuto di WCG. sarebbe troppo grande! Questo significa che abbiamo  bisogno di capire su di un gruppo di proteine ​​che conosciamo (cioè i 168 complessi proteici) come le previsioni dei siti di interazione proteici avranno un impatto sulle previsioni partner. Questo è ciò che dobbiamo ricercare con attenzione in questo momento. Ci vuole tempo! Ci sono una serie di risultati intermedi che potrebbe far piacere conoscere:

  1. L'analisi realizzata in [Sacquin-Mora et al. 2008] su 12 complessi, è stata ridimensionata a 168 complessi, ed ha evidenziato una previsione potenza di interazione proteina-proteina di AUC = 0,84 (vedi figura A seguito) quando si utilizzano le conoscenze sulle superfici di interazione reali e quando si esplora tutta la superficie della proteina. E 'importante sottolineare che questo successo di ridimensionamento delle analisi in [Sacquin-Mora et al. 2008] a 168 proteine ​​non era una supposizione ovvia! Perché il successo? L'AUC è una misura di probabilità utilizzata per valutare l'accuratezza del test. I valori variano da 0 a 1, dove 1 rappresenta un test perfetto e 0,5 rappresenta un test inutile. In parole povere, si può pensare il seguente ordine:
    .90-1 = eccellente, .80-.90 = buono, .70-.80=giusto, .60-.70=Scarso, .50-.60=fallito.

  2. Abbiamo anche osservato che tra i 168 complessi proteici, diversi avevano la tendenza a legarsi a quasi tutte le altre proteine ​​e altri hanno mostrato molte poche forti interazioni. Entrambe queste famiglie di proteine ​​contribuiscono negativamente alla previsione del partenariato, e, una volta eliminato, abilitare il potere predittivo di incrementatare fino ad una AUC = 0.98 (vedi Figura B).

  3. Quando le informazioni sperimentali sulle superfici di interazione è sostituito con i dati di JET [Engelen 2009] (il tool per l'analisi di conservazione sviluppato all'interno del nostro consorzio) il potere predittivo diminuisce solo di poco, con una AUC = 0.82. Questo suggerisce che e le previsioni di accoppiamento dell'interfaccia delle proteine con aggancio è un approccio molto promettente.

  4. Tuttavia i miglioramenti sono ancora necessari, da quando le previsioni JET vengono utilizzate per delimitare l'area di espansione, così come per calcolare l'indice numerico che discrimina i partner, il potere predittivo cade in una AUC=0.59. Ciò implica che una migliore rilevazione dei percorsi di interazione deve essere sviluppata. Tuttavia, notiamo che un sottogruppo di 20 complessi identificato dalle previsioni JET, ha già dato delle previsioni molto buone (AUC=0.97; Figura C al di sotto), suggerendo che generano sottogruppi categorizzando propensioni di interazione delle proteine che potrebbero migliorare le prestazioni.

Infine, abbiamo analizzato sistematicamente i complessi in termini di classi funzionali delle proteine ​​interagenti. I complessi possono essere raggruppati in: Enzima-inibitori (46 proteine), antigene-anticorpo (20), antigene-anticorpo Bound (24), Altri (78), e anche come, del Rigid Body (126), Medium (26) e Difficult (16). Interazioni all'interno di alcune classi, come Enzyme-inibitori, erano chiaramente più facili da prevedere suggerendo che tali classificazioni dovrebbero essere considerate in previsione di partnershipall-togetherWEB

Figura. Matrici di indici di interazione a coppie per le diverse sottopopolazioni di proteine. Punteggi di interazione elevata (tra 0.7 e 1, blu e nero nella scala a colori) indicano un'alta probabilità di interazione. Le proteine ​​sono ordinate nella matrice in modo tale che i veri partner interagenti giacciono sulla diagonale. R: dataset di 168 complessi proteici. I punteggi di interazione sono stati calcolati utilizzando la conoscenza delle interfacce sperimentali (AUC=0.84). B: sottoinsieme di 44 complessi proteici che porta ad una AUC=0.98. Punteggi di interazione sono stati calcolati in base alle conoscenze sulle interfacce sperimentali. C: sottoinsieme di 20 complessi proteina porta a una AUC=0.97. Punteggi di interazione sono stati calcolati utilizzando le interfacce previste da JET.

Al momento lavoriamo sul coevoluzione tra le interfacce di proteine ​​e sul miglioramento delle previsioni di interazione JET. Con entrambi i progressi contiamo di migliorare l'identificazione di nuovi partner, e di aumentare l'AUC di cui sopra. Abbiamo già fatto un sacco di lavoro in questo senso. Un nuovo approccio all'analisi di coevoluzione, trattando in particolare i siti conservati come le interfacce di proteine​​, è stato recentemente sviluppato presso il laboratorio. Maggiori informazioni arriveranno presto.

Buon Natale e Felice Anno Nuovo a tutti!

Alessandra


Accedi per commentare