Foldit e AlphaFold
La "svolta" AlphaFold è una delle più importanti degli ultimi anni, motivo per cui ho deciso di tradurre l'articolo che parla della sua implementazione in Foldit.
Con questo articolo annunciamo una nuovissima funzionalità di Foldit che permetterà ai giocatori di utilizzare il rivoluzionario algoritmo AlphaFold di DeepMind! La funzionalità è attualmente disponibile per gli utenti sviluppatori, ma contiamo di pubblicarla come funzionalità standard nei prossimi giorni.
Alphafold 2 è un algoritmo per predire la struttura ripiegata di una proteina partendo dalla sua sequenza (di amminoacidi) ed è stato sviluppato dall’azienda DeepMind a partire dal 2020.
Precedentemente, nella competizione CASP 2018 per la predizione delle strutture proteiche, DeepMind aveva fatto colpo con la versione iniziale di AlphaFold, sbaragliando dozzine di gruppi di ricerca da tutto il mondo. Il gruppo DeepMind è specializzato in un tipo di algoritmo chiamato “rete neurale” e ha dimostrato che questo tipo di algoritmo ha un enorme potenziale per il campo della previsione della struttura delle proteine. Abbiamo scritto un articolo circa questa prima versione dell’algoritmo quando DeepMind lo pubblicò a Gennaio 2020
Dopo il successo iniziale, DeepMind ha completamente ristrutturato il proprio algoritmo, e al CASP 2020 hanno stupito il mondo con un balzo in avanti ancor più grande. Il nuovo AlphaFold v2.0 è in grado di predire le strutture proteiche con una accuratezza sbalorditiva. I risultati CASP del 2020 hanno promesso grandi progressi per la ricerca sulle proteine e la comunità scientifica ha atteso con ansia che DeepMind rilasciasse i dettagli su AlphaFold v2.0.
Figura 1. Classifica delle competizioni CASP del 2018 e del 2020. L’algoritmo originale di AlphaFold (2018) era chiaramente sopra agli altri concorrenti.L’ultimo AlphaFold v2.0 ha semplicemente “spazzato via” la concorrenza.
AlphaFold per il protein design
AlphaFold è particolarmente accurato per prevedere le proteine naturali, dove può attingere alle ricche informazioni nei modelli evolutivi (anche se queste proteine non hanno una storia evolutiva). Ma abbiamo anche scoperto che è molto bravo nel prevedere le strutture delle proteine progettate: in effetti, quando controlliamo le strutture risolte delle proteine progettate, scopriamo che AlphaFold è solitamente più accurato del modello di progettazione stesso!
Figura 2. Si confronta l'accuratezza dei modelli predittivi AlphaFold e dei modelli di progettazione per 22 proteine progettate con strutture risolte. La diagonale rappresenta la linea di uguaglianza. I punti sopra la diagonale sono casi in cui la previsione AlphaFold è più accurata del modello di progettazione.
Abbiamo inoltre scoperto che AlphaFold potrebbe essere in grado di aiutarci a scegliere i progetti che non supereranno i test di laboratorio: ogni volta che AlphaFold prevede una struttura, l'algoritmo produce anche un valore di confidenza per la previsione. Abbiamo notato, utilizzandolo, che AlphaFold tende a segnalare una maggior confidenza di previsione per progetti di proteine con successo (in laboratorio).
Figura 3. La distribuzione dei valori di confidenza per 148 progetti Foldit testati in laboratorio. I progetti di successo (in blu) tendono a fornire previsioni di AlphaFold con maggiore confidenza dei progetti falliti (in arancio).
Nel 2019, abbiamo testato 148 progetti di Foldit in laboratorio e abbiamo scoperto che 56 erano progetti di successo, con un tasso di successo totale di circa il 38%. Se avessimo rifiutato i progetti con una fiducia AlphaFold inferiore all'80%, avremmo comunque trovato 50 progetti di successo, con una percentuale di successo superiore al 60%!
Una nuova funzionalità in Foldit
Siamo felici di annunciare questa nuova funzionalità di Foldit che ci consentirà di ottenere previsioni AlphaFold per le proteine che sono progettate in Foldit.
Alcuni puzzle mostreranno un nuovo pulsante DeepMind AlphaFold nel menu principale: questo pulsante apre una finestra di dialogo con un elenco delle soluzioni salvate sul lato destro. Per richiedere una previsione AlphaFold per una soluzione, selezionare la soluzione e fare clic sul pulsante Carica per AlphaFold. Questo invierà la tua soluzione al server Foldit ed eseguirà in remoto l'algoritmo AlphaFold.
Una nuova soluzione apparirà nell'elenco a sinistra e mostrerà il messaggio "In attesa..." mentre AlphaFold fa la sua previsione. Ci vorranno almeno alcuni minuti per l'esecuzione e il tempo di attesa potrebbe essere più lungo a seconda di quanto è occupato il server (non sarai in grado di effettuare un nuovo caricamento AlphaFold mentre hai un invio attualmente in sospeso).
Fare clic sul pulsante “Aggiorna" soluzioni per verificare se il lavoro AlphaFold è terminato.
Al termine dell'algoritmo AlphaFold, la soluzione di sinistra visualizzerà due valori:
- La fiducia è la stima di AlphaFold sull'accuratezza della sua previsione. La figura 3 qui sopra suggerisce che i progetti con una maggiore sicurezza hanno maggiori probabilità di piegarsi con successo. I giocatori dovrebbero puntare a valori di confidenza dell'80% o superiori.
- La somiglianza misura quanto la previsione AlphaFold corrisponde alla struttura progettata. Se la somiglianza è bassa, AlphaFold ha previsto che la sequenza del disegno si piegherà in una forma diversa rispetto alla struttura progettata.
Per caricare la previsione AlphaFold all’interno del puzzle Foldit, è sufficiente selezionare la soluzione AlphaFold a sinistra e fai clic sul pulsante Carica nella parte inferiore della finestra di dialogo. Tieni presente che le previsioni AlphaFold potrebbero non essere valutate come le soluzioni che sono state ottimizzate in Foldit. Se decidi di lavorare con la soluzione AlphaFold, ti consigliamo un rapido Wiggle e Shake del modello AlphaFold “grezzo”.
I valori di affidabilità e somiglianza di AlphaFold non influenzeranno in alcun modo il punteggio di Foldit. Per il momento, la funzione AlphaFold è semplicemente uno strumento che puoi utilizzare per ottenere feedback sulla tua soluzione e per vedere come si prevede che la sequenza di progettazione si pieghi.
Calcoli remoti
A differenza dei tipici strumenti Foldit, l'algoritmo AlphaFold viene eseguito in remoto su un server online.
Normalmente, quando si esegue Foldit sul computer, tutti i calcoli di Foldit vengono eseguiti localmente dal tuo computer. Se la tua connessione Internet fallisce nel bel mezzo di un puzzle, puoi comunque continuare a utilizzare tutti gli strumenti di Foldit.
Questa funzione AlphaFold è diversa e i calcoli effettivi verranno eseguiti su un server ospitato presso l'UW Institute for Protein Design (IPD). Quindi, quando viene fatto clic sul pulsante Carica per AlphaFold, la tua soluzione viene inviata al server IPD, che esegue l'algoritmo AlphaFold e quindi invia il risultato al tuo computer.
La ragione principale di ciò è che l'algoritmo AlphaFold è... grande. Anche la versione base “snella” richiede diversi GB di spazio su disco. Se volessimo distribuire il software AlphaFold con Foldit, ciò aumenterebbe la dimensione del download di Foldit di circa 10 volte. Un altro motivo è che l'algoritmo AlphaFold funziona in modo molto meno efficiente su CPU comuni rispetto alle GPU, cosa che molti giocatori potrebbero non avere: se hai eseguito AlphaFold sulla tua CPU a casa, potrebbe volerci più di un'ora per ottenere un risultato.
Tuttavia, se usiamo le nostre GPU all’ IPD, l'elaborazione effettiva sarà molto più veloce. Poiché la maggior parte dei nostri recenti puzzle scientifici ha avuto meno di 100 giocatori attivi contemporaneamente, pensiamo che i giocatori possano ottenere risultati più velocemente se elaboriamo i lavori AlphaFold sulle nostre GPU server.
E poi?
Questo è un momento entusiasmante per il mondo della ricerca sulle proteine! DeepMind ha ispirato altri gruppi di ricerca, incluso l'IPD, a esplorare tipi simili di algoritmi di rete neurale per la previsione della struttura delle proteine. Man mano che sempre più ricercatori pubblicano i loro risultati e imparano gli uni dagli altri, probabilmente possiamo aspettarci di vedere algoritmi ancora più accurati in futuro.
AlphaFold sta già trasformando lo studio delle proteine naturali e ha fornito ai ricercatori previsioni sicure di importanti proteine con strutture sconosciute. Ma nel campo della progettazione delle proteine, stiamo ancora imparando come sfruttare al meglio questi progressi. Speriamo che i giocatori di Foldit trovino utili le previsioni di AlphaFold per la progettazione di nuove proteine creative!
Tenete presente che la nuova funzione AlphaFold è sperimentale e potrebbe cambiare (o addirittura scomparire in futuro). Foldit condivide le GPU del server con altri progetti di ricerca e potrebbe essere necessario modificare il nostro utilizzo o sviluppare nuove strategie per l'esecuzione di calcoli pesanti con GPU.
Finora abbiamo implementato solo il minimo indispensabile per la funzione AlphaFold, in modo che i giocatori di Foldit possano iniziare a usarla il prima possibile. Speriamo di migliorarlo in futuro; feedback e suggerimenti dei giocatori ci aiuteranno a rendere questo strumento sempre più utile.