Stella inattivaStella inattivaStella inattivaStella inattivaStella inattiva
 

Ciao a tutti,

è nuovamente ora di un aggiornamento sui progressi fatti da Clean Energy Project - i nostri amici di IBM-WCG ci ricordano sempre che siamo in ritardo :) . Ci scusiamo per questo, ma a volte è difficile trovare tempo nel nostro fitto piano di ricerca per quelle cose prive di una scadenza urgente o che non rischiano di diventare un collo di bottiglia. Comunque alla fine abbiamo trovato il tempo per aggiornarvi e speriamo che apprezzerete.

Incominciamo con qualcosa di interessante riguardo il gruppo. L'avvenimento più importante dal nostro ultimo aggiornamento di novembre (a parte la tempesta di neve Nemo) è che Alan ha ottenuto un incarico di ruolo ed è ora professore ordinario presso il Dipartimento di chimica e biologia chimica qui all'Università di Harvard. Tra le altre cose ha ricevuto la sua promozione per il contributo che il Clean Energy Project ha apportato nei campi di scienza computazionale dei materiali, informatica dei materiali, selezione virtuale ad alta capacità, big data ed elettronica organica.

Inoltre Sule ha ottenuto il ruolo di assistente universitario ad Ankara (Turchia), dove si trasferirà in autunno (ma ci auguriamo che rimanga parte integrante del nostro progetto). Alcuni premi e borse di studio sono stati assegnati a vari membri del gruppo (ad esempio Aidan ha vinto una borsa di studio Rhodes, Johannes il premio IBM-Loewdin ed il Premio per dottorato assegnato dalla Divisione per la chimica fisica della American Chemical Society). Abbiamo scritto diverse proposte di sovvenzione per somme di denaro e tempo di elaborazione in cluster (come quello indirizzato al programma della National Science Foundation "Progettare materiali per rivoluzionare e realizzare il futuro") ed abbiamo collaborato con HGST che ci sponsorizza tramite la donazione di dischi di memoria. I frutti del nostro lavoro sono stati presentati in diverse conferenze, webcast, seminari, e discussioni durante gli ultimi sei mesi ed abbiamo scritto un capitolo dedicato al nostro lavoro nell'informatica dei materiali per un libro. La stesura del testo è stata guidata da Carlos ed il capitolo è intitolato "Verso l'informatica dei materiali per il fotovoltaico organico" ("Towards materials informatics for organic photovoltaics") e sarà pubblicato nel libro "Informatica per la scienza dei materiali e l'ingegneria" ("Informatics for Materials Science and Engineering").

Passiamo ora al progresso nella ricerca. Il contributo di WCG è tornato ad essere considerevole dopo un autunno un po' fiacco. In questi giorni la media si attesta intorno a 18-20 anni di elaborazione compiuta al giorno ed abbiamo superato il traguardo di 15.000 anni di elaborazione compiuti. Ad ora abbiamo eseguito 150 milioni di calcoli di teoria del funzionale della densità su 2,3 milioni di composti con 24 milioni di conformer, accumulando 400 TB di dati. Si tratta di un risultato inedito - detto chiaro e tondo! Abbiamo aumentato la nostra capacità di accumulo dei dati a 700 TB creando ed avviando Jabba 4, 5 e 6. Di nuovo grazie a HGST per il loro sostegno ed a Research Computing della Facoltà di arte e scienza di Harvard per il loro aiuto. Tutti i dispositivi di archiviazione Jabba ora sono disposti accuratamente nelle loro strutture. Il progresso del progetto è controllato da un nuovo codice che genera automaticamente analisi statistiche e grafici, traguardi, la cronologia ed altre interessanti informazioni al volo. Abbiamo rinnovato il nostro impegno nel ridisegnare la pagina del progetto ed il nuovo codice per le statistiche sarà utilizzato quando la vecchia homepage sarà sostituita.

Il back end di CEPDB è stato il punto focale dei nostri sforzi negli ultimi mesi. L'abbiamo sottoposto a code refactoring e migliorato ed espanso la sua capacità sia per ricerche più rapide che per prepararlo al suo ruolo di centro per informazioni, analisi e chimica informatica. Ora CEPDB è molto più maturo e funzionale e contiene anche campi di ricerca aggiuntivi come INChI, IUPAC e nomi comuni, implementa le funzioni di conversione in SMILES canonico, fingerprinting, un collegamento a matplotlib per le rappresentazioni grafiche ed gode di un certo numero di miglioramenti prestazionali. Salutiamo con riconoscenza il contributo dei nostri amici di Kitware e ChemAxon. Anche il lavoro sul front end di CEPDB ha compiuto alcuni buoni progressi e speriamo di rilasciarlo presto.

Abbiamo ulteriormente intensificato la nostra collaborazione con le università di Stanford, Johns Hopkins e Linz. Stiamo fornendo ai nostri partner elenchi di promettenti candidati, ad esempio per l'efficienza della conversione ad alta potenza (in inglese PCE) secondo il modello Scharber o per semiconduttori a bande proibite basse. Secondo l'analisi di Scharber 35.000 (cioè l'1,5%) dei composti selezionati ha la possibilità di raggiungere un PCE maggiore del 10% e 1.000 di essi oltre l'11%. Questo dimostra quanto sia difficile progettare materiali ad elevato PCE ma allo stesso tempo indica che una selezione virtuale ad alta capacità può comunque portare ad un numero utile di candidati.

I nostri amici di Stanford ci hanno indicato che una delle nostre dieci migliori molecole (in misura leggermente accresciuta) è già nota come composto ad alte prestazioni. Questa conferma indipendente è un enorme incoraggiamento ed ha evidenziato dei nostri risultati. I nostri amici dell'Università di Haverford hanno fatto progressi nel sintetizzare composti suggeriti da noi. I nostri amici all'Università John Hopkins hanno utilizzato i nostri risultati di teoria del funzionale della densità per confrontare con gli standard un nuovo metodo teorico (un modello tipo SSH) che stanno sviluppando. Forniamo ulteriori dump dei di dati a ChemAxon, Kitware, Wolfram Alpha e NREL. Stiamo producendo un certo numero di librerie di molecole di seconda generazione per i nostri vari partner.

Il gruppo di sviluppo di Q-Chem Inc. ha ricevuto opinioni sulle prestazioni di alcuni algoritmi utilizzati che ci auspichiamo li aiutino a migliorare il loro pacchetto di programmi. Nel frattempo i nostri amici di IBM si stanno occupando di una recente revisione di del pacchetto di programmi Q-Chem per la rete.

Abbiamo introdotto un nuovo schema di medie progettato per rendere più solidi i nostri risultati. Questo prende i differenti risultati dei calcoli che erano stati calibrati individualmente e li media in base alla calibratura. Un'analisi statistica preliminare (utilizziamo ancora la nostra vecchia calibrazione OE11) indica che i margini di errore sono sorprendentemente piccoli: per l'energia HOMO otteniamo un valore MAD medio di 0.07 eV e per quella RMSD uno di 0.09 eV. Per l'energia LUMO abbiamo un MAD medio di 0.09eV e per quella RMSD uno di 0.12 eV. Tutto ciò sembra molto promettente ma dobbiamo studiare ciò più attentamente.

Nei mesi venturi ci concentreremo nell'espandere il nostro data mining, le analisi e gli strumenti per modellare il tutto, rilasciando CEPDB come parte dell'Iniziativa genoma dei materiali della Casa Bianca scrivendo alcuni documenti e lanciando una nuova generazione di work units. C'è ancora così tanto lavoro eccitante da fare e speriamo di approcciarci ad esso assieme a voi. Grazie infinite per tutto il vostro generoso supporto, duro lavoro ed entusiasmo - voi ragazzi e ragazze siete forti!!! Clean Energy Project non sarebbe possibile senza di voi. CONTINUATE AD ELABORATE!

I migliori auguri da

il vostro gruppo Clean Energy Project di Harvard

 

Accedi per commentare