Skip to content

BOINC.Italy

Home arrow BOINC.Italy arrow Articoli team arrow È quasi come lavorare!

Progetto del Mese

     RNA World

Cos'è il progetto del mese?

Menù utente






Password dimenticata?
Nessun account? Registrati

Progetti

Guarda la pagina dei progetti supportati da BOINC.Italy ed entra nel team!

JOIN BOINC.Italy

Unisciti con il tuo gruppo a BOINC.Italy!

Mappa utenti

Aggiungi il tuo indicatore sulla mappa!

Feed RSS

Tieniti sempre aggiornato sui contenuti pubblicati nel portale tramite i feed RSS!

Stato progetti

ABC@home:Online
Cels@Home:Irraggiungibile
climateprediction.net:Online
Cosmology@Home:Online
Docking@home:Online
Einstein@Home:Online
Leiden Classical:Online
LHC@home:Online
malariacontrol.net:Online
MilkyWay@home:Online
POEM@HOME:Online
PrimeGrid:Online
PS3GRID:Online
QMC@home:Online
RALPH@home:Online
Rosetta@home:Online
SETI@home:Online
SIMAP:Online
Spinhenge@home:Online
uFluids@home:Online
WCG:Online
yoyo@home:Online

Compleanno utenti

È quasi come lavorare! PDF Stampa E-mail
Scritto da Venturini Dario   
lunedì 08 marzo 2010
Tizio alla scrivania che si rilassa Sempre dal blog dei ricercatori americani all'LHC, un altro post, dopo "Le gioie della Fisica" in cui un ricercatore, stavolta Zachary Marshall , ci spiega i motivi per cui sarà difficile che i volontari del progetto LHC@Home elaborino i dati prodotti dal più grande acceleratore di particelle del mondo.

 

È quasi come lavorare

Molti blogger hanno parlato della Grid di calcolo dell'LHC . Come fisici, utilizziamo molte risorse di calcolo. La homepage di WLCG presenta alcune interessanti informazioni su questa Grid, incluse delle stupende rappresentazioni di chi è online in quel momento.
 

screen-shot-2010-02-27-at-5.44.11-pm.jpg

 

C'è una cosa stupenda che deriva dall'uso di tutte queste risorse computazionali. Spesso, preparo dei lavori e li metto ad elaborare su qualche centinaio di computer che si trovano da qualche parte. Mi sento come se stessi lavorando un sacco, anche se sono i computer che stanno facendo tutta la parte pesante! Ciò consente anche di giustificare lunghe pause caffè: “Sto lavorando! La Grid sta frullando per me!!”

Ho speso molto del mio tempo lavorando al miglioramento del software di ATLAS (di solito tentando di renderlo più veloce). La maggior parte dei computer attuali consuma circa 80 Watt, circa come una lampadina ad incandescenza. Questo significa che, se li lasciamo accesi per un anno intero, spendiamo circa 100$ (80€) di elettricità per ogni computer in nostro possesso. La Grid di ATLAS (in realtà ce ne sono 3) utilizza circa 30000 computer, il che vuol dire che spendiamo circa 3 milioni di dollari l'anno in elettricità per farla funzionare.

Ovviamente, bisogna anche raffreddarle quelle macchine e c'è da dire che la maggior parte degli edifici in cui sono collocate non sono tra i più eleganti, moderni ed efficienti dal punto di vista energetico. Quindi potete immaginare che venga speso almeno altrettanto in costi di condizionamento, ossia altri 3 milioni di dollari (che è più o meno una stima corretta, basandosi sulle esperienze passate del CERN).

Di recente, ATLAS ha cambiato il sistema operativo sul quale facciamo funzionare le nostre applicazioni (come se si fosse passati da XP a Vista o da Leopard a Snow Leopard). Il sistema operativo che noi utilizziamo si chiama “Scientific Linux”. Siamo passati dalla versione 4 alla 5. Grazie ad alcuni curiousi trucchetti che sono stati introdotti con il cambio, il nostro software gira d'improvviso il 20% più veloce.

Quindi un upgrade del sistema operativo ci consente di risparmiare 1,2 milioni di dollari l'anno!

In realtà non è del tutto vero. L'elettricità per i computer della Grid è piuttosto economica rispetto ad altre componenti del budget. Quindi, piuttosto che spegnere i computer, li facciamo lavorare di più così possiamo processare più dati nella stessa quantità di tempo. Nonostante tutto, è una bella cosa! E piccoli calcoli come questo mi fanno pensare che dovrebbero darmi un bonus ogni volta che rendo il software un po' più veloce...

Richard mi ha chiesto di LHC@Home dopo il mio ultimo post. Potete leggere tutto a riguardo sul loro sito . È un progetto interessante e abbiamo parlato di vari modi per utilizzarlo. Ci sono però alcuni problemi che meritano di essere spiegati (NB: sono solo un blogger, è un'opinione personale).

 

lhc_screensaver.jpg

 

Un problema è che il software che utilizziamo è piuttosto grande. L'installazione tipica richiede 7 GB e funziona in maniera nativa su sistemi Linux. Oltre a quello, i file dei dati sono grossi qualche altro GB. Non ci sono molte persone che vogliono fregarsi 15 GB di spazio sull'hard disk per un simpatico screen saver e quindi dobbiamo pensare attentantemente a come realizzare una versione “snellita” da inviare e far funzionare su sistemi Windows o Apple (per raggiungere un'audience più vasta).

Un altro problema è che i nostri dati sono “sensibili”. Per sfruttare fino in fondo i computer dei nostri amici, dovremmo voler dare loro pieno accesso ai nostri dati. Ma vogliamo essere i primi a pubblicare i risultati di quei dati! Quindi ci renderebbe un po' nervosi inviare semplicemente i dati a chiunque ce li richieda. Ancora peggio e più probabilmente, ci sarebbe qualcuno che proverebbe ad usarli ma senza capirli e finirebbe per non identificare qualcosa di realmente interessante. E quindi a noi toccherebbe usare il nostro tempo - invece che per le analisi - per tentare di mettere a posto gli errori di qualcun altro. C'è stata una discussione interessante in proposito ad una conferenza a cui ho partecipato qualche anno fa. Qualcuno chiese che tutti i dati di LHC fossero messi a disposizione del pubblico. Ovviamente, utilizzammo l'obiezione appena menzionata. Subito dopo una persona domandò: “I dati di un precedente esperimento del CERN (chiamato LEP) sono pubblici. Qualcuno li ha mai guardati?” Nessuno, al di fuori di quelli coinvolti nell'esperimento, l'aveva fatto. Quindi un altro motivo per non renderli pubblici.

Un ulteriore problema ha a che fare con le “condizioni”. Quello che ricaviamo dai sensori dipende dallo stato in cui sono nel momento della rilevazione: che componenti sono in uso, a che temperatura sono, che voltaggio è utilizzato e così via. Tutte queste informazioni (le “condizioni” appunto) sono conservate in un enorme database al CERN. Ogni volta che vogliamo usare i dati dobbiamo anche considerare queste condizioni e quindi andare a cercarle nel database. Se più di qualche migliaio di persone tentasse di collegarsi al database contemporaneamente, verrebbe giù tutto e nessuno potrebbe usarlo! Abbiamo dei duplicati in giro per il mondo per ridurre la probabilità che accada. Oltre a quello, abbiamo dei server di caching. Quando chiedi delle informazioni al database, questi controllano se le hanno già a disposizione e solo se necessario vanno a pescarle dal database originale. In questo modo le condizioni usate più spesso sono disponibili con facilità. Ma non sono sicuro che l'infrastruttura sia in grado di reggere tantissime nuove persone che richiedono informazioni! E sarebbe rischioso lanciare un programma che potrebbe portare il nostro lavoro ad uno stop proprio ora che l'LHC sta iniziando a funzionare!

Certo, la legge di Moore continua a tenere e i computer diventano sempre più economici. Quindi per il 2020 tutto potrebbe essere facile e tutti potrebbero star usando il nostro software come screen saver. Ma per ora, è piuttosto difficile!

Zach

Ultimo aggiornamento ( lunedì 08 marzo 2010 )
 
Discussione (11 posts)

baxnimis
È quasi come lavorare!
Mar 08 2010 17:29:30
** Discussione sull'articolo: È quasi come lavorare! **

Qualcuno chiese che tutti i dati di LHC fossero messi a disposizione del pubblico. Ovviamente, utilizzammo l'obiezione appena menzionata. Subito dopo una persona domandò: “I dati di un precedente esperimento del CERN (chiamato LEP) sono pubblici. Qualcuno li ha mai guardati?” Nessuno...

Questo passaggio mi piace particolarmente

In generale comunque è stato piacevole leggere quanto detto dal tizio in questione: tono colloquiale e argomenti approfonditi quanto basta per renderli comprensibili.

La verità in fondo non fa male
#45402

cenit
Re:È quasi come lavorare!
Mar 08 2010 17:38:01
l'hai già tradotto tu quindi... non ti avevo più sentito e mi ero messo a farlo...
vabbé fa lo stesso dai. Bravo Dario!
#45404

Venturini Dario
Re:È quasi come lavorare!
Mar 08 2010 18:28:50
Asd Stefano, scrivimelo se ti metti a fare una traduzione che avevo annunciato! C'hai ragione che son lento però...
#45418
mickey
È quasi come lavorare!
Mar 08 2010 19:43:58
Bell'articolo.
Fa piacere sapere che ogni tanto distribuiscano qualche WU, anche se a dirla tutta non so bene cosa facciano queste WU dato che (come in effetti è normale pensare) non ci fanno calcolare direttamente i dati che ottengono.
Ma secondo voi non potrebbe essere interessante permettere di distribuire i dati facendo in modo che ogni utente boinc abbia solo una parte talmente piccola da essere inutile quando è da sola? In questo modo si risolverebbe almeno il problema della sensibilità di quanto viene spedito al singolo client
#45426

Venturini Dario
Re:È quasi come lavorare!
Mar 08 2010 20:12:36
Mah... conta 10k utenti, 15 Petabyte di dati l'anno... farebbe 1500 GB a testa... inutile sarebbe anche inutile, ma non so se ho spazio
#45436

astroale
È quasi come lavorare!
Mar 08 2010 21:21:51
[OPS DUPLICATO] sorry
#45444

astroale
È quasi come lavorare!
Mar 08 2010 21:21:54
io 15Gb di HD a disposizione li metterei volentieri, ma credevo che il vero motivo per cui non è utilizzabile il calcolo distribuito su BOINC fosse dovuto al rapporto tra dati da trasferire e tempo richiesto per elaborarli, ovvero se la mia adsl impiega un giorno a scaricare i 15Gb e poi la WU viene elaborata in 2 ore finisce che le CPU degli utenti non vengono sfruttate a dovere ... sempre che gli utenti tengano accesi abbastanza a lungo i PC per scaricare una WU da 15Gb.
Invece per quanto riguarda la proprietà intellettuale dei dati e la possibilità di alterazione delle elaborazioni, un sacco di progetti BOINC attivi hanno dimostrato che la piattaforma da questo punto di vista è ormai sufficientemente stabile e sicura per garantire la consistenza delle elaborazioni e la protezione dei dati.
#45445

cenit
Re:È quasi come lavorare!
Mar 08 2010 22:14:56
astroale ha scritto:
io 15Gb di HD a disposizione li metterei volentieri, ma credevo che il vero motivo per cui non è utilizzabile il calcolo distribuito su BOINC fosse dovuto al rapporto tra dati da trasferire e tempo richiesto per elaborarli, ovvero se la mia adsl impiega un giorno a scaricare i 15Gb e poi la WU viene elaborata in 2 ore finisce che le CPU degli utenti non vengono sfruttate a dovere ... sempre che gli utenti tengano accesi abbastanza a lungo i PC per scaricare una WU da 15Gb.
Invece per quanto riguarda la proprietà intellettuale dei dati e la possibilità di alterazione delle elaborazioni, un sacco di progetti BOINC attivi hanno dimostrato che la piattaforma da questo punto di vista è ormai sufficientemente stabile e sicura per garantire la consistenza delle elaborazioni e la protezione dei dati.



la piattaforma al momento lavora senza proteggere i dati. Significherebbe, se proprio li si volesse proteggere in fase di elaborazione, doverle riscrivere e non è vantaggioso visto che LHC per ora non ha urgente bisogno di potenza di elaborazione. Con tutte le nazioni che collaborano e i soldi investiti, non è quello il problema!!

Occhio comunque alla distinzione: io sono perché i dati siano completamente disponibili come quelli di LEP (non è vero che nessuno li ha usati, magari loro non lo sanno, certo non sono diventati famosi!), anche se magari questo comporta un impegno aggiunto per archiviarli e pubblicarli. Però le ricerche e le indagini che ci fai su ci sta che siano riservate, in modo che se hai avuto l'idea geniale non tutti vengano a saperla prima che tu abbia avuto tempo per pubblicarla. Questo non impedisce a chiunque voglia provarci di lanciare una propria analisi alla ricerca di qualcosa sul monte dati disponibile.

Per il resto, LHC non produce dati che vanno elaborati tutti allo stesso modo, tipo quelli di einstein@home, per fare un esempio.
I dati tipici provenienti dagli esperimenti (4 principali e 2 secondari) di LHC sono "grezzi", cioè non sono altro che una serie di registrazioni di impulsi elettrici in uno spazio tridimensionale. Su tutti gli esperimenti agiscono dei trigger, cioè dispositivi che decidono quando questi impulsi siano da salvare e quando invece siano da buttare perché non interessanti. Non si può salvare tutto perché è informaticamente impossibile e perché sarebbe completamente inutile. Ne vengono conservate percentuali minime rispetto al totale.
Su questi dati poi vengono svolti dei compiti di ricostruzione, partendo dai singoli punti si ricostruisce un'intera traccia, la traiettoria percorsa dalla particella, e si ricavano le energie depositate nei vari calorimetri.

E' su questi dati che poi dopo si fanno le indagini, ma bisogna rendersi conto che soprattutto per le indagini più interessanti si cercano eventi rari. Questo cosa significa? Dover passare in rassegna tanti di quei dati alla ricerca di quelli giusti da stufarsi. Si parla di miriadi di gigabyte da scaricare, decisamente non approcciabile ad oggi. La grid invece possiede già tutti i dati in ciascuna sede di elaborazione, meglio, no? Contate poi che i lavori tornano ancora molto in fretta, segno che non c'è molto carico sulla grid, quindi ripeto, per lhc@home non c'è nessuna urgenza.
#45447

Venturini Dario
Re:È quasi come lavorare!
Mar 08 2010 23:46:22
In effetti il caso di LHC@home è piuttosto diverso dal tipico BOINC: il progetto nasce (e potrebbe continuare) non per necessità del piccolo centro di ricerca senza risorse ma per semplice voglia (e spero anche intento divulgativo) di una organizzazione dedita alla Scienza.

Per questo motivo direi che potrebbero impegnarsi un po' di più... sicuramente non ne hanno bisogno, però lo farebbero per coinvolgere il pubblico e credo potrebbe avere successo. Ovviamente non facendo fare analisi inutili, comunque. Varie ricerche hanno dimostrato che chi "scaccola" lo fa per sentirsi utile e comunque gradisce molto un riconoscimento (anche solo verbale)
#45456

cenit
Re:È quasi come lavorare!
Mar 09 2010 07:40:20
Venturini Dario ha scritto:
In effetti il caso di LHC@home è piuttosto diverso dal tipico BOINC: il progetto nasce (e potrebbe continuare) non per necessità del piccolo centro di ricerca senza risorse ma per semplice voglia (e spero anche intento divulgativo) di una organizzazione dedita alla Scienza.

Per questo motivo direi che potrebbero impegnarsi un po' di più... sicuramente non ne hanno bisogno, però lo farebbero per coinvolgere il pubblico e credo potrebbe avere successo. Ovviamente non facendo fare analisi inutili, comunque. Varie ricerche hanno dimostrato che chi "scaccola" lo fa per sentirsi utile e comunque gradisce molto un riconoscimento (anche solo verbale)


certo.
Va però detto che LHC ha un po' monopolizzato le attenzioni al CERN ultimamente, tanto che se non ho capito male, nessuno ha avuto l'autorizzazione per nuovi progetti ultimamente: la priorità era far ripartire l'acceleratore. Troppi soldi spesi per non dedicargli anima e corpo di tutti.
Quando funzionerà a regime senza problemi, presumo che il cern ritorni ad essere l'ente di sempre, dedito a mille tipi di ricerca e allora vedremo anche qualcosa di nuovo su boinc. Per qualche anno accontentiamoci di non vedere dati di lhc. Magari un giorno li vedremo, anche solo per riconfermare una eventuale scoperta su un campione dati ancora più vasto (operazioni di bassa priorità e alto carico che non verrebbero più fatte pesare sulla grid)
#45464

Andrea
È quasi come lavorare!
Mar 10 2010 14:04:30
Qualcuno li ha mai guardati?” Nessuno, al di fuori di quelli coinvolti nell'esperimento, l'aveva fatto. Quindi un altro motivo per non renderli pubblici.

Condivido tutto tranne questa affermazione che trovo un pò pretestuosa e/o furbetta.....ma forse non l'ho capita...;-)
#45580

Discuti questa news nel forum. (11 posts)
< Prec.   Pros. >

News progetti

02/09 - Rosetta@home: Come molti di voi avranno notato, abbiamo dei problemi nella generazione di WUs....
31/08 - GPUGrid.net: E' in distribuzione un batch di 500 WU, riconoscibili dal nome che contiene i...
31/08 - Einstein@home: I responsabili del progetto sono lieti di annunciarvi che, studiando i dati...
31/08 - Collatz Conjecture: La versione 2.05 di Collatz è ora disponibile attraverso la pagina...
31/08 - ABC@home: I binari sono stati aggiornatiper tutte le piattaforme.Potrebbero esserci alcuni...

RAC Monitor

Record RAC:7'432'81229/12/2009 - 20:13:05
RAC attuale:4'431'9133/9/2010 - 02:16:36
Differenza: -3'000'899

Chat

» Nuovi utenti presentatevi nel forum QUI
Ultimo messaggio: 2 ore, 32 minuti fa
  • (23:43) novalis : :asd:
  • (21:57) baxnimis : basta invocare il mio nome e tutto va a posto :asd: :asd:
  • (19:42) r3venge : risolto^
  • (19:26) r3venge : BAX ci sei? devo chiederti una cosa
  • (13:04) baxnimis : auguri a bozzolo e Antonio :cincin: :cincin:
  • (19:40) baxnimis : Problemi sul database, stanno cercando di sistemare ;)
  • (19:33) r3venge : ha fatto un taglio dei crediti?? e perche?
  • (19:24) Andrea : se è definitivo io sego climate :arg:
  • (19:24) Andrea : climate mi ha segato in due i crediti..... :eek:
  • (18:43) Echo : ciao :)
  • (18:43) r3venge : ciao ciao!!
  • (18:43) r3venge : ok
  • (18:43) r3venge : non ce
  • (18:43) blackbit : vado raga, alla prox
  • (18:42) blackbit : allora lascia stare l'oc ;)
  • (18:42) r3venge : asp che vedo
  • (18:42) r3venge : boh
  • (18:42) blackbit : e da lì non c'è opzione per vcore della gpu?
  • (18:42) r3venge : non sono capace appunto uso rivatuner
  • (18:41) blackbit : devi aumentargil un pò il voltaggio
  • (18:41) blackbit : per continuare a tenerlo
  • (18:41) r3venge : e ora mi ritrovo con 500/600 crediti in meno al giorno
  • (18:41) blackbit : e l'overclock dopo un pò diventa instabile
  • (18:41) blackbit : i componenti si usurano :)
  • (18:41) blackbit : revenge,
  • (18:41) r3venge : quello che mi rode, è che è sempre andato!
  • (18:41) blackbit : vale la pena?
  • (18:41) blackbit : per il 9% in più perdi tutta la stabilità
  • (18:41) blackbit : cmq da 550 a 600 è il 9%
  • (18:40) blackbit : (col rischio di friggere prima del previsto)

Devi essere loggato per scrivere messaggi nella chat!