Stella inattivaStella inattivaStella inattivaStella inattivaStella inattiva
 

lhc_small.jpgSu segnalazione di un utente di LHC@Home, Dagorath, ritengo sia giusto informare il team della attuale situazione venutasi a creare per le scelte degli amministratori del progetto.

Sembra infatti che LHC@Home faccia sprecare circa il 30% del tempo di elaborazione dei suoi utenti.

.

Dagorath wrote:

I do run other projects. None of my computers are attached to LHC because more than 30% of the work done for LHC is wasted effort. It is wasted because they have set IR > minQ.

Using the IR > minQ to get results verified sooner was justifiable years ago when BOINC server did not have as many features as it does now. Modern versions of BOINC server has features that permit efficent strategies for getting results verified quickly. Unfortunately, LHC steadfastly refuses to implement those strategies and use the CPU time donated to them efficiently, the way professionally run projects attempt to do.

The reason I complain about LHC\'s wasteful practices is because they steal CPU time away from other worthy projects.


Tradotto, contestualizzato e semplificato, vuol dire che:

Gli amministratori di LHC@Home hanno settato IR (Initial Replication, ossia il numero di copie della stessa WU che vengono spedite agli utenti) a 5 e MinQ (Minimum Quorum, ossia il numero minimo di WU con lo stesso risultato che serve per accettare il risultato come valido) a 3.

Il motivo è che LHC@Home è sempre stato un progetto con una alta percentuale di Compute Error e quindi questa è una delle soluzioni per avere A) i risultati in un lasso di tempo ragionevole (senza quindi dover aspettare i risultati e poi rispedire le WU nel caso il quorum non fosse raggiunto) e B) raggiungere più facilmente il quorum.
 
Tuttavia, dato che IR > MinQ, succede che vengono mandate 5 WU uguali ma se i primi 3 risultati che tornano indietro sono uguali allora gli altri 2 che ancora non sono arrivati sono inutili. Per questo, quando il progetto riceve 3 risultati uguali, manda una comunicazione ai client che ancora non hanno restituito i risultati delle altre 2 copie delle WU di cancellare quelle WU.

Se la cosa finisse qui sarebbe tutto a posto.

Purtroppo però BOINC NON CANCELLA LA WU se l'elaborazione su quella è già iniziata. Capita quindi che, dopo aver ricevuto i 3 risultati concordanti, LHC@Home mandi il segnale di cancellare le altre 2 copie e però l'elaborazione fosse già iniziata. A quel punto il client la porterà a termine e restituirà il 4° (o addirittura 5°) risultato, COMPLETAMENTE INUTILE perchè il quorum è già stato raggiunto.

Cosa vuol dire? Vuol dire che, a tutti gli effetti, la macchina che ha restituito il 4° o 5° risultato ha SPRECATO il proprio tempo. E non solo, ma l'ha anche sottratto a WU di altri progetti che potevano essere elaborate al posto di quella WU inutile.
 
Ora, è facile capire che, per le caratteristiche intrinseche di LHC@Home spiegate in precedenza, la scelta di IR > MinQ sia scellerata ma necessaria. Tuttavia Dagorath dice che, con la nuove versioni del Server BOINC, esistono soluzioni più efficaci e, soprattutto, EFFICIENTI.
 
Purtroppo nel nostro team non mi risulta ci sia qualcuno di sufficientemente competente ad avvalorare o meno la tesi di Dagorath. (Mi comunicano dalla regia che non è vero). Ritengo, ad ogni modo, che sia corretto informare la community e sentire il parere della stessa. Cosa dovremmo fare secondo voi?
 
Dario Venturini


Accedi per commentare