Abbiamo idea di quanto tempo ci voglia a scansionare 10 miliardi di file? Ebbene, i ricercatori di IBM sono riusciti a farlo in soli 43 minuti! IBM è riuscita a raggiungere questo record (il precedente apparteneva alla stessa azienda con un miliardo di file scansionati in 3 ore) unificando l’ambiente di archiviazione dati in un’unica piattaforma, così da consentire un accesso più rapido ai dati rispetto a quello ottenibile su piattaforme differenti e con gestioni separate. Per questo esperimento IBM ha utilizzato il sistema Parallel File (GPFS) eseguita su un cluster di 10 sistemi da 8 core ciascuno. Fondamentale è stato inoltre l’utilizzo di flash per memorizzare i metadati che il sistema di storage utilizza per localizzare le informazioni richieste. Generalmente infatti i metadati vengono memorizzati su disco, che ha un accesso più lento. Il sistema usato adesso da IBM è riuscito a leggere file alla velocità di 5 GB/s (Gigabyte al secondo).
|