Architettura e Caratteristiche Dello Storage in INFN-CC
Architettura e Caratteristiche Dello Storage in INFN-CC
Architettura e Caratteristiche Dello Storage in INFN-CC
caratteristiche
dello storage in
INFN-CC
Workshop CCR • La Biodola 3-7/06/2019
Marica Antonacci, Stefano Stalio per INFN-CC
Storage affidabile
ed a basso costo
in INFN-CC
Workshop CCR • La Biodola 3-7/06/2019
Marica Antonacci, Stefano Stalio per INFN-CC
Hardware layout
10Gb/s
Nel 2019 previsto riempimento degli chassis (+6 dischi per storage node)
Caratteristiche dello storage in INFN-CC
● NO HW RAID
● object storage (CEPH, Swift)
● metadati su SSD
● dati su HDD (o SSD, su CEPH)
● dati replicati (2x o 3x) o “erasure coded”
● CEPH e Swift implementati sullo stesso HW, le risorse
allocate sono facilmente migrabili da un sistema all’altro, in
caso di necessità
CEPH in INFN-CC
Use cases
Per realizzare erasure coding sui pool acceduti attraverso RBD (es.
block device per VM), è necessario che un pool “tradizionale” di
tipo replicato mantenga i metadati ed il journaling, mentre i dati
vanno nel pool EC.
RBD can store image data in EC pools, but the image header and metadata still needs to go in a
replicated pool.
SSD journal
mirrored
Erasure Coded Pool,
metadati su HDD,
replica remota
highperf
Replicated (??) Pool,
SSD
Future Work
● prestazioni
● affidabilità
● disponibilità
● resilienza
Use cases
● VM images per INFN-CC
● remote, encrypted backup
○ Duplicity
○ restic
○ CyberDuck
● long term data archiving
● ubiquitous data access
Swift
8+4
a whole site failure
Erasure Coding su Swift
Nel video qui sotto si capisce come Swift distribuisca i dati caricati,
siano essi repliche di un file o chunk di file su container di tipo
“erasure coded”. Mentre il dato è ridondante fin dal momento della
creazione, la distribuzione definitiva delle repliche o dei chunk sui
diversi nodi del cluster richiede tempi lunghi ( > 1h ).
https://gsbox.lngs.infn.it/s/RYQ969uX1KS6RYV
Conclusioni