YouTube e lo storage dei video dei canali aziendali
Come fa YouTube a memorizzare una quantità di dati impressionante?
I video di YouTube vengono archiviati negli hard disk all’interno dei data center di Google. I dati sono gestiti dal Google File System BigTable.
Si tratta di un sistema proprietario di database compressi ad alte prestazioni, sviluppato da Google a partire dal 2004 . Questo consente l’erogazione dei video dei canali Youtube senza ritardi
E’ stato progettato per gestire carichi evidentemente pesanti, nell’ordine dei petabyte, distribuendo storage e calcolo su moltissime macchine, rendendone semplice l’aggiunta di nuove, secondo il principio della scalabilità più spinta.
I video pubblicati sui canali aziendali Youtube vengono archiviati nei dischi rigidi. Le altre informazioni, come i metadati, le preferenze dell’utente, le informazioni sul profilo, le impostazioni dell’account, le informazioni necessarie per estrarre i video dalla memoria vanno nel database MySQL implementato da Vitess
I server, distribuiti, che aumentano la capacità di archiviazione del data center sono server di base, in pratica server commerciali standard.
Si tratta di server economici e ampiamente disponibili che possono essere acquistati in grandi quantità e sostituiti o configurati insieme allo stesso hardware nel data center con costi e sforzi minimi.
I server vengono generalmente sostituiti anziché riparati. Poiché non sono costruiti su misura, il loro utilizzo consente all’azienda di ridurre i costi di infrastruttura di una certa misura rispetto a quando si impiegano macchine costruite su misura.
Dischi fissi e YouTube
YouTube ha bisogno di più di un petabyte di nuovo spazio di archiviazione ogni singolo giorno. Un petabyte equivale a 1000 terabyte
A oggi le unità disco rigido rotanti sono il supporto di archiviazione principale a causa dei loro bassi costi e affidabilità.
Le unità SSD a stato solido sono più performanti dei dischi rotanti poiché sono basate su semiconduttori, ma l’uso su larga scala di SSD non è economico. Sono piuttosto costosi e tendono anche a perdere gradualmente i dati nel tempo. Questo li rende non ottimali per l’archiviazione dei dati di archiviazione.
Si vocifera che Google stia lavorando a una nuova linea di dischi progettati per data center su larga scala e che gli stessi saranno indirizzati verso gli appetiti di YouTube
Esistono cinque metriche chiave per giudicare la qualità dell’hardware creato per l’archiviazione dei dati:
- L’hardware dovrebbe essere in grado di supportare una velocità elevata di operazioni di input-output al secondo.
- Dovrebbe soddisfare gli standard di sicurezza stabiliti dal committente
- Dovrebbe avere una capacità di archiviazione maggiore rispetto al normale hardware di archiviazione.
- Il costo di acquisto dell’hardware, il costo dell’alimentazione e le spese generali di manutenzione dovrebbero essere accettabili.
- I dischi dovrebbero essere affidabili e avere una latenza costante.


Video per imprese e aziende

