On vient de passer un seuil économique pour la sauvegarde en ligne !🔗

Posted by Médéric Ribreux 🗓 In blog/ Blog/

#backup

Hello,

ces derniers jours, plusieurs annonces de baisse de prix sur le stockage en ligne viennent de nous faire passer un cap en ce qui concerne la sauvegarde.

En effet, Amazon a annoncé un service de stockage illimité pour 60$ par an.

Aujourd'hui, OVH annonce 10 To pour 50€/an sur son service Hubic. L'ancien prix était de 120€ par an.

Ces niveaux de prix sont maintenant plus compétitifs que de nombreuses solutions de sauvegardes à la maison. Faisons un rapide calcul avec un petit exemple de solution simple à mettre en place pour un administrateur système averti…

Nous voulons un dispositif de sauvegarde qui permette de sauvegarder 10 To avec un niveau de service qui peut approcher celui des deux fournisseurs évoqués plus haut. Concrètement, cela revient à mettre en place un serveur physique dédié équipé de plusieurs disques en RAID (1 ou 10 pour un cas simple). Le RAID permet de pallier rapidement à une déficience d'un ou de plusieurs disques. Mais cette solution n'est pas suffisante: en cas de sinistre complet sur le serveur, les données sont perdues. Il faut donc également un dispositif d'externalisation qui prendra la forme de disques externes sur lesquels on réalise à une fréquence donnée (1 fois par trimestre ou par mois selon le niveau de sécurité exigé) une copie complète des données du serveur (cela peut prendre la forme d'une copie différentielle par exemple). Pour ma part, l'externalisation est véritablement indispensable si l'on veut pouvoir approcher (sans l'égaler bien sûr mais avec un niveau de service acceptable) le niveau de service des deux fournisseurs sus-cités. En termes de durée de vie, nous allons considérer que les disques seront en fin de vie au bout de 5 ans (c'est parfois la durée de la garantie du constructeur).

En étudiant rapidement les prix des disques durs du marché, on se rend compte que le meilleur coût au To est situé dans les disques durs de 3To qui sont à peu près à 100€ pièce. À ce niveau, on peut envisager d'obtenir une capacité protégée par un RAID6 avec 5 disques durs (6 disques pour du RAID10). On obtient 9To disponibles, ce qui est un peu inférieur aux 10To mais qui permet de limiter les coûts d'achats (mes calculs veulent juste montrer raisonnablement que même en rognant sur de nombreux postes, les offres des fournisseurs sont plus avantageuses). Avec 6 disques on obtient une capacité protégée de 12To ce qui dépasse ce qu'offre Hubic. Je mets de côté le problème du nombre de connecteurs SATA indispensables à la mise en œuvre physique de ce stockage.

Pour l'externalisation, on retiendra 3 disques de 3To chacun. Au total, on doit disposer de 8 disques dur de 3To à 100€ chacun, ce qui donne un total de 800€ environ pour l'achat des disques.

Il faut également considérer la consommation électrique du serveur. Nous allons prendre une machine qui consomme peu. Elle peut prendre la forme d'un plugcomputer ou une carte SOC telle que le BeagleBone Black ou le RaspBerry Pi, à la condition qu'ils disposent de suffisamment de connecteurs disques (ce qui n'est pas gagné). Sur une autre forme, on peut envisager la récupération d'une machine normale (desktop) qui dispose souvent de plusieurs connecteurs SATA. En allumant la machine uniquement pour la sauvegarde, on peut tout à fait maîtriser le coût de l'énergie. Mon calcul montre que la consommation électrique d'une machine de 100W qui fonctionne 3h par semaine (le temps de faire une sauvegarde hebdomadaire d'au moins 500Go de données modifiées depuis la dernière sauvegarde) monte à près de 16kWh/an. A 14,4 centimes d'€ le kWh (tarif de base EDF), on obtient un coût électrique d'environ 2,3 € ce qui est (presque) marginal. Disons que le coût d'acquisition de la machine se situe aux alentours de 200€ (CM+RAM+CPU+Alim).

Si on fait la somme sur 5 ans on obtient les chiffres suivants:

D'un point de vue purement économique, Hubic et Amazon sont bien largement en dessous de ce qu'on peut faire chez soi, à capacité presque équivalente. De plus les calculs simplifiés ne prennent pas en compte les cas de pannes: changer un seul disque dur demande de rajouter 100€.

On peut néanmoins diminuer le poste de sauvegarde à la maison en jouant sur plusieurs tableaux. Par exemple, on peut avoir besoin de stocker moins que 10To. Pour stocker 3To de données, par exemple, il faudra beaucoup moins de matériel (3 disques de 3To au lieu de 8) et on peut également envisager de recycler une machine périmée à condition qu'elle dispose d'au moins 2 connecteurs SATA (ce qui est généralement le cas). Pour ma part, j'arrive à un coût quasi-minimal de 325€ pour une solution de stockage de 3To avec externalisation en utilisant une machine recyclée qui m'a coûté 10€. On voit que même ce montant est supérieur à ce que propose OVH et Amazon, ce qui n'était pas le cas avant (600€ pour l'ancien tarif d'Hubic).

Je reste sincèrement et éthiquement partisan de l'auto-hébergement mais, ma conclusion est que, d'un point de vue purement économique, l'auto-hébergement d'une solution de sauvegarde pour particulier n'est plus du tout rentable depuis ces derniers jours…

On peut néanmoins aller un peu plus loin en essayant d'évaluer quels sont les avantages qui restent d'une solution de sauvegarde auto-hébergée par rapport aux offres des fournisseurs sus-cités ?

J'en vois rapidement un qui me semble majeur: pour les personnes disposant d'un accès à Internet avec un débit montant faible (typiquement l'ADSL), le temps de chargement initial sera forcément très long.

Un rapide calcul montre qu'avec un débit montant de 100ko/s (c'est le débit de crête de mon abonnement par exemple), le chargement de 10 To prendra environ 1240 jours (soit environ 3 ans et demi). Un débit montant 10 fois plus rapide mettra environ 4 mois, ce qui reste très long. À l'inverse, un débit montant de 50Mbits/s (débit montant typique de la fibre) permettra de réaliser le chargement complet au bout de 19 jours ce qui est beaucoup plus raisonnable.

Le temps de restauration doit également être pris en compte. Avec mon abonnement ADSL, j'ai un débit descendant de 500ko/s et la restauration des 10To devrait me prendre environ 8 mois. Avec la fibre, on descend à des temps bien inférieurs (12 jours environ).

Bien entendu, ces temps correspondent à la mobilisation de toute l'offre (celle d'Hubic au moins) ce qui n'est pas forcément le cas de figure de tout le monde. Pour ma part, mes besoins de sauvegarde se situent aux alentours de 3To ce qui comprend le stockage des données sur plusieurs sauvegardes (4 sauvegardes hebdomadaires et 6 sauvegardes mensuelles conservées en permanence). Sur mon abonnement ADSL, mes temps de sauvegarde totale et de restauration sont respectivement d'un peu plus d'un an et d'un peu plus de 2 mois, ce qui reste très long. Avec une sauvegarde à la maison, je peux monter jusqu'à un débit de 70Mo/s ce qui prend respectivement 12h à sauvegarder et 12h à restaurer. Ces temps sont déjà beaucoup plus intéressants.

Un autre point d'intérêt de la solution de sauvegarde "à la maison", c'est le fait qu'on puisse dé-dupliquer le contenu des sauvegardes permettant de diminuer sensiblement la quantité d'espace disque utilisée pour stocker des données qui sont redondantes. Par exemple, le système des sauvegardes hebdomadaires et mensuelles sur un espace disque dé-dupliqué consommera vraiment peu d'espace, car les ratios de déduplication observés pour ce genre de sauvegardes qui stockent souvent la même chose à un delta près sont vraiment très bons (facteur de 1 à 10). Il existe maintenant de nombreux logiciels libres qui gère la déduplication (ZFS, Obnam, Attic, etc.).

Enfin, et pour rester sur l'aspect sécurité, disposer d'une sauvegarde à la maison c'est également une meilleure assurance pour lutter contre l'arrêt brutal d'un service. Effectivement, il est possible (même si j'en doute fortement) que ces tarifs soient uniquement des offres d'appel destinées à attirer le chaland et qu'ils vont augmenter par la suite. Peut-être encore, qu'Amazon ou OVH peuvent suspendre assez sèchement votre compte pour de nombreuses raisons (le compte a été piraté; il est utilisé pour stocker des choses répréhensibles par la loi; vous stockez finalement trop de données, pas en "bon père de famille", etc.). Enfin, on peut penser qu'à ce niveau de prix, si l'offre rencontre un réel succès et qu'une grande majorité de comptes stocke à la limite de la capacité, le fournisseur révise sa politique de prix ou limite le nombre de nouveaux abonnements.

Pour conclure sur ce sujet, je pense que l'on vient de franchir un seuil économique. Si jusqu'à présent, sauvegarder physiquement à la maison était souvent plus rentable, ce n'est maintenant plus du tout le cas. D'ailleurs, mes calculs mettent clairement de côté le facteur de temps humain. Même si on dispose d'une solution entièrement automatisée, je pense qu'administrer une machine de sauvegarde reste plus long (et nécessite plus de compétences) qu'utiliser un compte de service de sauvegarde externe. Je pense aussi qu'il est fort possible que ces tarifs baissent à l'avenir, sans doute, plus rapidement encore que les tarifs d'achat des disques durs.

Le cap est franchi, reste à voir quelles seront les conditions d'évolution de ces offres sur du moyen et du long terme (car la sauvegarde est bien un sujet de long terme)…