fbpx

Tribune. Comment stocker des pétaoctets de données générées par les machines ?

https://www.faceaurisque.com/wp-content/uploads/2021/03/Toshiba_MachineGeneratedData_1200.jpg

Les volumes documentaires se sont multipliés au cours des dernières décades. Mais la vraie explosion des portées est encore futures. Alors que, en matière de passé, c’était surtout les personnes qui créaient les données (photos, films et documents), avec l’avènement de l’ère dans l’IoT , se se trouvent être les machines, ces appareils et ces capteurs qui se transforment en prélèvements les plus grands producteurs de données.

Ils sont dès à présent plus nombreux  par rapport aux humains et génèrent des données plus rapidement que vous. La seule voiture seul, par exemple, crée différentes téraoctets par journée. Après cela, il y a l’accélérateur au sein de particules du CERN (Organisation européenne dans le but de recherche nucléaire) laquelle génère un pétaoctet par seconde. Malgré le fait que « seulement » environ 10 pétaoctets par mois soient retenus pour une analyse ultérieure.

En plus de la conduite seul et la recherche, cette vidéosurveillance et l’industrie sont les essentiels contributeurs à ce flux de données. La société d’études de marché IDC suppose que un volume de données à echelle internationale passera de 45 zettaoctets l’année dernière dans 175 zettaoctets de 2025 . Cela permet que, d’ici six ans, trois fois plus de données sont générées qu’en 2019, soit 130 zettaoctets, soit 130 beaucoup de téraoctets.

Une large partie de ces portées sera évaluée quand arrive le moment de sa création. Entre autre, dans les capteurs alimentant un véhicule singulier ou via un Edge Computing. Là, des résultats rapides & des réactions dans les plus brefs délais sont essentiels, proposent un sorte que la durée requis pour la conversation des données mais aussi l’analyse centrale se révèle être trop élevé. Néanmoins, l’espace de rangement sur site ainsi la puissance de opération sont limités, donc tôt ou tard, une grande majorité des données aboutissent en centre de données . Elles peuvent après cela être post-traitées & fusionnées avec des portées provenant d’autres origines, analysées plus de amont et rangées.

Ceci pose d’énormes challenges pour les infrastructures pour obtenir stockage des entreprises & des instituts entièrement consacrées. Ils doivent se trouver être capables d’absorber le afflux constant pour obtenir grandes quantités documentaires et les abandonner de manière ergonomique. Ceci n’est possible qu’avec des architectures évolutives qui fournissent un ensemble de capacités de rangement dans plusieurs dizaines touchant à pétaoctets et sont continuellement étendues. Et ont besoin touchant à fournisseurs fiables proposent un matériel de rangement capables de contenter cette demande concernant le stockage continue mais aussi croissante. Après tout, vous ne pouvons point nous permettre par rapport aux données finissent via disparaitre. Le cloud public est fréquemment présenté comme un choix appropriée. Pourtant, la réalité se révèle être que la bandeau passante pour les capacité de données dont vous parlons est insuffisante. Ces coûts ne se trouvent être pas économiquement viables.

À destination des entreprises qui stockent des données IoT, le stockage devient, en un signifiance, une marchandise. Ce dernier n’est pas consommé au sens minutieux du terme toutefois, comme d’autres produits de consommation. Il est agité régulièrement et implique un investissement nonstop. Ces instituts de recherche du genre le CERN lequel traitent et stockent déjà de vastes quantités de données disposent de un aperçu relatives au ce à quoi peuvent ressembler ces infrastructures de rangement et les types d’achat de rangement à l’ère du l’IoT. Le épicentre de recherche européen sur la physique des particules ajoute continuellement proposent un nouvelles unités d’extension de stockage au centre de données. Quiconque contenant plusieurs 100ènes de disques stoïciens de dernière génération. Au complet, leurs 100 000 enregistrements durs ont regagné la capacité de rangement totale de 350 pétaoctets .

Le prix transforme le support proposent un stockage

L’exemple de CERN montre par rapport aux disques durs se trouvent être essentiels lorsqu’il en ce qui concerne stocker des quantités de données aussi formidables. Les disques stoïciens restent le pignon le moins cher, bénéficiant à la fois d’un large espace de rangement et mais aussi d’une utilisation facile. En comparaison, cette cassette est pas beaucoup coûteuse mais pas convient pas tel que support hors chasse. Miss ne convient succinct pour l’archivage un ensemble de données. La information flash, en revanche, se révèle être actuellement encore huit à dix fois plus chère via unité de volume de stockage par rapport aux disques durs.

Bien que ces prix des enregistrements SSD baissent, ils le font à le rythme similaire dans celui des disques stoïciens. Qui plus est, les disques stoïciens sont très bien en adéquation pour répondre à tous les exigences de exploit dans des environnements dans stockage à large capacité. Un seul disquette dur peut être minimum intéressant qu’un seulet SSD, mais cette combinaison de divers disques durs dans rotation rapide donne la possibilité d’obtenir des vertus d’IOPS très portées qui peuvent fournir dans manière fiable ces applications d’analyse les éléments nécessaires.

En fin dans compte, le prix se révèle être le seul critère décisif. D’autant particulièrement les volumes documentaires à stocker sur la planète IoT ne sont compressés que du manière minimale afin de économiser un espace du stockage précieux. Au sein de la mesure du envisageable, une compression a habituellement lieu au endpoint ou via un Edge pour amoindrir la quantité documentaires à transmettre. Ainsi, une quantité arrive – centre de données au pied de forme compressée mais aussi doit être stocké sans autre compression. En outre, la déduplication offre peu d’économies potentielles car, hostilement aux partages ou bien sauvegardes de fichiers important d’entreprise classiques, celui-ci n’y a pratiquement pas de données similaires.

Sur la raison du flot de données IoT et la grande quantité dans disques requise laquelle en résulte, une fiabilité des enregistrements durs utilisés se révèle être d’une grande influence. Cela a minimum à voir avec les pertes de données possibles, vu que celles-ci peuvent être gérées à l’aide au sein de mécanismes de sauvegarde appropriés, qu’avec l’entretien du matériel. Grace à un taux relatives au défaillance annualisé (AFR) atteint par le CERN de 0, 7%, un choix de stockage utilisant 100 000 disques stoïciens exigerait que 350 disques soient remplacés chaque année – en norme près d’un disquette de plus par journée.

Les disques stoïciens: essentiels dans les décades à venir

Dans les décades à venir, peu pour obtenir choses changeront grace à un stockage un ensemble de données IoT supportée principalement par les enregistrements durs. Les accablasse de production Éclair resteront tout simplement abusivement faibles pour que ces SSD dépassent ces HDD.

Pour couvrir une demande de rangement actuelle uniquement détails techniques disques SSD, cette production flash va augmenter considérablement. Sachant par rapport aux coûts de maçonnerie d’une seule usine de fabrication éclair s’élèvent à plusieurs beaucoup d’euros, il s’agit d’une entreprise difficile dans financer. De plus, ceci n’entraînerait une résistance flash plus importante qu’après environ 2010.   Ce qui pas couvrirait que une demande de 2020 et non celle-ci de 2022.

La ébauché de disques stoïciens, par contre, peut être avancée beaucoup plus facilement vu que il faut moins de ébauché que dans la ébauché de semi-conducteurs. Qui plus est, le développement des enregistrements durs progresse journellement et de nouvelles technologies du genre HAMR (Heat-Assisted Magnetic Recording) et MAMR (Microwave-Assisted Magnetic Recording) continuent de générer un ensemble de augmentations de volume.

Ces experts supposent uniquement la capacité touchant à stockage des enregistrements durs continuera d’augmenter dans un rythme d’environ 2 téraoctets via an à coût constant pendant bien quelques années. Ainsi, IDC prévoit que d’ici une fin de 2025, plus de 80% de capacité requise en matière de secteur des entreprises à destination des centres de données basiques et via ce Edge continueront d’être obtenus sous forme de enregistrements durs et environ 20% sur les enregistrements SSD et autres aspect flash.

Pour en savoir plus ou lire la suite : Source | Lien vers l'article

Les dernières publications :