ペタバイトってどれくらい?
DXやビッグデータの活用にはデータ管理を!

 2022.08.03  2024.01.17

DX推進・ビッグデータ活用などにより、大容量のデータ処理が求められています。併せて、大容量のデータ量を表す単位「ペタバイト」も身近になっています。この記事では、まずペタバイト自体を説明します。そして今日、ペタバイト単位のデータ容量を管理する必要性が生じていることを、DX・ビッグデータとの関係から詳しく解説します。

マンガでわかるSnowflake

ペタバイトとは?

ペタバイト(petabyte)とは、データ量の単位のことです。PBやPByteと表記されることもあります。
ギガバイト(GB)やテラバイト(TB)という単位なら、市販の大容量ストレージなどに表記されているのをよく目にするでしょう。ペタバイト(PB)はこのTBの上の単位です。
具体的には、1,000GBが1TBで、1,000TBが1PBです。あえてGBで表現するなら、1PBは1,000,000GB(100万GB)です。
※このように10進法に基づき、1000倍ごとに単位が変わる基準を「国際単位系(SI単位系)」と呼び、本稿もこのSI単位系を用いています。

ノートパソコンの場合には内蔵ハードディスクの容量が500GB~1TB、外付けハードディスクは1~2TBのものが現在主流となっています。仮に1PBのストレージがあれば、1TBのノートパソコンやハードディスク1,000台分、16GBのスマートフォン約6万2,000台分と同じ容量を保存できます。また比喩として、1PBは、一般的な書物の5,000億ページ分に相当する情報量を持つとも言われます。

このような大容量の単位であるPBは、一般的にはまだほとんど使用されていません。しかし近年のビジネスでは、扱うべきデータ量が急増するようになり、徐々にPBを使用するシーンも増えてきています。

なお、ペタバイトの上はエクサバイト(EB)であり、1,000PBで1EBです。

データ主体のAIでビジネスを変革
デジタルトランスフォーメーション(DX)に取り組むエンタープライズ企業の成功と挫折の現状

写真や動画に換算すると?

「1PB」の大きさをイメージするため、画像・動画データに換算してみます。スマートフォンで撮影した1枚3MBの写真なら、3億枚以上です。1分100MBの動画なら、16万6000時間分ほどになり、約6,900日間分に相当します。

これからの情報化社会を生き残るために必要なこととは?

2017年に日本は世界に向けて、将来の産業の姿として「Connected Industries(コネクテッド・インダストリーズ)」というコンセプトを発表しました。
これは、「もの・人・技術・企業・消費者など、あらゆるものがデータでつながり、社会課題を解決しながら、新しい価値を作り出す産業」を目指す考え方です。このコンセプトを実現するためには、AIなどのデジタルツールによって、人々の力を引き出す必要があります。企業や産業、国同士がつながり、協力・協働することも大切です。
また現在では、経済産業省が定期的にDXレポートを発表しています。日本社会内でのDX推進も、積極的に広めようとしているのです。

Connected Industries(METI/経済産業省)

DXレポート ~ITシステム「2025年の崖」克服とDXの本格的な展開~

日本政府の主導もあり、今後は社会や企業でのIT化・DXがさらに進んでいくことが予想されます。新しいIT技術が広まれば、それにしたがって大量のデータが発生します。企業は、それら膨大なデータを社内で管理していかなければなりません。
このように加速するデータ量の増加に備えて、「PB規模の情報を管理するストレージ・システム」が必要になります。加えて「大量の情報を取り扱うために必要なセキュリティ管理」などを整備することも重要です。現代の日本では、これらの普及が現実的な課題となってきています。

しかしもし社内でDXをうまく推進できたなら、他社の先を行く経営戦略を策定可能になり、競争力が強化され、市場での優位性も維持されるでしょう。これを実現するには、大容量データを自社で処理・管理することが不可欠であり、専門知識を持つデジタル人材も必要です。
つまり企業では、最新のITシステムを物理的に構築しながらも、「デジタル化に対応できる人材の採用や、育成プログラムの作成」なども行うことで、大容量データの管理体制を整えることが必要です。こうした事態を念頭に置きながら、「自社でPB規模の情報を扱うには、何をどう整備したらよいか」を早めに考えておくことが、今後の社会を生き残るために急務となっています。

データ容量が爆発的に増大する背景

PB規模の情報を実際に活用する状況は、まだイメージしにくいかもしれません。ところが、近年ではビジネス上で使うデータが増大し、「1日で1PBのデータが発生する」というケースも増えています。

日本や世界で進んでいるDXにより、新しいITシステムの導入を行う企業が増加しています。新システムでは、システムの連携に必要な「基幹系のデータ」に多くの容量が使用されるため、より大容量のストレージを備えなければなりません。
実際、「センサーでデータを収集し、ネットワークを介して共有する」IoT機器を導入したり、AI・ロボットなどの新技術を導入したりする企業は増えています。それと併せて、「高解像度の動画」といった大容量データの活用機会も増加しています。またICT(情報通信技術)を活用した営業活動なども盛んになっており、こうしたさまざまな要因で、社内で処理すべきデータ容量は日増しに大きくなっているのです。
さらにクラウドサービスやビックデータの活用が広まったことも、データ量増大の大きな要因です。例えば、「各種SNSから収集した大量のデータによって、自社顧客の行動履歴や購入履歴を分析する」といった手法は、各企業で一般的になりつつあります。

このように、新しいシステム・技術の導入や、インターネット・ICTの活用などによって、国内企業のデジタル化が進んでいることで、扱うべきデータ量も膨大になってきています。

DXやビッグデータの活用を進めるのはなぜ?

大きく分けて、「生産性の向上」「消費者の行動変化」「2025年の崖」の3つが原因となり、DXやビッグデータの活用が進められていると考えられます。各原因を理解することで、DX・ビックデータ活用の理由が明確に認識できます。

生産性の向上のため

経済産業省のDXガイドラインを参照すると、DX推進は「データや最新のIT技術を活用して、ビジネスモデルを根本的に変革すること」と理解できます。また、各業務・組織や、各業務プロセスなども変革し、企業の競争力を向上させることも重要な目的です。
単にデジタル技術を導入するのではなく、「デジタル化にフィットするように、組織の枠組みまで作り直すこと」がDXの核心です。これにより、労働時間を短縮しつつ、業務の正確性を増大させ、生産性向上も目指していきます。
参照元:『デジタルトランスフォーメーションを推進するためのガイドライン

DXの一環となる代表的な施策例は、RPA(ロボティック・プロセス・オートメーション)の導入です。これは、これまで人の手で行ってきたルーティン業務を自動化します。RPAの活用範囲は、「自動化できる業務を増やし、人の業務負担を軽減させること」を目的に定めます。
負担の減った従業員たちは、ほかの重要な業務に労力を回せるようになるので、組織全体の生産性向上につながります。こうした生産性向上の実現を目指して、DX推進は各企業に広まっています。

消費者の価値観や行動の変化

近年では、「スマートフォンによるECサイトの利用」も当たり前の事象となるなど、消費者のニーズや行動は大きく変化しています。

そうした状況で、「あらゆる個人がインターネット上で行う購入行動や、購入に結びつく行動」をデータとして収集することが、企業にとって重大な意義を持ち始めています。これらをビッグデータとして整理し、顧客・リード情報の分析に活かすのです。そしてその分析結果に基づき、マーケティング戦略を立案します。これによって、昨今の変化の激しい市場の中でも、消費者のニーズを適切に予測可能となるため、着実な利益向上へつながります。

ビッグデータは一般にPB規模です。このビッグデータを上記のように有効活用することは、レガシーシステムのような従来のシステムではほぼ不可能です。そこで、DXが求められます。
ビッグデータの分析・活用を大きな目的として、新しいIT技術や高性能なシステムの導入を目指します。これにより、例えば、消費者や顧客のデータを「特性パターン・行動パターン・嗜好パターン」などに細かく分けて分析します。併せて市場分析なども行えば、「現在の市場動向・競合他社との力関係に鑑みて、自社ターゲット層はどこに絞ればよいか」など、非常に具体的なマーケティング戦略が立案可能です。

2025年の崖

近年、経済産業省が特に問題視しているのが「2025年の崖」です。2025年の崖とは、「日本がDX推進を行えなかった場合、2025年以降、最大12兆円/年の経済損失が生じ続けることになる」という予測です。実際、2018年のDXレポートにおいても、この問題は集中的に取り上げられています。
参照:DXの推進に関する現状と課題 2025年の崖

この「崖」を回避するためにも、DXを推進することは日本全体の急務です。そしてその推進を妨げる大きな足かせが、レガシーシステムです。
具体的には、「長年の使用により修正箇所が増加して、システムの中身がブラックボックス化している」「ブラックボックスを放置したまま、不十分な管理を行うことで、よりブラックボックス化が深刻になる」また「部署ごとにレガシーシステムを使用しているため、部署間の連携が取れない」などの事態が重なり、新システムへの移行を困難にしています。

加えて、「レガシーシステムの保守運用を行っている主要エンジニアは、その多くが2025年には定年退職を迎える」という問題もあります。このため、2025年以降に、ITシステムを管理するデジタル人材が決定的に不足する恐れがあります。

海外と比べてすでにDX推進が遅れている日本では、レガシーシステムの問題を早期に解決しなければなりません。こうした背景があり、国は盛んにDX推進を呼びかけています。

まとめ

ペタバイトは、1,000テラバイトに換算できる大容量のデータを表します。現在では、IT技術による大容量のデータ収集、インターネットやSNSなどから入手する消費者データ・オープンデータの活用など、膨大なデータ量のビッグデータをビジネスで活用するケースも増加傾向です。DX化、ビッグデータの活用により、消費者の行動などの変化を把握、2025年の崖問題を解消することが可能になります。

CTA

RECENT POST「データマネジメント」の最新記事


データマネジメント

レイクハウスとは? 特徴やデータレイク・DWHなど似た単語との違いを紹介

データマネジメント

DXのゴールは内製化!データ活用における内製化のHowToは?

データマネジメント

MDM (マスターデータマネジメント)とは? メリットや導入の進め方を解説

データマネジメント

Alation、はじめました。第6回:Alation(アレーション)の機能《データリネージ》

ペタバイトってどれくらい? DXやビッグデータの活用にはデータ管理を!
CTA

RECENT POST 最新記事

CTA

RANKING人気記事ランキング


OFFICIAL SUPPORTER