ページの本文へ

Hitachi

IちゃんとP(パパ)と小野田君の会話が続きます。

イラスト

Iちゃん

今日は、パパの「ビッグデータの話」だったわよね。

Pパパ

そうだったね。
愛ちゃん「ビッグデータ」って何のことか想像がつくかな?

Iちゃん

そうねぇ。「ビッグ」だから「大きなデータ」か「大事なデータ」ってことかな?
そうだ、機密性が必要で大きなデータとなると「国家のデータのように巨大なデータ量を持つデータ」ってとこでしょ。
どう?正解?

Pパパ

はっはっは。
直訳英語できたか。ピンポーン、正解といいたいところだが、「大容量のデータ」と言う意味だけでは不正解ともいえる。
「ビッグデータ」は愛ちゃんの言う「データ量の大きさ」の意味で解釈すれば「巨大なデータ」となるね。
現在、日本企業の大規模DWH*1の容量は、数テラバイトの規模が多いんだが、例えば、1,000テラバイト(1ペタバイト)の規模のシステムを「ビッグデータ」と言ってもいいとされているんだよ。

Iちゃん

あら、じゃあ正解じゃない。

Pパパ

うんうん。
でもね、「大容量」のことだけをいえば、大量のデータを利用している企業は世界にすでに存在しているから、容量だけでは駄目なんだ。
単純なペタバイトなら「ビッグデータ」ではないのだよ。
勿体ぶらずに言えば、いまキチンとした定義は無いんだが、「ビッグデータ」にはもう少し複雑な意味があるんだ。
「ビッグデータとはインターネットの普及とICT技術の進化によって生まれた、これまで企業が扱ってきた以上に、より大容量かつ多様なデータを扱う新たな仕組みを表すもので、その特性は量、頻度(更新速度)、多様性(データの種類)によって表される。」という定義をしているようなんだ。

小野田君

何か、分かり難いですね。

Pパパ

そうだろうね。
総務省の「ビッグデータの定義」のようなものをみると「ICT(情報通信技術)の進展により生成・収集・蓄積等が容易になる多種多量のデータ(ビッグデータ)を活用することによって、異変の察知や近未来の予測等を通じ、利用者個々のニーズに即したサービスの提供、業務運営の効率化や新産業の創出等が可能」としているね。

小野田君

するとその範疇に含まれるデータにはどんなものがありますか?

Pパパ

それを図1に示した。
分かり易く言うと、「SNS投稿」「カード履歴」「気象データ」をイメージするといい。

図1 ビッグデータを構成する各種データ(例)
図1 ビッグデータを構成する各種データ(例)
(補足)それぞれのデータの説明は脚注を参照。

図には、いろいろなカテゴリーのデータがあるが、「ビッグデータ」を身近なことで説明すると

(1)
スマホのGPSの位置情報
(2)
ツイッターへの投稿
(3)
インターネットの買い物情報

などをかき集めて、専門家が分析すると「いろいろなめしの種」が生まれるってことだ。

Iちゃん

ピンと来ないわ!

Pパパ

例えば、こんなことができるんだよ。
スマホや携帯電話の通話やメール送信先を分析すれば、他の携帯電話会社に乗り換えられる危険を事前に察知し、個別に値引きキャンペーンや折衝ができるし、クレジットカードが使われた場所とスマホのGPSデータ、住所などを照合すると不正利用か否かも分かるといった具合だ。
要するに我々が日々刻む「デジタルの足跡」が「ビッグデータ」であり「宝の山」ということだ。

Iちゃん

そうなんだ。
そういえば、最近の新聞で「ビッグデータ個人保護に穴」という記事を見たの。
「Suica履歴 JR販売」のサブタイトルがあったんだけど、パパはこの記事は読みましたか?

Pパパ

うん、読んだよ。

Iちゃん

私も一応読んだのですが、よく理解できませんでした。
悪いけど少し解説してくれないかな。

Pパパ

仕方のないお嬢さんだね。
図1にも書いてあるが「個人に関する様々な情報」は膨大な量*10になってきているよね。こうした膨大な情報(ビッグデータ)は、企業にとっては「宝の山」になるが、個人のプライバシーをどのように守っていくかが問題だと言う記事なんだよ。

Iちゃん

その中身は?

Pパパ

図2 suicaの履歴情報が原因
図2 suicaの履歴情報が原因

「Suicaの履歴(JR販売)」の話は、JR東日本が日立製作所に市場調査用データとして、Suica情報を平成25年1月から販売し始めたんだ。
「個人情報」にならないように、氏名や住所等は除外して、性別や年令、乗降日時だけを提供しているんだが、Suicaの利用者に事前説明をしていなかったことから、利用者の反発を招いたんだね。

Iちゃん

日立さんはどんな考えなの?

Pパパ

新聞報道*11によると「2000年代半ばからビッグデータの活用を模索してきた」「個人のデータに関わる分野では、慎重を期して参入時期を模索してきた」といっているね。

Iちゃん

それを購入する企業側(この記事は日立さん)には、どんなメリットがあるの?

Pパパ

パソコンやスマホなどの普及で、ネット上や企業内に大量に蓄積されるようになった個人の情報記録を分析すれば、個人の趣味や嗜好が分かるよね。
これを活用すれば、消費者ニーズに合った広告や商品開発に繋げられると言う期待があるんだよ。

Iちゃん

そうなんだ。
その反面「個人のプライバシーを守ること」に、いろいろ問題があるってことね。

Pパパ

そう、その通り。
日本では、法制度面での不備も指摘されているんだ。
具体的に言うと「個人情報保護法では、個人情報を第三者に提供する場合、本人の同意が必要となるんだが、ビッグデータの中で扱われる個人に関するデータ(パーソナルデータ)の大半は、この法律の対象外」なんだよ。
ビッグデータに個人保護の穴があること、それは「法の対象外」で企業頼みになっている現状を大きな問題だと報じているのさ。
さっき言ったが、この法律が「個人情報として規定」するのは、氏名や住所などによって個人が識別される情報だけになっている点だね。

小野田君

「日本では不備」と言われましたが、海外ではどうなんですか?

Pパパ

うん。「パーソナルデータの取扱い」について、欧米では活用やルール作りが進んでいるんだよ。
アメリカには

(1)
包括的な個人情報保護法はない
(2)
日本の公正取引委員会に相当する連邦取引委員会(FTC)が監視機関の役割を果たしている。

EU(欧州連合)は

(1)
米国よりプライバシー保護の意識が進んでいる。
(2)
「プライバシー保護法例」では、スマートフォンなどで位置情報を事業者が取得する場合は、利用者の同意が必要と義務付けている。
(3)
パーソナルデータの保護制度が未整備と判断した国には個人情報の移転を禁じている。(日本もデータ保護が不十分とみなされ、移転禁止の対象国となっている。)
(4)
現在、保護条例よりさらに厳しい「個人データ保護規則」を検討中。
→どんな情報を検索したかや個人の属性を探らせないように「プロファイリング(分析)されない権利」も提案されている。

といったところだね。

小野田君

日本の現状はどうなっているんですか?

Pパパ

そうだね。
箇条書きで説明すると

(1)
2000年代半ば以降、パーソナルデータの収集や蓄積量が飛躍的に増大したので、郵政省などでは、ルールづくりのための研究会が繰り返し開かれたが、提言に留まっていた。
(2)
「日本にはプライバシー問題を扱う公的機関がどこにもない。そのため個人の情報が不透明な取扱いをされても対処できず、企業がデータの積極活用に踏み切れない元凶にもなっている。」「欧州のように、企業や個人の相談を受け付けたり、監視をしたりする権限のある第三者機関を早急に設立すべき」という識者*12の意見もある。

というところだ。

小野田君

冒頭で「ビッグデータ=宝の山」といった説明がありましたが、日本のビッグデータの市場はどのように展望されていますか?

Pパパ

図3 日本のビッグデータ市場予測
図3 日本のビッグデータ市場予測

うん、最近の新聞報道*13だが、図3のように報じられていたね。
IDCジャパンの予測だが、図3のように日本のビッグデータの市場は急拡大すると図3 日本のビッグデータ市場予測見られいるんだね。

Iちゃん

ビッグデータを利用したサービスって、どんなものが出ていますか?

Pパパ

典型的な例は、インターネット検索サイトで、最初の文字を入れた途端に、候補の言葉が自動的に出てくるサービスだ。
例えば、「の」と打つと「乗り換え案内」が選択肢の上位に出てくると言った具合だ。ヤフージャパンによると、検索回数が多い単語ほど上位に出てくるようになっている。

もう一つ例を挙げれば、NTTドコモは、基地局が常に携帯電話の位置情報を把握していることを利用して、データを販売するビジネスを平成25年の10月から始めたそうだ。6200万件の顧客情報と組み合わせて、ある地域で特定の時間に「神奈川県に住む20代の女性が○人いた」という推測ができるから、企業向けに販売したり、行政に対して「帰宅難民の情報の推計」などを提供し防災に役立てるといったようなことだね。

Iちゃん

パパ。
新聞報道なら私も1つ報告できます。

Pパパ

えーっ!愛ちゃんが「ビッグデータの記事」を読んで、しかも覚えていたのー?

Iちゃん

そうです。
それはね、「観光集客にビッグデータ」というタイトルで、一面トップだったのよ*14。官公庁が携帯電話などのGPS機能を活用して全国8地域で約70万人の観光客のビッグデータを収集・分析して、新たな観光ルート・スポットの発掘に生かしたり、特産品の開発に役立てたりするんですって。

Pパパ

政府は、国の方針として「観光立国」を目指していて、来日外国観光客の目標を2030年までに3000万人にするそうだし、将来はデータを集める地域を増やして観光振興につなげる考えなんだね。
愛ちゃん、大したものだ。しっかり新聞を読んでいるね。

小野田君

いやいやお陰さまでビッグデータのこと、大変よく分かりました。
有難うございました。

Iちゃん

パパ。私、テレビで「情報漏えい」って言葉を聴いたの。
内容は忘れちゃったんだけど、今日勉強したデータが外部に洩れて問題になることでしょう。教えて欲しいな。

Pパパ

はっはっは。いいよ、説明してあげよう。

*1
DWH:Data Ware House(データウエアハウス)の略。時系列に蓄積された大量の業務データの中から、各項目間の関連性を分析するシステム。分かり易い例で説明す るとコンビニの売上データから「月曜日に雑誌を買う30代の男性は一緒にコーヒーを買うことが多い」「肉マンは雨の日に最もよく売れる」など、従来の単純な集計では明らかにならなかった各要素間の関連を洗い出してくれるのがデータウェアハウスシステム。
*2
ソーシャルメディアデータ:ソーシャルメディアにおいて参加者が書き込むプロフィール、コメント等
*3
マルチメデアデータ:Web上の配信サイト等において提供等される音声、動画等。
*4
ウェブサイトデータ:ECサイト(electronic commerce"(エレクトロニックコマース =電子商取引サイト)やブログ等において蓄積等される購入履歴、ブログエントリー等。
*5
センサーデータ:GPS,ICカードやRFID(Radio Frequency Identification「電波による個体識別」の略)等において検知される位置、乗車履歴、温度、加速度等。
*6
オペレーションデータ:販売管理等の業務システムにおいて生成等されるPOSデータ、取引明細データ等。
*7
ログデータ:Webサーバー等において自動的に生成等されるアクセスログ、エラーログ等。
*8
オフィスデータ:オフィスのパソコン等において生成等されるオフィス文書、Eメール等。
*9
カスタマーデータ:CRMシステムにおいて管理等されるDM等販促データ、会員カードデータ等。
*10
膨大な情報:例えば、1)どの改札を何時に通過したか、2)どんな本を買ったか、3)どんなタレントを好むか、4)インターネットでの買い物情報、5)ツイッターでの書き込み、6)GPSでの位置情報等々個人に関する様々な情報。
*11
新聞報道:読売新聞(平成25年7月19日朝刊)
*12
識者:新保史生慶応大学教授(情報法)でプライバシー問題に詳しい。
*13
最近の新聞報道:読売新聞(平成25年9月23日朝刊)
*14
新聞記事:読売新聞(平成25年10月14日朝刊)

日立システムズフィールドサービスのサービス・商品に関するお問い合わせ

お電話でのお問い合わせ 0120-152-750 9:00〜17:00(土・日・祝日は除く)

Human*IT