★☆★JNSAメールマガジン 第39号 2014.7.11.☆★☆
セコムの松本さんから「「暗号技術」のテーマでメルマガの連載をやるから、「これからの暗号技術」のコラムを担当してね」といわれ「わかりました」と答えたものの、いざ書く段階になっていろいろと考えることがありました。せっかくの機会ですので、徒然なるままにコラム化したいと思います。
新しいビジネス展開にビッグデータを使いたい。そのために、匿名化してパーソナルデータを流通させよう、という動きがホットな話題になっています。実際、IT総合戦略本部配下のパーソナルデータに関する検討会では「パーソナルデータの利活用に関する制度改正大綱(検討会案)」を作成しており、今後、制度設計の細部等について法制化が進んでいきます。
本大綱案では、「本人の同意がなくてもデータの利活用を可能とする枠組みの導入等」として、『新たに一定の規律の下で原則として本人の同意が求められる第三者提供等を本人の同意がなくても行うことを可能とする枠組みを導入する。具体的には「個人の特定性を低減したデータ」への加工と、本人の同意の代わりとしての取扱いに関する規律を定める』とあります。
個人の特定性を低減する暗号技術として匿名化技術があります。これにはいろいろな方法が考えられますが、暗号研究の立場から言えば、秘密計算が一つの新しいトレンドといえるでしょう。秘密計算とは、個別のデータを明かさずに統計情報だけを取り出す方法です。
具体的には、@最終的な帳尻が合うようにデータをあらかじめ加工しておき、A個々の計算サーバには加工したデータについて計算をさせ、B個々の計算サーバが出した結果をまとめて元々のデータに対する計算結果を求める、というやり方をします。@をビッグデータ保有企業、Aを秘密計算センタ、Bをビッグデータ利用企業、がそれぞれ活用する形態を考えれば、ビッグデータ保有企業はその中身を秘密計算センタやビッグデータ利用企業に開示することなく、一方でビッグデータ利用企業はそのデータから導かれる統計情報などを活用できるようになります。
例えば、ビッグデータ保有企業A社とビッグデータ利用企業X社があるとしましょう。このとき、X社がA社にどのような統計情報を使いたいかを伝えてもよいのであれば、X社が望む統計情報に予めA社が加工してからX社に渡せば済むだけの話で、何も秘密計算のような計算コストが高いシステムを使う必要はありません。秘密計算の出番は、「X社がどのような統計情報を使いたいかをA社に伝えることなく、A社のビッグデータを使う」というところがポイントとなります。
もう一つの例は、ビッグデータ保有企業A社とB社があって、互いのデータは明らかにせずに両者の統計情報を計算する場合です。こちらの場合は、秘密計算以外の方法(学術用語としてはマルチパーティプロトコルに属する方法)もなくはありませんが、現実的には秘密計算が一番有望なシステムであることは間違いがないかと思います。
実際のビジネスモデルとしては、ビッグデータ保有企業A社とビッグデータ利用企業X社の間に第三者のビッグデータ分析会社C社が入っているケースが多くあります。秘密計算であれば、ちょうど秘密計算センタに相当する部分です。
さて、C社にはどのような信頼性が求められるでしょうか。ビッグデータの内容から具体的な分析結果を求めるところになりますから、ある意味、一番プライバシーを侵害しやすい立場にいることになります。そのため、体制の組み方は少なからず信頼性に影響を与えるでしょう。
もっとも考えやすい体制としては、C社内で担当業務プロセスを分離するという考え方です。ビッグデータに匿名化を施す部門、匿名化したデータを管理する部門、匿名化したデータの分析を行う部門、といったように担当部門ごとに分けて処理を行う形式です。担当部門間に物理的・管理的なファイヤーウォールを設けることで、担当者間の結託行為を防止し、プライバシーを保護するスタイルです。
次にあげられるのが、匿名化から管理・分析までを一気に自動化するやり方で、分析担当者は特別のソフトウェアを介してからでなければビッグデータに触ることができず、また途中経過も一切出力することなく、分析結果だけを出力する形式です。ソフトウェアの信頼性をベースに、極力データが人目に触れないようにすることでプライバシーを保護するスタイルです。
秘密計算では、ソフトウェアで触ることのできるデータはビッグデータそのものではなく、あらかじめ加工されたデータだけであり、加えて分散して処理が行われるため、上記の両方の安全性を備えているといってもいいでしょう。
ここからわかることは、C社の仕組みがどの程度信頼できるか、またA社がC社に対してどのような形でビッグデータを提供するかによって、明らかに安全性の違いがあります。ただ、やっかいなのは、これらの処理がシステム的には全てバッググランドで行われるものであり、表面上の安全性の違いとしては見えないことにあります。その結果、一般には「安全かどうか」よりも「安心できるかどうか」のほうに判断基準が置かれやすくなります。
従来、暗号技術は「単体技術」として議論されてきました。具体的には、暗号技術が安全であることをどう「証明する」かは、暗号研究者の中で一定のコンセンサスがあり、実用的にはそれほど違いがない安全性の差であっても、証明方法によって安全性を厳密に区別することも少なくありません。ただ、その議論が成り立つのは、あくまでその暗号技術の実装や運用は完全に守られていることが前提です。
暗号技術がなければ日常生活すらままならないほど、暗号技術が社会の基盤技術として広くいきわたってきている現在、暗号技術が安全に機能するための前提として守るべき部分のコントロールが効きにくくなってきており、結果として、暗号研究者が対象とする「安全性」の議論とは全くかけ離れた次元の「安全性」の問題に直面しているといえます。
これからは、「安全かどうか」という「単体」として暗号技術を見るのではなく、フェールセーフ思想や更新の自動化など「安心を与えるための仕組み」といった、人の行動を含めた「全体システム系の一要素技術」として議論をしなければ意味を持たない時代になってきている、といえるでしょう。