株式会社KDDI総合研究所 このページを印刷する

~安全性の可視化による利便性の高い匿名化ツール~

世界初、複数の匿名化手法を組み合わせて安全性の評価が可能な匿名加工情報作成ツールを開発

2016年9月29日
株式会社KDDI研究所

株式会社KDDI研究所(本社:埼玉県ふじみ野市、代表取締役所長:中島康之、以下:KDDI研究所)は、事業者が所有するパーソナルデータの多面的な安全性を考慮した匿名加工情報の作成が可能なツールの開発を行いました。従来のようにk-匿名化(注1)だけを考慮するのではなく、サンプリング(注2)など複数の匿名化手法を組み合わせることで、より有用な匿名加工情報を作成することができます。これまで各匿名化手法の安全性指標は単純に比較することができませんでしたが、データの特徴などを元に複数の匿名化手法を組み合わせた場合でも、k-匿名性と同じ基準で安全性の評価が可能なアルゴリズムを、世界で初めて(注3)開発しました。これにより、複数の匿名化手法を組み合わせたとしても、どちらのほうが安全であるかの確認が可能となり、匿名化手法の幅が広がります。なお本研究開発成果の一部は、国立研究開発法人科学技術振興機構(JST)の戦略的創造研究推進事業「ビッグデータ統合利活用促進のためのセキュリティ基盤技術」の体系化の成果です。

 

 

【背景】
2015年9月に公布された個人情報保護法の改正法において、特定の個人を識別できないように加工した匿名加工情報については企業の自由な利活用が認められ、法改正により今後さまざまな分野での適切な匿名加工情報の利用が期待されています。

 

【今回の成果】
従来は、k-匿名化、ノイズ付与、ランダムサンプリングといった加工手法ごとに異なる安全性(匿名化の度合い)が決められていました。本ツールでは、データセットの特徴を抽出、指標間の関係性をモデル化することで、それぞれの安全性を同一の指標で評価できるようにし(注4)、これらの加工手法の最適な組み合わせを求めることが可能となりました。安全性を満たすために強いk-匿名化を行い、有用性が大きく損なわれるような場合でも、本ツールでは別の手法を組み合わせることで、同じ安全性で高い有用性を持つデータの生成を行うことができます。手法の組み合わせは選択可能なため、医療データのように繊細なデータの加工を行う場合は、サンプリングと汎化、レコードの削除のみを使用し、ノイズ付加は行わないといったことも可能となっています。データの生成時には、k-匿名性以外にも懸念されるリスクについて多面的な評価を行って可視化しレポートとして出力するため、ひと目で生成した匿名加工情報が持つ安全性を確認することができます。

 

【今後の展望】
今後は社内外で本開発ツールの実証実験を行い、その結果を元に匿名化手法の最適化を検討しています。また大規模データに対応できるように、加工や評価をクラウド上で行うことで高速化を図るなど、実用化を目指した技術開発に取り組んでいきます。実用化の際は、ビッグデータを所有する機関は、求める安全性と有用性を両立した価値のあるデータセットの作成が可能となり、データの安全性を審査する機関やデータに含まれる各個人は出力されたレポートを確認することで、その安全性を評価することが可能となります。

 

 

(注1)年齢や性別など個人の特定につながりうる情報(準識別子)の組み合わせについて、どの組み合わせもk個以上存在するように、汎化やレコード削除などの加工を行うこと。

(注2)データ全体(母集団)から一部のデータ(標本)を抽出する手法。サンプリング率を下げることで、標本に含まれるレコード数が減るため、攻撃者がレコードを特定できる確率が下がり、結果として安全性が上がる。

(注3)複数の匿名化手法を組み合わせた場合でも、k-匿名性と同じ基準で安全性の評価が可能なアルゴリズムの開発が世界初。2016年9月29日、KDDI研究所調べ。

(注4)コンピュータセキュリティシンポジウム2016(CSS2016, 2016年10月11日~13日)にて関連する研究成果を発表予定。

 

別 紙

 

【本件に関するお問い合わせ先】

株式会社KDDI研究所
営業・広報部 広報チーム
E-Mail: inquiry@kddilabs.jp

※ニュースリリースに記載された情報は、発表日現在のものです。 商品・サービスの料金、サービス内容・仕様、お問い合わせ先などの情報は予告なしに変更されることがありますので、あらかじめご了承ください。