匿名加工情報を作成できる「匿名加工情報作成ソフトウェア tasokarena」とは

tasokarenaは、個人情報を法令にしたがって適切に匿名加工情報に加工することを支援するソフトウェアであり、
医療・ヘルスケア分野に限らず、金融、コールセンター、自治体などの分野でも利用されています。

改正個人情報保護法*1の全面施行(2017530日)で、個人情報を匿名加工情報に加工すれば本人から同意を得なくても一定の条件を満たすことで目的外利用・第三者へ提供ができるようになりました。それに伴い個人情報の利活用への関心も高まっています。
tasokarenaは、個人情報を法令にしたがって適切に匿名加工情報※に加工することを支援するソフトウェアです。
加工ルールはユーザの手で調整可能であるため、次世代医療基盤法*2に基づいた認定医療情報等取扱受託事業者や、仮名加工情報*3の作成においても使用できます。
使用するデータの特性や利用目的に応じて最適な加工方法の選択と加工結果を評価する環境を提供します。

※「匿名加工情報」とは、特定の個人を識別することができないように加工して得られる個人に関する情報であって、当該個人情報を復元して特定の個人を再識別することができないようにしたものです

新機能の特徴

昨今、国内DX(デジタルトランスフォーメーション)が加速し、データ利活用が注目されています。その中で、パーソナルデータ*4から特定の個人を識別できないように加工した匿名加工情報は、個人情報保護法や次世代医療基盤法などの関連する法整備と共に利活用が拡大しています。政府機関の個人情報保護委員会は、匿名加工情報の作成・提供に関する公表を行っている事業者が2020年3月時点で500社に上るとしています*5。
しかし、匿名加工情報の作成では、元のパーソナルデータの数が少ない場合にはデータの匿名性か有用性のどちらかが低下するという課題があったり、緻密な分析を行う際にはデータの有用性の観点から匿名加工情報よりも実際のパーソナルデータが活用されたりするのが現状です。NTTテクノクロスは、より高度なデータ利活用を実現するため、パーソナルデータの匿名性を維持したまま分析の精度や範囲を高めるためv4で搭載を開始した機能「合成データ生成」をさらに強化し、ベイジアンネットワークをもとに合成データを生成する機械学習的手法(差分プライバシー対応)を追加し、発売いたします。

 データとしての有用性を維持した架空のパーソナルデータを合成

合成データ生成機能は、元のパーソナルデータから特徴量や統計量・分布などが類似するデータを生成し、実在しないが具体的なパーソナルデータ(合成データ)を作り上げます。匿名性やプライバシーを守りつつ、分析に必要な元のデータの性質を保持したデータを生成するため、従来の匿名加工情報作成ソフトウェアによるパーソナルデータの一般化*6や削除、ランダム化されたデータと比べて、例えば数値属性を維持したまま複数の属性の相関関係に関する統計分析等、より緻密なデータ分析が可能になります。また、少ないデータから匿名化された大量の合成データを生成できるため、膨大なデータを必要とするAIの学習や訓練などに活用できます。

 NTT研究所の合成データ生成技術(特許技術)を活用

NTT社会情報研究所の特許技術である合成データ生成技術を活用しています。各属性の平均など統計値が元データとほぼ等しい合成データを生成する技術等を独自に開発し、これまでプライバシー保護技術では実現できなかった、分析に必要な複数の統計値を保持する多属性の合成データを生成することが可能になりました。NTT社会情報研究所は本技術の開発で培った知見を活用し、AI・機械学習分野における難関国際会議の匿名化技術を競うコンペティションで優勝*7しました。

基本機能

特長1:NTT独自技術含む豊富な加工技法を提供

 NTT研究所技術であるPk-匿名化*8を実用化

NTTが独自に開発した手法である「Pk-匿名化」を実用化し、本ソフトウェアに搭載しています。匿名性の代表的な指標であるk-匿名性*9を満たすようにノイズ(疑似データ)の付与やデータの入れ替えを行い、データの有用性が損なわれにくい匿名加工情報を作成します。

 数十種類の加工技法から、加工するデータに合わせた技法を選択可能

直観的な画面操作により、数十種類の加工技法の中から実行する加工技法を組み合わせ、匿名加工情報を作成することが可能です。本ソフトウェアはスタンドアロンPC上での動作が可能です。