NTT研究所の新たな匿名化技術を活用
データとしての有用性を維持した架空のパーソナルデータを合成
匿名加工情報作成ソフトウェアの新バージョンを販売開始
2021年10月26日
NTTテクノクロス株式会社
NTTテクノクロス株式会社(本社:東京都港区、代表取締役社長:桑名栄二 以下、NTTテクノクロス)は、NTT研究所の新たな匿名化技術を活用し、合成データ生成機能を搭載した匿名加工情報作成ソフトウェア「tasokarena(タソカレナ)」の新バージョンを2021年11月17日から販売します。
背景
昨今、国内DX(デジタルトランスフォーメーション)が加速し、データ利活用が注目されています。その中で、パーソナルデータ*1から特定の個人を識別できないように加工した匿名加工情報*2は、個人情報保護法や次世代医療基盤法*3などの関連する法整備と共に利活用が拡大しています。政府機関の個人情報保護委員会は、匿名加工情報の作成・提供に関する公表を行っている事業者が現在500社に上るとしています*4
しかし、匿名加工情報の作成では、元のパーソナルデータの数が少ない場合にはデータの匿名性か有用性のどちらかが低下するという課題があったり、緻密な分析を行う際にはデータの有用性の観点から匿名加工情報よりも実際のパーソナルデータが活用されたりするのが現状です。NTTテクノクロスは、より高度なデータ利活用を実現するため、パーソナルデータの匿名性を維持したまま分析の精度や範囲を高めることを可能にしました。
特長
(1)データとしての有用性を維持した架空のパーソナルデータを合成
「tasokarena」新バージョンでは、元のパーソナルデータから特徴量や統計量・分布などが類似するデータを生成し、「実在しないが具体的なパーソナルデータ(合成データ)」を作り上げます。この合成データ生成機能は、匿名性やプライバシーを守りつつ、分析に必要な元のデータの性質を保持したデータを生成するため、従来の匿名加工情報作成ソフトウェアによるパーソナルデータの一般化*5や削除、ランダム化されたデータと比べて、より緻密なデータ分析が可能です。また、少ないデータから匿名化された大量の合成データを生成できるため、膨大なデータを必要とするAIの学習や訓練などに活用できます。
(2)NTT研究所の合成データ生成技術(特許技術)を活用
NTT社会情報研究所の特許技術である合成データ生成技術を活用しています。各属性の平均など統計値が元データとほぼ等しい合成データを生成する技術等を独自に開発し、これまでプライバシー保護技術では実現できなかった、分析に必要な複数の統計値を保持する多属性の合成データを生成することが可能になりました。NTT社会情報研究所は本技術の開発で培った知見を活用し、AI・機械学習分野における難関国際会議の匿名化技術を競うコンペティションで優勝*6しました。
価格(税別)
- スタンダード版(GUI版) 60万円~/年
- エンタープライズ版(スタンダード版+自動実行/データ連携機能) 180万円~/年
※年間サブスクリプションライセンス
匿名加工情報作成ソフトウェア「tasokarena」
パーソナルデータの特性や利用目的に応じた匿名加工情報の作成を支援するソフトウェアで、2018年7月から販売しています。NTT社会情報研究所が開発したPk-匿名化技術*7を活用しています。(https://www.ntt-tx.co.jp/products/anontool/)
用語解説・注釈
*1:パーソナルデータ
特定の個人を識別することができるかを問わず、個人に関する情報全体を指します。
*2:匿名加工情報
2017年5月施行の改正個人情報保護法により、個人情報を「匿名加工情報」に加工し一定の条件を満たすことで、本人の同意なく柔軟な利活用が可能になりました。「匿名加工情報」とは、特定の個人を識別することができないように加工して得られる個人に関する情報であり、当該個人情報を復元して特定の個人を再識別することができないようにしたものです。
*3:次世代医療基盤法
2018年5月に施行され、認定事業者が複数の医療機関から患者情報の提供を受け、データを匿名加工した上で研究機関や企業に提供することが可能になりました。
*4:出典 パーソナルデータの適正な利活用の在り方に関する実態調査(令和元年度)報告書(個人情報保護委員会)(https://www.ppc.go.jp/files/pdf/personal_date_report2019_1.pdf)
*5:パーソナルデータの一般化
2018年5月に施行され、認定事業者が複数の医療機関から患者情報の提供を受け、データを匿名加工した上で研究機関や企業に提供することが可能になりました。
*6:出典 日本電信電話株式会社の発表資料(https://www.ntt.co.jp/news2021/2103/210302b.html)
*7:Pk-匿名化技術
データの一部分を確率的に書き換えるランダム化の処理と、元の状態を推定する再構築という処理により、理論的にk-匿名性を満たしつつ、元のデータの統計的性質をなるべく保った有用性の高いデータを作成します。
*「tasokarena」はNTTテクノクロス株式会社の登録商標です。
* 記載されている商品名・会社名などの固有名詞は一般に該当する会社もしくは組織の商標または登録商標です。
NTTテクノクロス株式会社概要
NTTテクノクロスは、NTT研究所の最先端技術を中核に、国内外の優れた商材を豊富な実績とノウハウで掛け合わせることで、お客様のビジネスシーンに最適なソリューションを創出します。時代に先駆けたソリューションにより、豊かな未来社会の実現に貢献し続けます。(https://www.ntt-tx.co.jp/)