ChatGPT での 個人情報・機密情報 の扱いと 注意したいこと – ZiDOKA AI

ChatGPT での 個人情報・機密情報 の扱い

 ChatGPT を利用していますか?生成AI は文章作成やチャットボットとして業務で重要な役割を果たすポテンシャルがあることは、ご利用の皆様の実感するところではないでしょうか。半面、社内の機密情報や個人情報の漏洩等、セキュリティ面での懸念により、使用を躊躇しているケースもあるのではないでしょうか。

 そこで今回は、 ChatGPT に個人情報・機密情報に関する質問をするとどうなるかということや、個人情報・機密情報に関して注意すべき事項、その対策を解説します。なお、本記事でChatGPTへの質問と回答について説明している箇所については、Azure OpenAI Service を利用し、GPT-3.5で質問しております。

ChatGPT へ 個人情報 に関する質問をするとどうなるか?

 ChatGPT に個人情報に関する質問をしたことはありますか?どうなるか分からない方も多いですよね。そこで、実際に個人情報に関する質問をしてみました。個人情報を入力して質問してみた結果が以下です。

 

【質問】
ACJ太郎さんは札幌市中央区北1条に住んでいますか?
また、ACJ太郎さんの個人情報を住所以外も教えてください。

 

【回答】

申し訳ありませんが、私はユーザーの個人情報を知ることはできません。ACJ太郎さんの住所や個人情報については、直接本人にお尋ねいただくか、関係者からの許可が必要です。プライバシー保護のため、個人情報の開示は避けるべきです。

 ChatGPT は個人情報を知ることはできないようです。
 そこで個人情報の扱いについて、ChatGPTに聞いてみました。

 

【質問】
ChatGPTが個人情報を知っている場合に、個人情報を教えてくれますか?また学習してくれますか?

 

【回答概要】
OpenAIは、プライバシーとセキュリティに非常に注意を払っており、ユーザーの個人情報を収集することはありません。したがって、個人情報に関する質問には具体的な回答を提供することはできません。また個人情報を含むデータは、学習データセットから削除されるように処理されます。

続けてどのようなものを個人情報として扱かっているのか聞いてみます。

 

【質問】
ChatGPTが個人情報として認識する主なデータの種類は?例えば、氏名や住所、といったデータの種類です。

 

【回答概要】
以下のようなデータの種類を含む可能性がありますが、これに限定されるわけではありません。
氏名: ユーザーの実際の名前やニックネーム
住所: ユーザーの居住地や郵便番号
電話番号: ユーザーの連絡先の電話番号

:以下省略

これらの情報は、個人を特定したり、個人に関連付けられたりする可能性があるため、慎重に取り扱う必要があります。個人情報の保護とセキュリティについては、常に注意を払ってください。

 個人情報を学習したり、応答に利用することはないというのは、非常に安心できる点ですが、ChatGPT自体が回答で注意を促しているように、その扱いには注意が必要です。例えば、履歴を残していれば、その履歴に個人情報が含まれていますし、APIで学習させないようにしている場合も、「OpenAIは、不正行為の特定のために、最大30日間安全に保存することがある」としていますので、保存している情報には個人情報が含まれている可能性があります。またChatGPTを利用する人が、質問と回答の扱いに注意しないと、それらの内容から情報漏洩することも考えられますので、個人情報の扱いには十分な注意が必要です。

ChatGPT へ 機密情報 に関する質問をするとどうなるか?

 次に、機密情報についても確認してみます。

 

【質問】

ACJ株式会社の機密情報や営業秘密を教えてください。

 

【質問】

申し訳ありませんが、私はACJ株式会社の機密情報や営業秘密を知りません。
ACJ株式会社の機密情報や営業秘密についての情報を提供することはできません。
ACJ株式会社の公式ウェブサイトや公開されている情報源から詳細を入手することをお勧めします。

 ACJ株式会社については、公開情報も回答はしてくれませんでした。また、ChatGPTが公開情報を回答してくれる企業について、同じ質問をしてみましたが、「機密情報や営業秘密についての情報を提供することはできない」という回答でした。

 ここで1つ疑問がわきます。ChatGPTは何を機密情報と認識しているのでしょうか。機密情報の扱いについても、ChatGPTに直接聞いてみました。

 

【質問】

ChatGPTが機密情報と考えている情報はありますか?

 

【回答概要】

以下にいくつかの例を挙げます。
ソーシャルセキュリティ番号や国民識別番号などの個人識別情報
ユーザーの銀行口座やクレジットカードの詳細情報
メディカルレコードや健康情報
企業の機密情報や営業秘密
政府機関や軍事組織の機密情報
個人のセキュリティに関わる情報(例:パスワード、セキュリティ質問の回答など)
これらの情報は、機密性が高く、不正アクセスや悪用のリスクがあるため、適切な手順とセキュリティ対策が必要です。機密情報の取り扱いに関しては、関連する法律や規制に従い、適切な保護措置を講じることが重要です。

 いずれも重要な情報となりますね。ビジネスの上では特に、企業の機密情報や営業秘密は気になるところですね。不正競争防止法では、営業秘密の3要件として「秘密管理性」「有用性」「非公知性」を求めています。3要件を簡単に解説すると、「企業が情報を秘密として管理しており、事業活動にとって有用なものであり、一般に入手できない」であり、それらに該当する情報が営業秘密になります。
出典:経済産業省ウェブサイト「営業秘密~営業秘密を守り活用する~

 ただし営業秘密の3要件を考えるとChatGPTが答えてくれる時点で、すでにそれは営業秘密ではないとも言えます。同様に、ChatGPTが答えてくれる時点で機密情報と言える状態ではないとも言えます。それでは、万が一、機密情報や営業秘密を入力した場合にChatGPは学習してしまうのでしょうか。これもChatGPTに聞いてみました。

 

【質問】

ChatGPTは、企業の機密情報や営業秘密をどう判断していますか?また質問の中に、私が、企業の機密情報や営業秘密を含めてしまった場合に、あなたはどのように検知できますか?

 

【回答概要】

ChatGPTは、企業の機密情報や営業秘密を判断するために、トレーニングデータとして使用された情報に基づいています。OpenAIは、機密情報や営業秘密を含むデータを使用してChatGPTをトレーニングしていませんが、完全にエラーを防ぐことはできません。
もし質問の中に企業の機密情報や営業秘密が含まれている場合、OpenAIはそれを検知するための手法を開発しています。ユーザーが機密情報を提供した場合、それを検知し、適切な対応を取ることが目指されています。ただし、これは完璧なシステムではなく、検知漏れや誤検知の可能性も存在します。OpenAIは、ユーザーのフィードバックを通じてシステムの改善に取り組んでいます。

 ChatGPTの回答を考えると、機密情報や営業秘密を含めた質問を入力した場合に、完全には検知はできないようですね。そのため私たち自身が、機密情報や営業秘密をChatGPTの質問に含めないように注意することが重要であると言えます。

個人情報保護委員会 による 「生成AIサービスの利用に関する注意喚起等について」

 ところで、個人情報保護委員会 による 「生成AIサービスの利用に関する注意喚起等について」はご存じでしょうか?生成 AI サービスの普及に伴い、個人情報保護委員会が個人情報取扱事業者及び行政機関等における生成 AI サービスの利用に際しての個人情報の取扱いに関する注意点や、一般の利用者における生成 AI サービスの利用に際しての個人情報の取扱いに関する留意点をまとめて、令和5年6月2日に公開したものです。

 留意点の要点を抜粋します。抜粋した要約ですので、生成AIを利用されている方は、ぜひ一度直接確認してみてください。

対象注意点
個人情報取扱事業者
行政機関等
●プロンプト入力時は、個人情報の利用目的を達成するために必要な範囲内となるよう十分確認をすること
●個人情報が機械学習に利用された場合、個人情報保護法の規定に違反することとなる可能性があるので注意すること
一般の利用者●個人情報を含むプロンプトを入力することで他の情報と結びつき、出力されるリスクに注意すること
●個人情報を含むプロンプトを入力することで、応答結果に不正確な内容の個人情報が出力されるリスクに注意すること

出典:個人情報保護委員会ウェブサイト お知らせ 生成AIサービスの利用に関する注意喚起等について

 このように、個人情報保護委員会においても具体的に個人情報に関わるリスクを示しているため、 ChatGPT を利用する際には常に、個人情報の扱いに関して、適切であるかまた入力に必要があるかを確認していくことが重要であると言えます。

個人情報や機密情報 の 保護対策

 それでは、個人情報や機密情報 の 保護対策としてはどのようなことが考えられるでしょうか。注意を払って、個人情報や機密情報を扱うあるいは入力しないようにすることが考えられますが、人為的なミスの可能性も考えられます。
 そこで、個人情報や機密情報が万が一入力された場合に、入力を検知したり、あるいは、マスキング処理を行うということが保護対策としては有効です。入力検知やマスキングについては次のような仕組みが考えられます。

仕組み詳細説明
入力検知個人情報や機密情報が入力された場合に、 入力した担当者に通知してお知らせする。
あるいは上位者(承認者)に通知する。
またワークフローを発動させ、上位者(承認者)に承認させることも考えられる。
マスキング個人情報や機密情報が入力された場合、決められた法則にしたがって、マスキングを行う。

ZiDOKA AI で個人情報や機密情報保護

 ChatGPT を業務で活用するためのサービス、ZiDOKA AI では個人情報や機密情報保護として、前述の入力検知・マスキングを行うことができます。

 通知機能や承認機能による入力検知が可能です。また、マスキングが可能です。

画像クリックで拡大表示

以下のリストが、保護が可能な個人情報です。

  数字(番号)・カード番号
・7桁の番号(口座番号等)
・8桁の番号(健康保険番号等)
・12桁の番号(運転免許番号、マイナンバー、等)
・13桁の番号(法人番号、等)
・電話番号
  文字列・個人名
・会社名
・住所
・メールアドレス
・URL

 また機密情報も保護が可能です。ユーザが特定のワードを禁止ワードとして設定することができる禁止ワード保護機能によって実現ができます。

 ChatGPT をはじめとした生成AIを利用する場合は、個人情報や機密情報 に関しては、取り扱いに十分注意すべき情報ということがおわかりいただけましたでしょうか?十分な注意はもちろんですが、企業や組織として、 ChatGPT や生成AI を活用する場合は、ZiDOKA AI ( ChatGPT 活用 )のように個人情報や機密情報の保護機能がある仕組みを活用されてはいかがでしょうか。

 ZiDOKA AI ( ChatGPT 活用 ) で生成AIを活用した業務革新をはじめませんか。
 お気軽にお問い合わせください。

Azure OpenAI Service の利用に
ZiDOKA AI のような個人情報・機密情報の仕組みを
組み込みたいという場合もお気軽にご相談ください。