ChatGPT に URL指定で WEBページを認識させ 読み込ませる – ZiDOKA AI
ChatGPT を利用していますか? 生成AI にWeb記事作成や要約機能として業務で重要な役割を果たすポテンシャルがあることは、ご利用の皆様の実感するところではないでしょうか。半面、最新情報は学習していなかったり、機械学習モデルとしての制限で質問によっては回答してくれないことがあります。
今回は、 ChatGPT にWEBページを認識させるために、URLを指定した質問をするとどうなるかや、URL指定でWEBページの内容を 認識させ 読み込ませる方法について解説をします。なお、本記事でChatGPTへの質問と回答について説明している箇所については、Azure OpenAI Service を利用し、GPT-3.5で質問しております。
ChatGPT へ URLを指定した質問をするとどうなるか?
ChatGPT に URLを指定した質問をしたことはありますか?質問をしたことがない方も多いですよね。そこで、URLを指定した質問をしてみました。
※URL部分は画像を張っておりますが、コチラのページへのリンクです
【質問】
以下のURLのbody部の内容を全てピックアップしてください。
【回答】
申し訳ありませんが、私はURLの内容を直接アクセスして情報を抽出することはできません。URLにアクセスし、そのページのbody部の内容を確認してください。
ChatGPT が URLの内容に応えてくれない理由
どうやら ChatGPT はURLの内容に直接アクセスすることはできないようです。これはどういった理由によるものなのでしょうか。 ChatGPT に直接聞いてみました。
【質問】
ChatGPTはURLを指定した場合に、URLが指し示すページの内容を見ることができないと思います。
これはどういった理由によるものか教えてください。また、セキュリティポリシー上の理由があればこの点も教えてください。
【回答】
ChatGPTは、URLを指定した場合にそのページの内容を見ることができません。これは、以下の理由によるものです。
1. プライバシーとセキュリティの保護:URLが指し示すページの内容を見ることは、ユーザーのプライバシーやセキュリティに関わる可能性があります。URLには個人情報や機密情報が含まれる場合があり、それを機械学習モデルが閲覧することは望ましくありません。
2. 著作権と知的財産権の尊重:URLが指し示すページの内容には、著作権や知的財産権が含まれる場合があります。これらの権利を尊重し、適切なライセンスや権限がない限り、機械学習モデルがページの内容を閲覧することは避けられます。
URLに含まれる可能性がある個人情報や機密情報、著作権や知的財産について、機械学習モデルが閲覧するのは望ましくないため、意図してそれらを行っていないということが分かります。
URL指定でWEBページの内容を認識させ読み込ませる方法
ChatGPT が知らないと言っても、URL指定でWEBページの内容に関して質問ができると便利ですよね。 ここでは解決方法を説明します。なお、URLの内容を読込む際は、ChatGPT も回答している通り、個人情報や機密情報、著作権や知的財産について注意したり、ウェブサイトの利用規約、法的制約も確認し問題がないとご自身で判断した上で行なってくださいね。
1.URL先のWEBページの内容をコピーして貼り付けて質問する
まず、URLにアクセスし、読み込みたいWEBページの内容をコピーします。次に、 ChatGPT に認識させたい内容をプロンプトにペーストします。ペーストした内容に関して ChatGPT に質問をしたり、議論をします。
実際にやってみました。
【質問】
次の文章は、あるサービスを紹介しているものです。
”ChatGPT は、 OpenAI社 が開発した自然言語処理モデルで、ユーザーとの対話を通じてコミュニケーションを行い、質問に答えたり、情報を提供します。様々なトピックに関する知識を持っており、ユーザー質問の文法や文脈を理解し、適切な返答を生成することができます。
ChatGPT を 業務利用することで、人手不足を解消したり、 業務効率化・DX推進を実現できるとしたら、どんなに素晴らしいことでしょうか。 Teams を介して ChatGPT の組織活用がすぐに開始できる、 ZiDOKA AI を利用して業務革新を進めましょう。 ZiDOKA AI は、Azure OpenAI Service のユーザインタフェースとしての利用も可能です。(中略)”
文章を次の形にまとめてください。
・サービス名
・機能を箇条書き
・料金
・お問い合わせ方法
【回答】
1:ZiDOKA AI(ChatGPT対応)
2:
・ChatGPTへの質問
・ChatGPTへの質問を学習させない
・機密情報保護・禁止ワード保護機能
・ワークフロー・承認機能
・議事録生成機能
・URLを指定してウェブページ解析機能
・ノウハウ蓄積昨日
・プロンプト補助機能
・お問合せ対応機能
・続けて質問
・2要素認証機能
・サービス連携
・その他機能(プロンプト初心者向け補助機能、社内問い合わせ対応機能)
3:1企業契約あたり、月額12,000円からのご利用が可能。ごち用人数や利用方法により価格が異なりますのでお問い合わせください。
4:ウェブサイト上のお問合せフォームを利用するか、指定されたTeams経由でお問い合わせ可能。
このように、プロンプトと合わせて形式を変えたりすることができます。
この方法の特徴としては、
・コピー部分をどこからどこまでにするか
・長い記事だと文字数制限に引っかかってしまう
この二点が挙げられます。
2.APIを活用したりスクレイピングを行う
読み込み先でAPIを用意している場合は、APIを介して情報の収集を行うことが考えらえます。また、APIの提供がない場合は、スクレイピングを行うことも考えられます。Pythonでプログラムを作成することや、RPA でプログラムを作成せずにスクレイピングを行う方法もあります。
RPA でスクレイピングを行う方法は「Power Automate for Desktop 活用事例 – スクレイピング で WEBページ から データ抽出」で紹介しています。
スクレイピングでまとめたExcelデータを ChatGPT にペーストし、「表にしてください」などのスクリプトを入れると、疑似的に表形式のデータを扱うことができます。あとは、表の要約を指示することでスクレイピングデータを使うことができます。
APIも同様にPythonなどでデータを取った後に ChatGPT に入力、回答を得る形になります。
こちらの方法の特徴としては、
・要約のためにスクレイピング・コピーペースト等を挟む必要がある
・APIの情報取得方法の知識が必要になる
などが挙げられます。
3.ChatGPTのプラグインを利用する
ChatGPT Plusという、 ChatGPT の有料のプランをご利用されている場合は、ChatGPTのプラグインで、URL指定で内容を読み込むことができるものを利用して解決することが考えられます。
プラグインは、そのままの ChatGPT だとできないリアルタイムの情報を取得することができるものが主です。
特徴として、
・有料である
・安全性があるかどうかが保証されていない可能性がある
以上の点が挙げられます。
Google Chromeの拡張機能では無料のものもありますが、同様に安全性や情報の保護性は保証されていない可能性があります。
ZiDOKA AI で WEBページの URL を指定して読み込ませる
今までの事例を踏まえて、おすすめのサービスを紹介します。
ChatGPT を業務で活用するためのサービス、ZiDOKA AI では、WEBページの URL を指定してWEBページの内容を抽出し、ChatGPT へ質問することができます。またHTML解析モードによって、HTMLのまま読み込むことも可能です。
※ご契約される企業・団体様で、所有権や利用許可が確認できるドメインのURL解析が可能です。
この ZiDOKA AI であれば、安全性も保たれた状態で、スクレイピングなどの手間もかからずに記事の要約を行うことができます。
実際にURL解析を行ってみましょう。
タスクの部分にはプロンプトを記入します。オプションの「URLの解析を依頼する。」の項目にチェックを入れた状態で、投稿します。
ZiDOKA AI ではこのようにして、簡単にURLの解析を行うことができます。
【エンジニア募集中!】
あなたもネットワークやセキュリティ、クラウド
エンジニアとしてAIやシステムに関わりませんか!
ZiDOKA AI ( ChatGPT 活用 )
今回は、ChatGPT に URL指定で WEBページを認識させ 読み込ませる方法をご紹介しました。個人情報や機密情報、著作権や知的財産について注意したり、ウェブサイトの利用規約、法的制約も確認した上で、URL指定で WEBページの内容を抽出し、ChatGPTに処理してもらうことで、業務効率化を実現することができます。
また、ZiDOKA AI を利用することにより、本作業をより効率よく行うことができます。 ZiDOKA AI は ChatGPTを業務利用するためのサービスです。URL指定で WEBページを認識させ 読み込ませる だけでなく、 業務での ChatGPT 活用も可能です。組織で、 URL解析 あるいはChatGPT活用ツールをご検討中の場合はお気軽にお問い合わせください。