ChatGPTは世界を変えるか?

「ChatGPT」ってキーワードが、Netを駆け巡っています。
あなたは、ChatGPTをどう思いますか?
ChatGPTは、OpenAIが開発した、GPT-3というAI言語モデルをベースに、「オリジナルのテキストを生成できるAIツール」といったところです。
さてさて、このChatGPTが世界を変えていくことになるのでしょうか?
少しだけ考えてみましょう。

AIでオリジナルのテキストを生成するとは…

Netを含めた膨大なテキストを機械学習データとして学習した結果としての言語モデルが、GPT~GPT2~GPT3へと進化してきました。
その言語モデルを使い、オリジナルのテキストを、対話的に出力するサービスが、ChatGPTに結実したということです。

しかし、ChatGPTが生成するオリジナルテキストの内容が、正しいという保証はありません。
テキストは、人が書いたものと区別ができないくらいに自然な文章ですが、その内容は正しいかどうかわかりません。

さて、このような文章は、本当に使えるものでしょうか?

検索エンジンにChatGPTが使われるという流れ…

「今後、ChatGPTを検索エンジンに利用して、Google検索にとってかわる時代がやってくる」という話題がNetに流れたりしています。
Microsoftは、「BingにChatGPTを使う」とか表明しているみたいです。
本当に、検索エンジンになるのでしょうか?
そもそも、検索エンジンは、リアルなサイトへのIndexで、リアルなサイトの情報が正しいかどうかではなく、そのサイトに情報が掲載されているという事実だけが存在します。
一方、ChatGPTは、リアルな情報を学習した結果、言語モデルが問合せに、オリジナル・テキストを返すというもので、オリジナル・テキストは、真実の場合もあれば、妄想の場合もあるということです。
この違いは、現在の検索エンジンで表示されるリアルページが、嘘の内容を表示している可能性があるという点で、ChatGPTが妄想のオリジナル・テキストを返すことと、結果において情報そのものが信頼できる保証がないことに違いはないという点で、同質のものかもしれません。

人が真実だと思える根拠とは…

人が情報に接するとき、その情報を信じられるかどうかは、その情報の出典によるところが大きいと思います。
出典の信用力こそが重要で、検索エンジンでTopに表示されても、そのサイトが、怪しいサイトなら、多分信用しないでしょう。
情報が、公的機関や新聞社とか、ネームバリューのある組織の情報なら、多分信用するでしょう。
ChatGPTが生み出す、オリジナル・テキストに、「出典:ChatGPT」と記載されれば、信用することを躊躇するかもしれません。
しかし、ChatGPTが生み出した、オリジナル・テキストに、「出典:ChatGPT from XXXXX」とう形で、XXXXXにGPTがそういうテキストを生み出すために影響を与えた情報を、属性として提供できれば、その信用力は大幅に高まると思います。

言語モデルのオリジナル・テキストの氾濫がもたらす課題…

言語モデルが生み出すオリジナル・テキストは、人が書いた文章と区別ができなくなり、Netに情報が氾濫すると、何が起こるのでしょうか。
情報の出典が分からないまま、言語モデルにより生成された情報がネットに氾濫すると、その情報をさらに学習し、それが再帰的に繰返し、大量の信頼性のない情報であふれると、人類の未来を思わぬ方向へ変えてしまうかもしれません。
機械学習で学習する膨大な情報は、全て学習する時点より、過去に作成された情報です。
つまり、機械学習は、過去からしか学べないということです。
その過去の情報が、信用のない情報で、例えば、嘘の情報が増えると、その嘘は真実だと判断してしまう可能性を持っているということです。

その昔、タイムマシンの物語の多くは、過去に行って、過去を変えると未来が変わるといったストーリーがあります。
しかし、現在は、AIが生成する情報が、実は情報の過去を変えてしまうことと、同じことのように思います。

何が必要なのか…

ChatGPTが生まれて、さて、私たちは何を考えなければならないのでしょうか?
とても難しい課題だと思います。
私は、AIが生成した情報には、その出典を示す情報を義務付ける必要があると考えています。
その出典情報と合わせて、ブロックチェーン技術などを使い、非中央集権的で改竄を判断できる仕組みを作り上げることが重要だと思います。
おそらく、既にこのような問題への取組をされていることと思いますが、最近、気になったことを書き留めておきたいと思います。

2023/2/5 Reiji Tanaka