より軽量なディープリサーチがChatGPTで利用枠が解放

ChatGPTやCopilotなどの対話LLMを使ってソフトウェア開発の効率は、劇的に良くなってきています。
TanaKafeWorksの開発においても、日々利用しています。
ただ、LLMが返す回答には、ハルシネーションが含まれている可能性を認識をしておかなければなりません。
さらに、LLMに与えるプロンプト(質問)も、より良い結果に対して与える影響が大きいので、使う人によっては、「LLMは使えるよね」という人もいれば、「ハルシネーションが多くて、ちょっとね?」という人もいます。
確かに、私もそう思いますし、開発で使っていると、出力したコードが使えない場合もあるので、使い手のレベル次第という気がします。

ChatGPT Deep Reserchが、ChatGPT Plusユーザでも利用可能へ

ChatGPT Deep Reserchは、2025/2/3にOpenAIがChatGPT向けの新機能としてリリースした機能です。
これは、オンライン検索や解析機能を自動で行うエージェントとして機能します。
それまでは、ChatGPTに対話しながら行っていた事を、ChatGPT o3モデルを基盤として、Web検索による情報収集/ファイル解析ならびに要約/高度データ解析を自動で行うものです。

ただ、この機能は、当初ChatGPT Plusでは利用できず、月額$200のChatGPT Pro契約が必要で、普段使いでも、それほどお金を払えない人にはハードルが高い機能でした。

リンク:Qiita:ChatGPT 新機能「Deep Research」徹底解説&使用レビュー

2025/4/25 軽量版の新しい「Deep Research」ツールを、ChatGPT FreeユーザならびにChatGPT Plusユーザで利用が解放されました。

リンク:Qiita:ChatGPT「より軽量なDeep Research」って何?

早速使ってみました!

最近、GStremerを使ってRTSPサーバを構築している中で、少し改善したい課題があり、数か月取組んでいますが、なかなか改善ができず、行き詰っていました。
もちろん、毎度のごとく、ChatGPTなどを含め、NET情報を調べてはいますが、GStreamer内部の動きを完全に理解できているわけでもないので、ハードルの高い取組でした。

「ネットで調べて、コードを修正し、実行したログを見て、また調べる」という流れを何度も繰り返します。
もちろん、調べるという時には、ChatGPTやCopilotなどの助けを借りて、コードも生成しています。
しかし、内部の動きまでも含めての知識が十分でなく、LLMへ与えるプロンプトの書き方が、適切な指示になっていないということも、上手くいかない原因の人なのでしょう。

GStreamerの動きも考慮した対処を求めるには、1つのプロンプトや、それらの結果を統合して整理し、コードに結び付けるには、不十分だということだと思っていました。

そんな折、ChatGPTで、「軽量版の新しい「Deep Research」ツール」がリリースされたので、この機能を使い、原因と対策を求めました。

Step1:最初に質問を投げかけます

現在のソースコード、実行時のログ、実行を制御する設定値のファイルを添付し、現状を説明し、原因と対策などを求める文章で締めくくります。

Step1へのChatGPTからの質問:

こんな風に、ChatGPT Deep Reserchを行うために、確認の問いかけを行ってきます。
いつも、こんな感じで、質問に対する理解を提示し、不足する条件などを問いかけてくれます。

Step2:ChatGPTからの質問へ回答します

ChatGPTからの質問への回答を具体的に入力します。

Step2へのChatGPTからの応答(1):

このように、Deep Reserchを始める前に、ChatGPTの理解を簡単に説明し、情報収集を始め、解析、要約などの行っているような状況がしばらく続きます。
この時は、数分でしたが、長い場合、数十分の場合もあったように思います。

Step2へのChatGPTからの応答(2):

このように、39件の情報源から、11分程度で回答を作成してくれます。

ついでに、ソースコードの作成も指示すると、部分的なコードも作成してくれたり、完全なコードを依頼すると、ほぼ完全なコードも作成してくれます。
しかし、本当に完全かどうか、生成されたコードの確認は行う方がよいです。

今までにない回答

そのコードを使い、さらに実験を行う事になりますが、どうも期待したように動作はしません。
何度も、コードとログを渡しながら、新しい改善コードを生成し、試してみるのですが、堂々巡りの様子になってきました。
ここまでは、今までのChatGPTでもある程度同じ流れだったように思います。

今度は、次のようなプロンプトをにゅうりょくしてみました。

ポイントは、「gst_rtsp_media_factory_set_launch()を使用すると、映像配信できることから、gst_rtsp_media_factory_set_launch()の仕組みと何が違うかを実装視点で解説してください。」の一文です。

これは、ある意味、GStreamerのAPIが内部的にどうなっているのか?
それを踏まえて、仕組みの解説を求めてみました。

と、ChatGPTからの質問がありました。

これで、ChatGPTは理解してくれたようで、Deep Reserchを開始しました。

しばらくすると、回答を生成してくれました。

この回答で、課題が解決したというわけではないですが、このように広範囲な情報を含めての解説で、多くの事の理解が進みました。

この後も、さらにAPIの内部動作とも関係して、解析が進むことになりますが、それは、Deep Reserchの話ではなくなるので、実例としては、ここまでで、とどめます。

おわりに

Deep Reserch機能は、アプリケーション開発する側からすると、APIの内部動作を理解するために、広範囲の情報を整理して、課題への対処方法に役立つ可能性を示しています。

以前のChatGPTでも、プロンプトの与え方、情報の与え方、検索との組み合わせでできたことなのでしょう。
しかし、それを、簡単なプロンプトから内部的に行ってくれる点で、直面している課題に専念できるという事で、非常に有益な機能だと感じています。

ChatGPT Freeアカウントでも使えるので、上限回数を気にしながら、使ってみてはいかがでしょう。