こんにちは。KIYONOエンジニアです。
最近よくAIエージェントという言葉をよく耳にしますよね。筆者もAIエージェント開発してほしいと、要望を受けることがありますが、AIエージェントってなに?と心の中でずっとモヤモヤしてました。何度もAIエージェントという言葉を聞いて、またそれをAIエージェントという言葉を使って議論していくことで少しずつAIエージェントに対する解像度が上がってきた気がします。
本日は、筆者と同じように「AIエージェントって何それ?」という方に向けて記事を書きます。
AIエージェントとは
ざっくり説明すると、「人が細かく指示をしなくても、自分でやることを考えて目標に向かってタスクをこなしていくAIの仕組み」と理解しております。
具体で言うと、以下はAIエージェントにあたるかと思います。
- ChatGPTやGeminiのようなチャットサービス
- スマートスピーカー
- 自動運転の制御
例を挙げればキリがないですが、上記のサービスに関しては、こちらが細かく指示しなくても、AIが解釈してくれて、適切な情報を返却してくれたり、音楽をかけてくれたり、運転してくれたり等を実行してくれます。
生成AIとの違い
生成AI(Generative AI)は、与えられた指示内容に沿ってコンテンツを生成するAIの技術です。文章、画像、動画、音声などの生成に特化しています。したがってイメージとしては、生成AIはAIエージェントに包含されており、生成AIの上位概念と思います。
生成AI、AIエージェントのスコープの違いについていかに例を示します。
- 生成AI
- メール文の作成
- AIエージェント
- メール文の作成→メールの送信
AIエージェントは、「目標に向かってタスクをこなしていくAIの仕組み」なので上記のように、メール送信の「アクション」までスコープにすることができます。
今後増えてきそうなAIエージェントの活用方法
ここからはあくまで筆者の主観に基づいた話になります。何かの根拠やエビデンスに基づいたものではないのであくまで参考としていただければと思います。
個人的に活用や開発が進む部分としては以下と考えます。
- 自社データベースとの接続
- アクションまで実行
自社データベースとの接続
昨今、「もっと自社にあるデータを活用して強みに変えることはできないか?」と考えている会社は多いのではないでしょうか。またデータを活用するのに一定の技術力が必要で工数もかかる、またはそもそも活用の方法がよくわからないというケースも多いのではないでしょうか。
このような課題を解決するポテンシャルがAIエージェントにはあると思いますし、今後そのような動きがますます強くなってくると思います。
例えば、お問合せの時点でインターネットに存在する外部情報から、お問合せ元の会社情報を(業界、従業員数、売上 など)を調査して、顧客データベースに登録したり、過去類似の会社からお問合せがあったか自動的に調査するといったことが可能になります。
その他にも営業関連の各種案件のステータスを見て、リマインドメールメールの提案、またメールするための文案を作ってくれるといった今まで人間がやるにもかなり工数がかかっていたアクションを一瞬で実行可能になる世界観がやってくるかと思います。
アクションまで実行
ChatGPTの台頭により、プロンプトを書いて、必要な情報を取得するといった検索性の部分とメール文等のコンテンツ作成の生成AI領域に関してはかなり普及してきたかと思います。一方、検索したものをわかりやすく資料にまとめてくれたり、メールの文章を作ってその上でメール送信までするといったアクションまで充実したサービスはまだ少ないと思います。
AIエージェントは大規模言語モデルをベースに
AIエージェントでアクションまで入れ込もうとすると「特定の状況」における「特定の目的」のため動作するエージェントが出来上がる可能性があり汎用的ではないかと思います。
また 「特定の状況」に特化した動作ルールを人間が組み込む必要も出てくるため、システム構築も大変ですし、やはり汎用性に欠けると思います。この部分をより汎用的に作るためにはやはりGPT-4のような大規模言語モデルは必須になってくるかと思います。
例えば、
「今日は暑いです」とユーザが入力した際に、冷たい飲み物やアイスクリームの商品と購入リンクを提案してくれるAIエージェントを作るとして、「暑い」というワードに反応して、冷たい飲み物やアイスクリームを提案するというアクションを発動させることになるかと思います。この場合、ユーザが「今日は灼熱です」みたいな表現をした際にアクションが反応しない状態になってしまうかと思います。また類義語をすべて登録するのはとても骨が折れる作業です。
この際に大規模言語モデルの出番かと思います。GPT-4等であれば類義語まで解釈して、アクション実行をするロジックを組むことができるかと思います。
したがって、AIエージェントでアクションをする際は何かしらの形で大規模言語モデルを入れ込み、汎用性を持たせるというのが必須になってくるかと思います。
最後に
本日の記事はいかがだったでしょうか。AIエージェントを勉強いただくきっかけになればと思います。また他の記事で実際にGoogle Cloud等を用いてどのように作っていくのかも紹介しておりますので興味のある方はご参考くださいませ。

また弊社は、マーケ文脈でのAIエージェント開発を得意としている会社になります。もし導入してみたいという方は気軽にご相談ください。
本日は以上です。
コメント