一般常識の範囲を超えられないChatGPT
ChatGPTをはじめとする生成AIの導入が進んでいます。企業においても活用事例が出てきており、文章生成、企画やアイデアのたたき台を出す、壁打ちの相手にするなどして広く使われているようです。実際に使用してみた多くの人がその利便性を実感していることでしょう。
一方で、限界も見えてきました。ChatGPTの知識は幅広く、回答精度も向上していますが、あくまで一般常識の範囲にとどまります。ChatGPTは利用者全員に対して、同じデータを基にして回答します。そのため特定分野に詳しくなかったり、一般に公開されていない情報を出したりすることができません。取引先への謝罪文を考えるなど「広く浅く」の用途では役に立ちますが、特定の業種・業界・職種に特化した「狭く深い」使い方をしたいときには今ひとつ役に立っていないのです。
ベテラン社員の知恵袋を再現
こうした課題を解決できるのが「ファインチューニング(追加学習)」です。ファインチューニングとは、ChatGPTが既に学習したデータに対して、新たなデータを追加で学習させることです。ChatGPTが保有するデータはインターネット上の情報が中心なので、企業ごとの業務や製品については学習していません。そこでChatGPTに、自社が保有する個別のデータを新たに学習させて、質問に答えられるようにするのです。
ここで自社製品やサービス、特定業務の作業マニュアル、専門知識などを追加で学習させれば、会社内の様々な情報を把握した頼りになるベテラン社員の知恵袋を再現できます。業務で活用できる場面としては、コールセンターなどの問い合わせ対応、業務の中で状況によって指示を出す、過去のデータを比較分析しながらアドバイスするなどがあるでしょう。
従来は社内手続きや自社製品の相談する場合、チャットボットを利用し ていました。チャットボットは特定の分野について質問すると、AIが自動で答えてくれる製品です。しかし、チャットボットが用途や目的ごとに乱立して管理が煩雑になるなどの課題もありました。そこで幅広いデータを学習しながら回答できる、ChatGPTによる業務効率化が期待されます。
しかし、ファインチューニングで新たなデータを学習させて適切な回答を導き出すのは難しく、回答の精度が低くなるという問題もあります。そのため精度が低くなりそうな場合は、回答を拒否するなどの回避策を導入しておく必要があります。
学習させるデータを集める手間もかかりますし、データは学習できる状態に加工しなければなりません。仮にベテラン社員しか知らない古い業務の情報が紙のマニュアルしか存在しなければ、ChatGPTに学習させるためには書類をスキャナで取り込んで文字起こしをするなどの作業が必要です。このように様々な条件と、継続的な試行錯誤は必要ですが、ファインチューニングは期待の大きい手法と言えるでしょう。
学習させるデータの集め方
ファインチューニングは、学習させるデータを集める段取りが最も大きなステップになります。
自社が保有するデータならすぐに準備できますが、取り扱う部署に了承を取り付けるなど調整が必要です。インターネット上からデータを集めるには、専用ツールの利用やプログラムの開発が必要でしょう。そのため、これらのデータを活用するときにも準備期間は考慮しておかなくてはなりません。
官公庁などが公開する「オープンデータ」と呼ばれるデータは、整備済みの状態で提供されており商用利用も可能です。あるいは購買データなどを有償で販売するサービスもあり、必要に応じてどんなデータを準備するかは知見が問われます。
他にもChatGPTが学習できるデータの種類として、文章や画像があります。もっとも、集めたデータもそのままではなく、ChatGPTが学習しやすい形式に修正したり、余分なデータを排除したりするなどの準備が必要となります。広い意味では紙書類も学習用データになりますが、前述のようにスキャナで読み込むなど手間がかかります。さらに属人化されたノウハウや知見という形のないデータは、1から調べてまとめる必要があり、相応の準備が必要でしょう。
生成AIを使ってドラッグストアの売上を上げる方法
このように、学習の手間がかかるファインチューニングですが、ノウハウを蓄積すれば継続して更新できるでしょう。そして、ファインチューニングされた生成AIを使えば、現場の作業効率が上がるだけでなく、売上そのものを大きく上げることもできるかもしれないのです。
例をあげてみましょう。
スーパーやドラッグストアでは、店舗やアプリを通して売れた商品や顧客属性(地域・性別・年齢など)を基にして、個別に最適化された広告を表示する仕組みを展開しています。従来のテレビCMや折込チラシでは不可能だった、きめ細かい提案ができるようになりました。以前に購入した商品を分析して、次回購入する商品の割引券を配布したり、スマホアプリに表示する広告を変更したりするなどの事例もあります。こうして個別の顧客ごとに購入に繋がりやすい商品を提案して、店舗への来店や通販サイトでの購入につなげています。
このような仕組みがあるのであれば、生成AIと大量のデータを組み合わせることで、より効果の高い広告出稿案を考えたり、商品の売上予測ができるようになるでしょう。あるいは、一緒に購入されやすい商品の組み合わせを発見したり、購入した理由を分析したりしてくれます。社外のデータを組み合わせれば、商圏の人口や住民の属性に応じて調整を加えたり、SNSなどの話題を考慮して臨機応変に提案するなど、幅広い活躍が期待できます。ネット広告において画像やキャッチコピーなどの素材を作る作業も、生成AIなら外注に委託せずに自社の社員でも製作しやすくなります。従来はこうした作業に経験や知識が必要なので、実行できる人材は限られていました。そこで生成AIとデータを組み合わせれば、熟達した人材の能力を再現して場所や時間を問わず活用できるので、人材不足や育成にかかる時間を解消できるでしょう。
このように社内外に広く存在するデータを集めて生成AIと組み合わせることで、活用の幅は大いに広がることが期待されています。