生成aIツールは何か?と聞かれた場合に、多くの方がChatGPT、Geminiなどと答えると思います。一方で、Microsoft Copilotも生成AIを活用したサービスですし、CRMツールの付属機能として生成AIを活用し始めている方もいるでしょう。さらに、自社で生成AIに限らずAIを用いた開発に取り組んできた企業もあると思います。
多くのアプローチやツールが存在しますが、それぞれがどのような特徴を持っているか、どのような考え方で選択するのか、についての理解、説明ができる方は少ないのでしょう。生成AIについて要素分解、理解した上で、企業における活用アプローチについて概観していきたいと思います。
【無料配布中】「企業版AIの導入アプローチ」
ChatGPT、Copilot、ExabaseといったAI関連ツールが多くサービス提供される中で、企業におけるAI導入アプローチを俯瞰的に整理しています。どのようなタイプのツールがあり、結局何を使ったら良いのか、シンプルかつ感覚的に、かつ短時間で理解されたい方におすすめです。
生成AIとは
生成AIについて俯瞰的に理解するためには、これまでのデジタル化と比較した生成AIの新規性について触れる必要があります。結果として、生成AIはどのような特徴を持っているかを理解することができ、業務への活用アイデアにつながると思っています。
生成AIの新規性
18世紀の蒸気機関をきっかけとした第1次産業革命、20世紀の工業化による第2次産業革命を経て、20世紀後半にデジタル化による第3次産業革命が起きました。そして、現在のAIの革新はIoT、ビッグデータの発展などと並べられ、第4次産業革命に位置付けられています。
第3次産業革命ではコンピュータ、インターネットが普及しました。これによりデジタル化と自動化が進みました。企業で言えば、多くの情報がデジタル上に置換され、業務プロセス自体もデジタル上が主役となっていきました。ビジネスマンの読み書き算盤であるWord、Excel、PowerPointといったOffice商品を代表として、アプリケーション商品が一般的に使われるようになりました。自動化で言えば、多くの情報がデジタル上に乗ったことで、個別のアクションをグループ化して自動実行させる動きが活発になりました。エクセルの自動化言語VBA、自動化ツールRPA(Robotic Process Automation)などが一般的になりました。ただしこの時の自動化の多くはルールベースのタスクを対象としていました。ツールを活用する前に厳密に人間がルールを規定し、そのルールをシステム上で設定するような流れです。
第4次産業革命のAI分野で言えば、足元は知能化、やがては自律化が大きなトレンドと言えます。足元の知能化を支えているのが生成AIです。生成AIはこれまでの自動化がルールベースのタスクを中心としたトレンドであったのに対し、ルールの定まっていないタスクも対象としてます。例えば、「新しい企画を考えて」という抽象的な依頼にもある程度の回答を返してくれます。これはAIの技術革新が起き、より人間の情報処理メカニズムの模倣に成功した証であると言えます。現状はタスクを依頼するにしても、人間の依頼を起点としたものですが、いずれはAI自身を起点としたタスク実行、より抽象的なお題への対応、という意味で自律化の段階を迎えることが見据えられています。
生成AIの特徴
生成AIの技術的背景については、Technology関連の記事を参照いただくとして、ここでは生成AIの特徴をご紹介します。
まずフレキシビリティですが、生成AIは入力、出力が自由であり、非ルールベースのタスクにも対応しています。これは頭脳である言語モデルが、膨大な言語パターンを学習しており、ユーザーの多くのやり取りに対してすでに経験を所有しているためです。結果として、より抽象的で、複雑なタスクを担うことができます。
続いて、生成AIの真価は他の機能やツールを組み合わせることにありますが、それに関連してオリジナリティが挙げられます。生成AIと個人や社内のオリジナル情報を組み合わせることで、カスタマイズされた生成AIを構築することができます。初期的な生成AIは世の中に広く公開されているウェブサイトや論文の情報をもとに学習されているため、カスタマイズにより、応答精度の高い生成AIとなると言えます。
モダリティは同じく生成AIの合わせ技による特徴ですが、こちらはテキスト、画像、音声、動画といった異なる形式の情報を合わせることを指しています。テキスト、画像、音声、動画の生成単体をとってもこれまでの技術ではできなかったことですが、議事録の文字起こしのように音声からテキストへの変換など複合的な使い方はより革新的であると言えます。
最後にユーザビリティです。生成AIの最も革新的な特徴と言えるでしょう。人間が通常の会話で利用する自然言語を用いて対話できるということです。そもそも世の中には多くの言語が存在します。自然言語としては当然ながら、日本語、英語、フランス語、中国語など。言語間を跨いだコミュニケーションにハードルが存在することは多くの方の認識の違わぬところでしょう。自然言語を介して対話できることは、ユーザーのとっつきやすさに大きな影響力を持っていると思います。
生成AIの構成要素
ここで生成AIについて整理します。ChatGPTがサービスなのか、言語モデルなのか、RAGがどういった位置付けなのかわからないという方は頭の整理になるのではないかと思います。生成AIは大きく言語モデル、拡張性、統合性の3要素に切り分けることができると思います。ちなみに、ここでは生成AIの効果を最大化する構成要素という意味合いで要素分解します。どのようなアプローチで導入するかという点については次の章で触れます。
言語モデル
言語モデルの技術的な定義としては「文章の生成確率(以降に続く文章)をモデル化したもの」です。生成品質を向上させるために大規模な学習データと大規模な計算資源を用いて学習されるモデルのことを大規模言語モデル(LLM:Large Language Model)と呼び、言語モデルと言った場合、一般にはLLMのことを指します。ちなみに、GPT-3というモデルの学習データ量は約5,000億トークン(書籍500万冊分)に相当し、計算資源はGPU1,200基を30日分使用しています(GPU1,200基は500万円/基×1,200基=60億円)。
汎用的な知識を保有したモデルのことを指し(事前学習済みモデル)、ファインチューニングなどの事後学習済みモデルとは異なります。また生成AIといえば、OpenAI社のChatGPTですが、ChatGPTはアプリケーション名であり言語モデルを指しているわけではないです。OpenAIはGPTという言語モデルを開発しており、GPT、GPT-2、GPT-3、GPT-4、GPT-4o、GPT-4o1といった順番でモデルをアップデートしています。
切り分け方としてはモダリティの観点、ソースの観点があります。モダリティは上述の通り、テキスト、画像、音声、動画などを指します。テキスト生成で言えばOpenAIのGPT、AnthropicのClaudeなどがありますし、画像で言えば、OpenAIのDALL-E、Stable DiffusionのDiffusionモデルなどがあります。
ソースの観点ではクローズドソースとオープンソースがあります。クローズドソースはモデルのソースコードが公開されていないものであり、オープンソースは逆に公開されているものを指します。OpenAI(GPT)やGoogle(Gemini)の開発するモデルはクローズドソースです。一方で、Metaの開発するLlamaはオープンソースであり、誰でも追加学習などのモデル調整が可能となっています。
拡張性
拡張性とはLLMの機能を起点としつつ、異なる機能を組み合わせることで、LLMの能力を拡張させることをさし、Augmented LLMと呼ばれたりします。方向性としてはRetrieval Augmented LLMとTool-Agumented LLMがあります。
Retrieval Augmented LLMはRAG(検索拡張生成:Retrieval Augmented Generation)という呼び方で広まっていると思います。LLMに事後的に渡したオリジナルデータの情報を検索・取得し、その情報も踏まえて精度の高い回答を生成する仕組みです。ChatGPTを含む多くの生成AIサービスに内蔵されており、ファイルを添付できるタイプの生成AIサービスはRAG機能があると捉えることができます。精度を向上させるためには、情報のインデックス性、検索性にも配慮が必要です。
Tool-Agumented LLMはLLMと異なるツールをAPI経由で接続することで、機能を拡張させる方向性です。ChatGPTで利用できる検索機能やコードインタープリター(コードをChatGPT上で実行できる機能)も、前者はウェブ検索+LLM、後者はコード実行環境+LLMという意味でTool-Agumented LLMの一種です。また、MicrosoftのCopilotの提供するOffice系のサービスへの連携も同様です。接続するツール次第で様々なことに機能を拡張できることが、Tool-Agumented LLMの魅力です。
統合性
統合性は生成AIの落とし込み方に関する概念で、統合の形式とスコープそれぞれ観点で分類できると思っています。
統合の種類ではチャットボットとワークフローがあります。チャットボットは双方向のやり取りをする自動化形式であり、ワークフローは単一方向で直線的な自動化手法です。使い分けは業務によりけりですが、ワークフローについては生成AIを使わないタスクも含むプロセスについて広く自動化できる用途に強みがあります。
統合のスコープについては生成AIに関連する業務だけを対象にするのか、周辺業務まで含めてオールインワンで管理するのかということです。例えば、生産管理を担う部門が生成AIの使える部分を個別に自動化するのか、すでに使用している生産管理システムの中で自動化できるようにしたいか、ということになります。この組み方次第で、生成AIのユーザビリティに差が出る可能性があります。
生成AIの活用アプローチ
ここまでは生成AIの特性や構成要素について触れてきましたが、本章では企業での具体的な活用アプローチを紹介していきます。大きく汎用ツール、オフィスツールのAI機能活用、特化型SaaS、開発があります。詳細は後述しますが、汎用ツールはChatGPTなどの用途を限定しない対話型のサービス、オフィスツールのAI機能活用はCopilotなど、日常利用するツールに付与されるAI機能を使うこと、特化型SaaSは用途・部門特化型のSaaSプロダクトを使うこと、開発は自社・自部門にあったアプリケーションを構築することを指しています。
汎用ツールの活用
まずは汎用ツールの活用です。自然言語での対話と、オリジナル情報を取得するRAG(Retrieval-augmented generation:検索拡張生成)、ウェブ検索、データ分析機能が付与されている最小限のツールです。用途を限定しないプレーンな機能が用意されているので、機能の使い分け、プロンプトの工夫、オリジナルデータの準備により様々なことができる一方で、それぞれの使いこなしが大事になってくるので、活かすも殺すもユーザーの実力次第ということになります。汎用ツールには言語モデル提供型、言語モデル活用型の2種類のサービス分類があります。
ChatGPTやGeminiといった言葉はよく耳にすると思いますが、これらはサービス名です。言語モデルというのは単語や文章の出現確率を予測するシステムのことを指しており、生成AIサービスの頭脳のことを指しています。言語モデル提供型のサービスというのは、言語モデルをもつ組織が提供するツールのことを指します。
具体的には、OpenaIのChatGPTやGoogleのGemini、AnthropicのClaudeなどがあります。OpenAIはGPTという言語モデルを開発しており、GPT、GPT-2、GPT-3、GPT-4、GPT-4o、GPT-4o1といった順番でモデルをアップデートしています。つまりOpenAIはGPTという言語モデルを開発しつつ(頭脳)、ChatGPTというツール自体も開発していることになります(アプリケーション)。
言語モデル活用型は言語モデル提供型の逆で、言語モデルを自社開発していない企業によるツールのことを指します。言語モデルはOpenAIのGPT、GoogleのGemini、AnthropicのClaudeといったクローズドソース(コードが公開されていない)、MetaのLlama、Mistral AIのMistralといったオープンソース(コードが公開されている)から選択し、サービス提供者ではユーザーが触るインターフェースを開発して提供します(アプリケーション)。
国内では、エクサウィザーズのExabase、Giveryの法人GAIなどが有名です。これらのサービス提供者は言語モデル自体を開発するのではなく、使い勝手の良いインターフェースと、大企業でも安心なセキュリティ環境を用意したサービスを開発して提供しています。
オフィスツールのAI機能活用
次にオフィスツールのAI機能活用です。企業では、Microsoft365(Word、Excel、PowerPointなど)、Google Workspace(ドキュメント、スプレッドシート、スライドなど)を利用しているケースが多くあると思います。企業規模にもよりますが、複数の調査結果を参照すると、4〜6割程度の企業がこれらのツールを活用しているようです。オフィスツールへのAI搭載も進んでおり、MicrosoftではMicrosoft Copilot、GoogleではGemini for Google Workspaceを提供しています。
オフィスツールの普及率が物語るように、文書作成、表計算、資料作成は企業活動の多くの局面に存在しています。AI機能が付与されたオフィスツールを活用することでこれらの作業を効率化することができます。一方で、AIのツール連携は技術的難易度も高く、オフィスツールでのAI機能の品質はまだまだ現実の業務で求められる水準に達していない感触を持っています。
特化型SaaS
世の中には、CRM(顧客関係管理)、生産管理システムなど業界や業務に特化したSaaSがすでに存在しており、一機能としてAIが付与される動きも当然ながら顕著になってきています。例えば、CRMのAI機能では、顧客情報を検索したり、送付用のメールを書いたり、議事録を文字起こし・整理することができます。
SaaS自体が特定の業務に対して、一連の流れをサポートするように構築されていることが基本であるため、特定の業務に特化したアウトプットを生成しやすくできたり、既存の業務の流れを大きく変えることなく自然に取り入れることが特化型SaaS活用のメリットとなります。一方で、全ての業務に個別に特化型SaaSを活用しようとすると、SaaSツールで溢れかえり、ツールの使い分けも大変になります。
特化型SaaSでは、普遍性の小さくなる方向に用途特化型、業務特化型、業界特化型という分類ができます。用途特化型は、議事録作成、電話応対など、社内の大部分に需要はあるものの用途が限定されているものを指します。議事録作成であれば、tl;dvやaileadなど、電話対応では、アイブリーやfondeskなどのサービスがあります。業務特化型は、いわゆるホリゾンタルSaaSのことを指します(業界を跨いで企業が普遍的に保有する機能)。CRMツール(顧客管理)のHubpot、Salesforceや契約書作成ツールのLegalForce、GVAなどがあります。業界特化型は、いわゆるバーティカルSaaSのことを指します(業界特有の機能)。医療業界のユビーAI問診やMusubi、教育業界のatama+、Comiruなどがあります。
開発
ここまでが工業化された既製品を活用するアプローチでしたが、当然ながら自社・自業務の事情にマッチした仕組みを開発するアプローチもあります。開発と聞くとエンジニア以外の方にとって縁遠い印象を受けるかもしれませんが、生成AIを用いることでコードを生成することができたり、ノーコードツールの開発が進んでいたりと、エンジニアと非エンジニアの近接化は、近年のトレンドの一つではないかと思っており、多くの方にカスタマイズされた仕組みを開発する機会があるとも思っています。
開発にはSaaS、PaaS、IaaSを用いた分類があります。IaaSはサーバーなどの物理環境、PaaSはIaaSに加えOSなどの仮想環境、SaaSはPaaSに加えアプリケーションも含めたトータルサービスを指します。どの選択肢を取るかによって、サービス利用者サイド(企業)が担う責任の範囲も変わってくるため、この分類での判断は重要です。IaaSの場合はOSやアプリなどを自由度を持って構築できるので最もやりたいことができる手法となります。PaaSの場合は、OS環境は整っているので比較的リーズナブルにアプリ環境を構築することができます。SaaSの場合はアプリケーション全体がパッケージ化されているので環境自体を気にすることなくツール開発に集中することができます。IaaSやPaaSはAWSやMicrosoft Azureがありますし、SaaSでは近年Difyというツールも利用しやすいオプションになっています。
ちなみに、ノーコード開発、コード開発というコードの有無による分類もありますが、SaaSやPaaSではノーコードといった選択肢がある一方で、IaaSではコードに関する知識が必要になります。
生成AIツールの当てはめ方
生成AIツールの活用アプローチについての理解ができたところで、あとは業務に対してどのように当てはめていくかについて考えます。
企業が担う業務の全体像を抽象化して定義してみます。一軸目は業務の普遍性で、日程調整、議事録作成などの全社で共通の業務なのか、マーケや法務のように部門に特化した業務なのかという方向性があります。二軸目は業務の複雑性です。情報検索、誤字脱字確認などの単純なものと、資料作成、生産計画作成など、複数の工程から構成されており、外部との連携が必要な複雑なもの、という方向性で整理することができます。
先ほどの活用アプローチを引き継ぐと、単純かつ普遍的で業務は汎用チャット(ChatGPT、Exabaseなど)、単純だが部門固有寄りの業務はオフィスツール付属のAI機能(Copilot、Gemini)、固有度合いの高い業務は用途特化型SaaS(議事録、問い合わせ)、または部門特化型SaaS(SEO記事、契約書)、複雑性の高い業務は開発という棲み分けがシンプルな棲み分けになると思います。
もっとも、この棲み分けはあまりDX推進を自社起点でやりきれていない多くの日本企業をイメージしたものですので、よりオープンソースなものを使いこなしている野心的なテックドリブン企業ではより開発の領域を広げたり、多くのSaaSツールを取り入れていくなど、企業としてのデジタルテクノロジーに対する取り組み姿勢を反映した形となることが自然だと思います。
最後に
世の中の流れ、第3次産業革命時に日本企業の失敗などの教訓から、生成AIツールだけ早期に導入したものの、利用率が上がらずに悩んでいる企業も多くあることと思います。そうした場合は、一度視野を広げ、企業の求める最適な生成AI活用のアプローチについて考えてみることで、本当に効果のある活用イメージが具体化されていくと思いますので、本稿を参考にしていただけると嬉しいです。
一方で、最も大事なこととしては、個人個人が新しい取り組みや変わることに対する心理的ハードルを乗り越えることだと思います。俯瞰的な戦略も必要ですが、日々の泥臭い試行錯誤を通して、気持ちの取っ掛かりを徐々に外していくことで、徐々に生成AIが日常のものとなっていくと考えています。