本記事では、生成AI(ジェネレーティブAI)を知らない方に向け生成AIの基礎的な知識を解説します。
こんな方におすすめ
- 生成AIを知りたい
- 生成AIをビジネスに活用したい
- 生成AIの全体像やざっくりとしたイメージを掴みたい
ネクストはこれまで、500社を超えるお客様に技術で支援してきました。お客様の課題として多いのが、生成AIを活用したいが社内にノウハウがない、活用事例を知りたい、という声です。
むやみに生成AIを導入する前に、まずは生成AIについての基礎を学習し、正しい知識を得ることが大切です。これからAWS導入をはじめたいと考えている方は、ぜひご一読ください。 →生成AI導入支援はこちら
生成AIとは?
生成AIとは、テキスト、画像、音声、データなど、さまざまなコンテンツを生成できるAI(人工知能)技術の一種です。2023年はChatGPTをはじめとする生成AIが飛躍的な進化を遂げた「生成AI元年」になりました。
生成AIの技術自体は新しいものではありません。生成AIはさかのぼること1960年代に現在のチャットボットのような形で登場しました。しかし画像や動画を生成できるように進化したのは、2014年に機械学習アルゴリズムの1つである Generative Adversarial Network
(GAN、敵対的生成ネットワーク)が登場してからのことです。
敵対的生成ネットワーク (てきたいてきせいせいネットワーク、英: Generative adversarial networks、略称: GANs)は、2014年にイアン・グッドフェローらによって発表された教師なし学習で使用される人工知能アルゴリズムの一種であり、ゼロサムゲームフレームワークで互いに競合する2つのニューラルネットワークのシステムによって実装される。
GANsは生成ネットワーク(generator)と識別ネットワーク(discriminator)の2つのネットワークから構成される。例として画像生成を目的とするなら生成側がイメージを出力し、識別側がその正否を判定する。生成側は識別側を欺こうと学習し、識別側はより正確に識別しようと学習する。このように2つのネットワークが相反した目的のもとに学習する様が敵対的と呼称される所以である。
https://ja.wikipedia.org/wiki/%E6%95%B5%E5%AF%BE%E7%9A%84%E7%94%9F%E6%88%90%E3%83%8D%E3%83%83%E3%83%88%E3%83%AF%E3%83%BC%E3%82%AF
生成AIをメインストリームへと押し上げた立役者は、Transformer
(以下、トランスフォーマー)という技術です。
トランスフォーマーとは?
トランスフォーマーはChatGPTやBard、Bingなどの対話型AIのベースとなった機械学習モデルです。トランスフォーマーモデルはそれまでのモデルと比較して並列能力が高く、大規模言語モデル(LLM、数十億から数兆のパラメーターを持つ言語モデル)を短時間で訓練することに成功しました。そのため、膨大なWebページが持つテキストに対して新しいモデルを学習させることができ、その結果、私たちが知る “より人間味のある回答” が得られるようになったのです。さらに、トランスフォーマーは Attention
と呼ばれる新しい概念を生みました。
Attentionとは?
Attentionとは、データの要素と要素の関連性を計算・評価・追跡するメカニズムです。大規模言語モデルが個々の文章だけでなく、ページや章にまたがる単語間のつながりを追跡することを可能にしたのです。たとえば私たち人間が本を読むとき、「それ」や「彼女」が指し示すものを文脈の中から見つけることができますが、それを可能にしたのがAttentionの仕組みを持つトランスフォーマーです。トランスフォーマーは単語だけではなく、プログラムコードやタンパク質、化学物質、DNAを分析することもできます。
大規模言語モデルの進歩は、生成AIが人間味のある魅力的な文章を書いたり、写実的な画像や動画を描いたりする新時代を切り開きました。さらに、マルチモーダルAI(テキストや音声、画像、動画、センサ情報など、2つ以上の異なるデータの種類から情報を収集し、それらを統合して処理する)の発展により、複数の種類のメディアにわたりコンテンツを生成できるようになりました。これは、テキストの説明から画像を自動的に作成したり、画像からテキストのキャプションを生成するOpenAI社の Dall-E
やStability AI社の Stable Diffusion
のようなサービスの基礎になっています。
私たちは生成AIを使いはじめてまだ間もなく、初期段階にあるものの、生成AIが秘めている力が、ビジネスのあり方を根本から変えてしまう可能性があることを示唆しています。生成AIは今後、テキストや画像以外にも裾野を広げ、プログラミング、新薬開発、製品開発、ビジネスプロセスの設計など、より高度な技術開発を可能にするでしょう。
生成AIの仕組み
生成AIは、テキストや画像、動画、デザイン、楽譜など、AIが処理できる「入力」から始まります。そして、さまざまなアルゴリズムが入力された指示(プロンプト)に応じて新しいコンテンツを返します。
初期の生成AIは、API経由でデータを入出力するなど複雑なプロセスが必要でした。この場合、生成AIをシステムに組み込む開発者はプログラミング言語を使ってアプリケーションを開発する必要がありました。
現在の生成AIは、インターネットブラウザやモバイルアプリなどのインターフェースを通じて、より優れたユーザー体験を提供しています。また、生成されたコンテンツに反映させたいスタイルやトーンなどについてのフィードバックを入力することで生成結果をカスタマイズすることもできるようになっています。ただし、まったく同じ結果や、たとえばあるキャラクターの別パターンのコンテンツを生成することは難しいでしょう。
代表的な生成AI 「ChatGPT」「Dall-E」とは?
ChatGPT、Dall-E(ダリ)は、いずれもOpenAI社が開発する生成AIです。
ChatGPT
ChatGPTは2022年11月に登場した生成AIサービスです。OpenAIは、これまで開発者のものだった生成AIを「対話可能な賢いチャット」にパッケージングして一般ユーザーに提供したことで膨大な初期ユーザーの獲得に成功しました。ChatGPTはチャット形式で対話を行い、ユーザーが指示を出すとそれに応じた解決策などを提示してくれます。もちろん単なる雑談も可能です。
Dall-E
インターネット上に存在するあらゆる画像とそれに関連するテキスト説明の大規模なデータセットで訓練されたDall-Eは、画像、テキスト、音声などの複数のメディアを横断する「つながり」を識別することを可能にしたマルチモーダルAIアプリケーションです。Dall-Eは、言葉の意味をビジュアル要素に結びつけることができます。2021年にOpenAIのGPTを使用して構築されました。「画家ダリの絵を基調としてデジタルデバイスで絵を描くだりを描いてください」とやや難解なプロンプトであっても、その意味を理解し、以下のような画像を生成します。
生成AIの活用事例とは?
生成AIは、さまざまなシーンで活用されることが期待されています。次に生成AIのユースケースについて具体例を挙げます。
- カスタマーサービスのためのチャットボット
- 映画の吹き替えやWebページの翻訳
- メール返信、履歴書などの文章作成
- 新薬のテストやDNAの解析
- 写実的なアート、作詞作曲
- 製品や建物、Webサイト、システムの設計
- プログラミングのサポートおよび自動プログラミング
- 個人のコンシェルジュ
生成AIの利点とは?
生成AIは、さまざまな分野のビジネスで応用が期待されます。現在、ITエンジニアは既存の業務プロセスを改善するべく、生成AIの活用を模索していますが、むしろ将来は生成AIへの適応を前提とした業務プロセス設計が行われるようになるかもしれません。生成AI導入によるメリットを次に挙げます。
- 画像や文章などのコンテンツ作成を自動化する
- メールの返信やブロックなどの労力の削減
- 特定の技術的な問い合わせへの対応
- リアルな人物表現の作成
- 複雑な情報を要約する
- 課題へのアドバイス
生成AIの限界とは?
現在、生成AIは初期の頃に比べて飛躍的にその機能を増やしていますが、当然限界もあります。たとえば、Web上の情報を収集したり、Webサイトを解析したりすることもできますが、網羅しているわけではないので、その知識量は限定されたものになります。
通常、生成AIはインターネットの情報を使用して学習するため、私たちのようなビジネスユーザーにとって大切な「自社にとってどうか」という視点を持ちません。出てくる回答は一般論や多数派、バイアスのかかった意見でしかありません。この場合、生成AIをプログラムから操作し、社内データを学習させることで意思決定の支援をしてもらうことが可能です。
生成AIのリスク
生成AIの台頭は、さまざまなリスクも同時にもたらすでしょう。生成AIはそのイノベーションを起こして世界をよりよくするとともに、それを悪用して犯罪や不法行為を働く人々にとっては強力な武器になりえます。コンテンツの品質、誤用や悪用、既存のビジネスモデルを破壊する可能性など。ここで問題点を挙げてみましょう。
- 曖昧な典拠や引用により、不正確な情報を生成した結果、それをそのまま使用することで誤解を招く可能性
- SEOやWeb広告を中心としたビジネスモデルの崩壊の可能性
- ディープフェイクやフェイクニュースの生成が容易になる
- サイバー攻撃のためにAIが人間になりすます可能性
- アーティストの権利を無視した盗用
生成AIの未来はどうなる?
ChatGPTの登場により、驚異的な賢さ、使いやすさが認知され、わずかな期間で生成AIは世界的に普及しました。私たちは生成AIを使い始めたばかりであり、今はコンテンツの生成がおもな用途ですが、私たちがすでに使っているサービスやツールに組み込まれることになるでしょう。その時にはスマートフォンと既存ビジネスとの融合と同等か、反れ以上の大きなインパクトが生まれるはずです。
近い将来、ECサイトでの買い物や動画視聴、SNSなどさまざまな分野で生成AIが組み込まれるでしょう。これらは近い将来、生成AIが私たちの仕事や生活を変えることのほんの一部に過ぎません。
自社のビジネスに生成AIアプリケーションを導入しようとする企業も多いはずです。自社のビジネスと生成AIを融合したとき、どのようなビジネスのアイディアが浮かぶでしょうか。また、どのような私たちの仕事はどのように変わるでしょう。この変化を避けることはできません。生成AIの情報を収集し、使い倒し、どのように自社のビジネスに組み込むかについて検討をはじめてください。
まとめ
今回は「生成AIとは」と題して、生成AIが起こした変革やユースケースをご紹介しました。生成AIとは.com では、生成AIの基礎から応用までの学習を通じて、企業や個人の生成AI導入を支援していく予定です。
最後までお読みいただきありがとうございました。