生成AIとは?注目される背景、種類や仕組みを解説

  • このエントリーをはてなブックマークに追加
  • LINEで送る

最近よく耳にする「ChatGPT」は生成AIサービスの一つですが、生成AIとはそもそも何なのか、今更聞けないと思う方も多いのではないでしょうか。

生成AIは、人工知能(AI)の一種です。

この記事では、まずそもそもAIとは何なのかをおさらいし、生成AIが誕生して注目されるようになった背景を紹介した上で、生成AIの仕組みや種類について解説します。

まだAIについて詳しくない人にも、それぞれわかりやすく解説していきますので、ご参考ください。

そもそもAIとは?

AIとはArtificial Intelligenceの略称で、直訳すると人工知能となります。AIの誕生は1956年、計算機科学者・認知科学者のジョン・マッカーシー教授によってアメリカのダートマス大学で開催された会議で提案されました。

誕生当時からさまざま分野で研究が続けられており、明確な定義がなく統一されていないのが現状ですが、主に人間の脳の動き(思考・学習)を人工的に作り出し「人間の知能を再現するコンピューター技術」とされています。

AIの種類

AIには2種類あり、特化型AIと汎用型AIがあり、「弱いAI」と「強いAI」に分類されます。それぞれのAIについて解説していきます。

「特化型AI」=弱いAI

特定の分野や領域を得意とするAIです。膨大なデータから正確性の高い返答をすることができます。主なシステムやサービスは自動運転システムやiPhoneにも搭載されている顔認証、Shiriなどの音声認識があります。現在身近で使用されているのは、この特化型AIがほとんどとなります。

「汎用型AI」=強いAI

特化型AIとは逆に特定の分野や領域に限らず、自ら学習して応用力のあるAIとなります。人間に近い知能を持ちますが、多くの情報を十分に理解するプログラムが存在しておらず実用化の現実まではまだまだ遠い未来となります。人型のアンドロイド、ドラえもんなどが汎用型AIに該当します。

AIの時代による変化

AIには、これまで3度のブームと冬の時代が交互に訪れ、現在の技術に至っています。

第一次AIブーム(1950〜60年代)では、特定ルールの中で「推論」や「探索」を行い、特定の問題に対して回答を導き出すことができるようになりました。実はこの時代に、心理療法士の役割を担う対話型AIのチャットボット「ELIZA(イライザ)」の開発を始め、生成型AIの研究も本格的に始まっています。

第二次AIブーム(1980年代〜90年代)では、知識データを人工知能に与え、ルールから推論し、特定分野の専門家のように振る舞うシステムが生み出されました。同時代に世界初のニューラルネットワークを利用した生成型AIプログラム「Backpropagation(バックプロパゲーション)」が開発されています。

第三次AIブームは、2000年代から始まり現在も続いています。このブームの大きな特徴は、AIがビックデータと呼ばれる大量のデータを用いて、自ら学習・習得をする機会学習が実用化されたことです。そして、コンピューター技術の進化で、この機械学習の学習量やアウトプットの精度やスピードが向上し、現在ChatGPTのような生成AIが注目されているのです。

生成AIとは?

近年、AIから発展を遂げた生成AIが注目をされています。生成AIとは、「プロンプト」と呼ばれる指示や質問を投げかけるとその内容を解読し、自動で新しいコンテンツを生み出して、学習もしていくものです。

生成AIの概念

生成AIとは入力されたプロンプトの規則性や構造を学習し、訓練をしていきます。同じような特性を持つ新しいデータを生成し、0から1を作り出すものです。これまでのAIは自らが持つ知識から学習や認識することができるものだったのに比べ、生成AIは新たにコンテンツを生成できることが特徴となります。

生成AIの仕組み

生成AIはプロンプトから解析し、予め学習している大量なデータの中から特徴を抽出し、適切な回答を導き出す仕組みになっています。この仕組みでは、大量データから特徴を自動的に発見できる人工技術の一種であるディープラーニングが用いられています。ディープラーニングは機械学習の手法で、学習しているデータを元にAI自身が最も適切な回答を導き出す手法です。

生成AIの種類

生成AIには4つの種類があります。それぞれ解説していきます。

画像生成

テキストを入力することで入力した内容のイメージに近いオリジナルの画像を生成できます。WEBサイト制作の際の背景画像などの素材として画像を生成するなど、デザイン業界での活用方法が期待できます。

代表的なサービス:Stable DiffusionCanva

テキスト生成

プロンプトを入力することでAIがその内容を解析して回答のテキストを生成できます。単純に質問に対する答えを生成することもできますが、例えばプログラミングにおいて、エラーが表示されたコードを入力し、エラー箇所を指摘してもらうという指示を出すこともできます。

代表的なサービス:ChatGPTGoogle Bard

動画生成

動画生成AIもテキストで指示を出し、オリジナルの動画を生成することができます。生成AI開発の中でも難易度が高いとされており、現時点では数秒ほどの短い動画生成になっています。また今ある動画を入力して新しく作り変えることも可能です。
将来的には長尺の動画も生成できる可能性もあるとされていて、プロモーションビデオの作成なども期待できます。

代表的なサービス:RUNWAY

音声生成

音声生成AIは音声を生成するAIです。例えばある一人の声を入力すると、その人の声質を高精度で再現することができ、その人の音声を使ったテキスト読み上げなどが可能になります。つまり本人の声を収録せずとも、ナレーションを読み上げたりすることができるのです。

代表的なサービス:VoicevoxCoeFont

生成AIができること・苦手なこと

生成AIにはさまざまな種類があり、便利で業務効率に役立てることも多い一方、不得意な分野もあります。生成AIは、出された指示に従ってその指示を解読し、情報を集め、テキストで回答したり、音声・動画・画像データをわずか数秒で生成できることがポイントです。

しかし、情報の真偽性に対しては確認ができていないので、こちらで正しい情報なのかや著作権に問題がないかをチェックする必要があります。また、人間の指示の裏側にある意図を汲み取ることも難しいので、生成AIのレベルに合わせた適切なプロンプトが必要になってきます。そのほかにも、セキュリティ面での懸念もよく上がっており、入力する内容に個人情報や機密情報が含まれていないか注意することも重要です。

まとめ

生成AIにはたくさんの種類があり、正しい使い方をすることで、業務効率・コスト削減が期待できます。しかし便利である一方、現代の技術では課題も多く、使用方法を間違えると、会社として大きなリスクを抱えてしまいます。

2023年以降もさまざまな生成AIサービスがリリースされていくでしょう。今後の発展に期待しつつ、現状の技術もしっかりと把握をしながらうまく活用していきましょう。