生成AIブームを牽引するOpenAIとchatGPTについて解説

更新日：2024年11月21日

2022年にChatGPTを世に送り出し、生成AIブームを巻き起こしたのがサンフランシスコに本拠を置くOpenAIという法人です。2023年末の共同設立者兼CEOサム・アルトマン氏の解任・復活劇、2024年に入ると、米大手新聞社The NewYorkTimesから著作権侵害で提訴されるなど、報道やSNSでOpenAIという名前を見たことがある方も多いのではないでしょうか。

注目度の高いOpenAIのなりたちや提供しているサービス、生成AIとはどういったものなのかについて解説します。

このページのコンテンツ

OpenAIとは
AIブームと生成AI
OpenAIのプロダクト
生成AIのリスク
生成AIの限界を知りDXにつなげる

OpenAIとは

OpenAIはChatGPTを提供している法人と述べましたが、OpenAIそのものは非営利組織として設立されました。OpenAI GP LLC（管理会社）とOpenAI Global, LLC（営利部門・利益上限付き）の２社を傘下に置く、営利と非営利の両面のガバナンススキームを持つ法人です。

OpenAIが設立されたのは2015年のこと。設立には、テスラやスペースXの創業者であるイーロン・マスク、スタートアップへの投資を行うYコンビネーターの元CEOサム・アルトマンのほか、IT業界・スタートアップ業界の名だたる起業家や投資家、研究者が関わっています。

当初は、AIの将来的な技術的インパクトの大きさと実用化までの不確実性の高さから、研究成果を広く共有することや、株主よりも公益を優先することを目指す非営利法人として設立されました。

2019年に資金調達と優秀な人材の獲得に向けて、営利部門となるOpenAI Global,LLCを設立し、マイクロソフトからの出資を獲得しています。

非営利法人のOpenAIの取締役会によるサム・アルトマンの解任は、このような複雑な組織の成り立ちが一つの要因であるといわれています。

AIブームと生成AI

ChatGPTが登場する以前に、AI分野で注目を集めたキーワードがディープラーニング（深層学習）です。ディープラーニング（深層学習）技術は、自然言語処理や画像認識におけるブレークスルーとされ、自動車の運転支援や医療向け画像診断、音声認識によるチャットボットなどの技術が実用化されています。

2000年代にはじまるディープラーニングによるAIブームを第３次AIブーム、ChatGPTに代表される生成AIがもたらした今回のAIブームを第４次AIブームとする見方が多いようです。

生成AIブームを牽引するOpenAIとchatGPTについて解説_AIブームと生成AI

引用：総務省「平成28年版情報通信白書」

生成AI（Genarative AI）とLLM（Large Language Models：大規模言語モデル）

生成AIが従来のAIと異なるのは、学習したデータから文章や画像、音楽などの新たな情報やコンテンツを生み出すことができるという点です。

ディープラーニングによる従来のAIが、判断や予測といった決められた行為の自動化を主要な目的としていたのに対し、ChatGPTは対話から新たな文章を生成することができるという点で大きく異なります。

また、生成AIに用いられる要素技術の一つとして重要な役割を果たしているのがLLM（Large Language Model：大規模言語モデル）です。

ハードウェア技術の進歩に合わせて、大規模な計算が必要なLLM（大規模言語モデル）の構築とディープラーニングを含む機械学習技術により、言語の理解、文章の生成、汎用的なタスクへの応用などが格段に進歩したといわれています。

ChatGPTの特徴

生成AIであるChatGPTは、人間と対話するのと同様な回答をしたり、小説や手紙など創造的な文章を作成できることが大きな話題となっています。しかし、出力されるテキストは、確率的に“もっともらしい”テキストデータの組み合わせを出力しているものに過ぎません。

ChatGPTが学習しているのはネット上に公開された文書であり、出力される回答は学習した文章に依存しています。ChatGPTが出力できる知識は学習データの範囲に限られること、また、学習データの間違いを認識することができないなどの点に留意する必要があります。

注目されている理由である「人間らしい回答をする」という点は、質問に対する回答パターンを学習しているということに過ぎません。人間のような思考プロセスを経ているわけではない、という点が現段階のAIの限界とされています。

一方、これらの限界を前提とした上で、ChatGPTによる知識の組み合わせが創発的なアイディアやコンセプトを生み出す可能性があることが指摘されており、人間の創造性を助ける一つのツールとしての活用が期待できます。

OpenAIのプロダクト

OpenAIは対話型生成AIであるChatGPTのほかにも、いくつかのプロダクトを提供しています。

ChatGPT

OpenAIが提供しているChatGPTは、無料で利用できる「GPT-3.5」と有料版の「GPT-4」があります。

無料版と有料版では、要件の理解力、文章の精度、誤回答の割合といった性能面での差があります。また、無料版はテキストベースの入出力に限定されるのに対し、有料版では画像認識、画像生成、外部サービスとの連携が可能となります。

DALL-E

DALL-Eは、画像生成に特化したモデルであり、指示したテキストの内容を理解して画像を生成することができます。ChatGPT-4とDALL-EはMicrosoft 365に実装されたAIサービスである「Microsoft Copilot」に搭載されています。

単にキーワードに該当する画像を生成するだけでなく、画像のコンセプトやスタイルなどを指定したり、画像の拡張、要素の追加・削除、バリエーションの追加といった操作を行うことが可能です。

CLIP

CLIPは、画像とテキストの関連性を学習したモデルであり、画像の検索と分類ができるAIです。

たとえば、キーワードを指定するとキーワードに関連する画像を出力します。従来のAIと異なるのは、学習されていない画像やテキストも適切に分類することができる「ゼロショット」という特性を持っている点です。

Whisper

Whisperは音声認識モデルを使い、音声ファイルからテキスト情報を生成することができるAIです。音声の文字起こしのほか、多言語の翻訳にも対応しています。ソフトウェア開発のプラットフォームであるGitHubとAPIから利用することができます。

GPT Store

GPT Storeは、ChatGPTを使って特定のタスクに特化したGPTを開発・公開することができる、OpenAIが提供するプラットフォームです。

一般のユーザーは、論文の下書きの作成、Webサイトの制作、履歴書、プレゼンテーションなどの作成といった特定の用途に専門化したGPTを利用でき、開発者は利用状況に応じて収益を得る機会を得ることができます。

参考：ChatGPTは業務に使えるか？特徴やメリット・デメリットを解説

生成AIのリスク

人間のような受け答えを出力するという点のインパクトに注目が集まるChatGPTですが、人間と同レベルの知的作業を行うことができるAGI（Artificial General Intelligence：汎用人工知能）の水準には到達していません。

AGIが「強いAI」と呼ばれるのに対し、生成AIは「弱いAI」として位置づけられています。

この、一見するとAGIらしく見える点が生成AIのリスクの一つでもあり、冒頭に挙げた著作権の問題なども含め、開発する側、利用する側の双方のリスクの存在に留意する必要があります。

一橋大学イノベーション研究センターによるワーキングペーパーでは、生成AIに係る社会的リスクを以下のように整理しています。

分類		課題・論点
出力にかかわる社会的リスク	正確性・信頼性	・学習データ上の限界・嘘、誤りの回答・フィクションの生成も可能・悪意あるコンテンツの生成
出力にかかわる社会的リスク	公平性・社会的妥当性	・学習データ上のバイアス・社会的妥当性（中国の規制の事例）
入力関連のリスク	オーサーシップ・著作権・盗作	・著作権上の扱い・研究・教育関連での利用
入力関連のリスク	個人情報、企業秘密	・個人情報保護法上の扱い・情報セキュリティにかかわる信頼性