AI専門の企業だけでなく、世界中のあらゆる方面から注目されているOpenAI。「ChatGPTとかかわりがある」とは何となくわかっていても、OpenAIが何なのかは詳しく知らないという方もいるでしょう。
本記事では、OpenAIの概要や歴史について解説しながら、OpenAIが提供しているAIモデルの特徴や使い方、利用時の注意点をまとめています。OpenAIが手掛けるAIサービスの動向に興味がある方や、これからAIを上手く活用していきたいとお考えの方は、ぜひ参考にしてください。
目次
AI開発会社選びはプロにお任せ完全無料で全国5000社以上からご提案
OpenAIとは
OpenAIとは、AI技術発展に貢献することを目的につくられた人工知能(AI)の研究や開発を行う機関です。代表的なAIに2022年11月に公開したChatGPT(チャットGPT)や2023年3月に公開した「GPT-4」があります。
ChatGPTは自然言語処理モデルによって人間のような文章生成を可能にするAIです。これにより文章の自動生成や自動翻訳、自動集約、質問応答など、幅広い分野で大きな進歩が生まれました。
OpenAIの企業価値は今では4兆円にものぼるといわれていますが、営利を目的とせず、あくまでも人類にとって安全にAIを進化させることを目的としています。そのため、研究成果はオープンソースで公開されており、誰でも自由に利用できるのが特徴です。これは世界中の人々と協力してAIの研究を進めるためで、今後もAIの普及を促進することを目指しています。
●OpenAIの概要
OpenAIは、アメリカ・サンフランシスコに拠点を置くAIを専門とする非営利研究機関です。2015年にテスラ社のCEOイーロン・マスクや、アメリカの起業家兼投資家サム・アルトマンといったグローバルリーダーらによって設立されました。AIの安全かつ有益な進化を促進することを目指しており、人類にとって友好的なAIを開発するとともに、AI技術の発展によって生じる潜在的な危険性に備えるために研究を行っています。
OpenAIが手掛けるのは、膨大なデータから学習し、新たなテキストや画像、音声を生み出す「生成AI(ジェネレーティブAI)」と呼ばれる種類です。AIモデルのトレーニングに使用されているのは、マイクロソフト社のクラウドプラットフォームMicrosoft Azure(アジュール)で、マイクロソフトはOpenAIと長期的かつ継続的なパートナーシップ契約を結んでいます。
●OpenAIが注目されている理由
OpenAIが広く注目されるようになったのは、2022年11月30日の「ChatGPT」の登場からです。公開されてからわずか2ヶ月間で利用者が1億人を超えるほど爆発的に多くのユーザーを獲得しました。利用者数はその後もさらに拡大しつつあり、AI技術の急速な進展と社会への影響力の増大に対する関心が高まっています。
世界を大きく変える可能性を秘めた最先端のAIが登場したことによって、期待と同時に危機感も生まれました。急速なAIの進化は人類に対する脅威にもなり得るという考えからで、AI倫理をめぐる議論やAI開発の中断署名など、世界でさまざまな反応が起こっています。
AI技術の発展に伴うリスクに対処するべく、OpenAIは新たなAI開発と同時にAIの倫理的な使用に関する研究も行っています。
●OpenAIの歴史
OpenAIが設立されたのは、2015年です。イーロン・マスクやサム・アルトマン、リード・ギャレット・ホフマン、グレッグ・ブロックマンなど、複数のグローバルリーダーや有力者たちが共同創業者となってつくられました。設立当初はイーロン・マスクが参加したことが大きくニュースに取り上げられましたが、マスク氏は2018年にOpenAIを離れており、現在ではサム・アルトマンがCEOと取締役を務めています。
設立後、2016年に強化学習用の開発ツールキット「OpenAI Gym」のベータ版を公開し、同年11月にはマイクロソフトとの提携を締結。12月にはAI学習プラットフォーム「Universe」を公開しました。
2018年にはChatGPTの元祖となる「GPT-1」を公開し、約1年ごとに上位モデルとなる「GPT-2」「GPT-3」「GPT-4」が公開されています。
2022年11月30日に発表したのが、テキスト生成AI「GPT-3.5turbo」をベースにした対話型AI「ChatGPT」です。ChatGPTの爆発的な普及から世界で注目されるようになり、2023年7月には性能が大幅に向上した「GPT-4 API」、2024年5月には精度とスピードがアップした「GPT-4o」がリリースされるなど、日々進化を遂げています。
2015年 | イーロン・マスク、サム・アルトマンなどの投資家たちがOpenAIの設立を発表し、その事業に10億米ドルを約束 |
---|---|
2016年 | OpenAIが「Universe」というソフトウェアプラットフォームをリリース。このプラットフォームは世界中のゲーム、Webサイト、そのほかのアプリケーションを通じてAIの一般的な知能を測定し、訓練するもの |
2018年 | イーロン・マスクがOpenAIから離れ、役員を辞任。自然言語処理モデルの元祖「GPT-1」を公開 |
2019年 | OpenAIが営利部門のOpenAI LPを設立。Khosla VenturesとReid Hoffman Foundationから出資を受け、同年マイクロソフトから10億米ドルの資金を獲得 |
2021年 | OpenAIがマイクロソフトからさらに20億米ドルを獲得 |
2022年 | OpenAIがDALL·Eのβサービスを開始し、ChatGPTを公開 |
2023年 | OpenAIがマイクロソフトから100億米ドルの資金を獲得し、マイクロソフトが株式の49%を取得 |
●OpenAI Japanとは
OpenAI Japanとは、2024年4月に設立されたOpenAIの日本拠点で、日本で社長を務めるのは、AWS(Amazon Web Services)の日本法人社長を務めた経歴を持つ長崎忠雄氏です。
OpenAIは、アメリカ・サンフランシスコに本社、イギリス・ロンドンとアイルランド・ダブリンに拠点を置いており、日本の東京オフィスは世界で4つめの拠点となりました。日本が世界で4つめの拠点に選ばれた理由としては、週間200万人以上というアクティブユーザー数の多さが挙げられます。
OpenAIにとって技術開発のチャンスが大きい重要な市場と考えられているようで、日本特有のニーズに合わせた安全なAIツールの開発を進めることを目的に研究が進められています。日本語特化モデルの開発がすでにはじまっており、将来のモデルについても最先端の技術を推し進める姿勢が発表されています。
参考:NHK「ChatGPT開発 オープンAI 東京に新拠点設立 日本のAI事情は?」
OpenAIが提供しているサービス(AIモデル)の特徴や使い方
OpenAIは複数のAIサービスを提供しており、活用できる分野やできることに違いがあります。ここからは、OpenAIが提供するサービス(AIモデル)についてそれぞれの特徴や使い方を解説しますので、自社に合ったサービスや導入できそうなAIモデルがあるか、見極めの参考にしてみてください。
●ChatGPT
ChatGPTとは、自然言語を理解して応答を生成するAIモデルで、正式名称は「Chat Generative Pre-trained Transformer」です。「生成系AI」や「ジェネレーティブAI」とも呼ばれ、人間が書いたと見間違う品質のテキストを生成できます。人間の質問に対し、対話しているかのようにAIが回答するのが特徴です。
ChatGPTには、OpenAI社が独自に開発した「GPT」と呼ばれる言語モデルが用いられています。GPTとは大規模言語モデルの一種で、OpenAI社はこれまでにGPT-3.5を利用した「ChatGPT-3.5」やGPT-4を利用した「ChatGPT-4」と、バージョンアップを重ねて無料公開してきました。ChatGPT-4はChatGPT-3.5よりも精度の高い文章を作成できるほか、画像の生成も可能。音楽や動画の生成についても、OpenAIでは専用のモデルが対応しています。
2024年5月には最新モデルである「GPT-4o」がリリースされました。GPT-4oでは英語以外のテキストや音声の理解速度がアップしており、人間の会話と同じレベルのスピードで応答できるまでに進化しています。
ChatGPTの使い方
ChatGPTは、公式サイトからアカウントを登録した後、質問を入力するだけで利用できます。18歳未満は保護者の許可が必要ですが、13歳以上であればChatGPTのアカウントを作成できます。アカウントの作成後は、基本的に無料で使用可能です。
ログイン後、画面の枠内にユーザーが質問したい内容を入力して送信すると、ChatGPTがそれに基づいて回答。文章作成を得意としているので、ビジネスの場面では情報収集や文章の作成、校正、要約、資料作成などに活用できます。そのほか、顧客サポートや教育、プログラミング言語を用いたコーディングなどのコンテンツ作成、翻訳、アイディア出しなど、活用できるシーンは多岐にわたります。
●DALL·E
DALL·EはOpenAIにより開発された画像生成AIモデルです。自然言語での入力(Prompt)を元に、AIが画像やイメージを作成します。
DALL·Eの名前は近代画家「サルバドール・ダリ」とピクサーの「WALL·E」の組み合わせからきています。これは、DALL·Eがリアルな世界には存在しないような画像や、シュールで想像力豊かな画像を生成できることに由来しており、自由な発想で新たな画像を生成したい際に有用です。
2023年9月には、ChatGPTに話しかけることで画像を自動生成できる「DALL·E3」が発表されました。DALL·E3はChatGPTとの統合によって文章の読解力も強化されており、より正確な画像を生成できるようになっています。
DALL·Eの使い方
作成したいイメージをテキストで入力すれば、最大10枚の画像を指定した枚数で出力。ビジネスにおいては、新規アイディアやWebコンテンツの素材など、クリエイティブな分野でのビジュアル作成において活躍が期待できます。
DALL·Eの利用に関して、無料ユーザーと課金ユーザーでは使用に関して以下の違いがあります。利用頻度に応じて、月額を支払うケースも検討してみましょう。
■無料ユーザー
-
クレジット制:無料ユーザーには初回登録時に50クレジットが付与され、その後は毎月15クレジットが追加されます
-
リミット:クレジットが尽きると、新たにクレジットを購入しない限り、月末まで利用が制限されます。次の月になると新たに15クレジットが付与されます
■月額課金ユーザー
-
追加クレジットの購入:課金ユーザーは追加クレジットを購入することで、制限なく利用を続けることができます。購入したクレジットは12ヶ月間有効です
-
使用制限の緩和:課金ユーザーは使用制限が緩和され、より多くの画像生成やリクエストを行うことができます
このように、無料ユーザーは月ごとに一定のクレジットが付与されるのに対し、課金ユーザーは追加クレジットの購入により使用制限を回避し、継続的にDALL·Eを利用することができます。
●Whisper
Whisperは、入力した音声データをテキストに変換(文字起こし)する音声認識AIです。OpenAIモデルの基盤である「Transformer」という特殊なアルゴリズムを用いており、多種多様な音声データに対応しています。
Whisperの登場により、音声を聞きながら人間が手作業で文書化していた音声データを、自動で簡単にテキストデータ化できるようになりました。
議事録の作成やリアルタイム翻訳、セミナー・講演会の録音データ書き起こし、オーディオブックの文字化など、ビジネスのさまざまなシーンで活用できます。2023年3月にWhisperのAPIも公開されており、アプリ開発などに組み込めるようになっています。
Whisperの使い方
Whisperは、文字起こしのパフォーマンスごとに5段階のモデルサイズが用意されています。モデルサイズがアップするごとに文字起こしの精度も上がる設計で、使用用途やデバイスに合わせて選択可能です。
Whisperを実行するには、まず実行環境の設定が必要です。「Google Colaboratory」にアクセスし、必要な環境を設定すれば利用できるようになります。その後、文字起こしを行う音声データを準備して、必要なモデルサイズを選択。アップロードして文字起こしを実行します。
●Codex
Codexとは、自然言語を解析してテキストからプログラミングコードを生成するGPT-3系統のAIモデルです。対応しているプログラミング言語が幅広く、PythonやJavaScript、PHP、Go、Perl、Ruby、Swift、TypeScript、SQL、Shellなどの高度なコーディングをAIが代わりに実行します。ソフトウェアやWebアプリなど、開発時の補助として活用すれば、プログラマーの作業効率アップや開発の自動化、教育に役立つとして注目されていました。しかし、2023年3月に非推奨(サポート終了)となり、現在ではGPT-3.5以降が推奨されています。
Codexの使い方
Codexは、OpenAIのAPIページの申請フォームから申請し、承認されると利用できるようになります。主な使い方は、ユーザーがプログラミングに関する指示をテキストで入力するだけ。入力されたテキストに基づいたコードをCodexが生成してくれます。OpenAIのAPIではほかのアプリケーションとの連携が可能です。Codexを利用しながらChatGPTを活用すれば、さらなる効率化につながります。
OpenAIのサービスを利用する際の注意点
基本的に無料で利用できることから、幅広いビジネスシーンで気軽に活用できるChatGPTなどのOpenAIのサービス。
ただし、内容によっては重大なリスクが発生する可能性もあるため、特にビジネスで活用する際には以下の点に注意が必要です。
●情報が正確でない可能性がある
AIモデルが持つデータの情報源は、過去にインターネット上に存在した情報であり、収集された情報が最新のものとは限りません。AIが学習するデータには最新の情報が含まれないため、直近の出来事に関する質問が正確でない可能性があります。
さらに、そのテキストが事実かどうかよりも、単語の出現頻度や相互関係を考慮して文章を作成する特性から、情報が正確ではない可能性があります。
例えば、人物について全く異なる肩書や経歴を捏造する、出力した文章の参考文献に、存在しない書籍や論文を挙げるといった具合です。このようにAIが「嘘をつく」現象はハルシネーションと呼ばれ、生成AIの欠点とされています。ハルシネーションは徐々に改善されつつありますが、まだ完璧に対策がされているわけではありません。
生成AIによって得られた情報をビジネスや公の場で活用したい場合は、その情報が本当に正確なものか、ほかの信頼できるソースで確認する作業が必要です。
●専門性の高い要求にこたえられない
OpenAIのAIモデルは一般的な情報には対応できますが、専門的な知識が必要な内容への回答には限界があります。そのため、ほかのデータソースや一次情報を確認するだけでなく、専門性や正しさが要求されるものに関しては、事実確認(ファクトチェック)が必要です。文章に専門性が求められる場合は、専門家の意見や詳細な研究を参照するようにしてください。
●情報漏洩に注意する
特にChatGPTにおいて、生成AIが使用する情報の仕入れ先には、ほかのユーザーが過去に行った質問や回答も含まれます。そのため、企業や個人情報などの機密情報を扱う際に利用してしまうと情報漏洩のリスクがあります。
例えば、機密情報が書かれたテキストの整理や要約をAIに依頼してしまうと、社外のユーザーが関連した内容の質問を行った時、過去に入力した機密情報を含めてAIが回答してしまう可能性があるのです。
この現象について、OpenAIも「ChatGPTに機密情報の共有をしないように」と公式で警告しています。ビジネスで利用する際にはAIツールに関する社内ルールを徹底するなど、機密情報データの保護策を講じることが重要です。
●著作権違反に気を付ける
AIが生成するコンテンツは元データに基づくため、著作権で保護されたデータが含まれることがあります。人間の質問に対してWeb上にある情報をかき集めて回答する特性があるため、情報元が少ないと、特定のWebサイトや書籍に記載された内容がそっくりそのまま「回答」として返ってくる場合もあるのです。
仮にAIがほかのメディアや書籍に記載されている内容をそのまま返答し、それを自社サイトなどにそのまま掲載してしまった場合、著作権法違反にあたる可能性があります。特に商用利用の際には、著作権の侵害に該当してしまわないか注意が必要です。
次々とAIサービスを世に送り出して、AI技術の世界的な発展に貢献しているOpenAI。
特にChatGPTは、生活のさまざまなシーンやビジネスにも役立つことから多くの企業が積極的に導入しはじめています。生成AIの広がりは、今後もますます拡大すると考えられます。
自社に合わせたAIの導入は、慢性化する人手不足を補う面でも有効です。ただ、OpenAIのオープンソースを活用するにしてもAI開発にはそれなりの時間とリソース、コストがかかります。人手が足りていない、ノウハウを持たない企業の場合は、開発プロジェクトを外部に委託するのも一つの手です。
はじめてのAI導入を検討しているなら、AI開発や導入のナレッジが豊富なベンダーにコンサルティングを依頼してみてはいかがでしょうか。
発注ナビは、全国5000社以上の開発会社から、ご要望や案件内容に合った開発会社を厳選してご紹介いたします。
『自社に合った開発会社がわからない』『会社選定になるべく時間をかけずスムーズにAIを導入したい』とお考えのご担当者様は、ぜひ一度ご検討してみてはいかがでしょうか。
AI開発会社選びはプロにお任せ完全無料で全国5000社以上からご提案
■AIに関連した記事