API を介して独自のドキュメントで ChatGPT をトレーニングできるようになりました
火曜日、OpenAI は、API を通じて、ChatGPTの無料版を強化する AI モデルである GPT-3.5 Turbo の微調整を発表しました。これにより、会社の文書やプロジェクトの文書などのカスタム データを使用してモデルをトレーニングできます。OpenAI は、特定のシナリオでは、微調整されたモデルが低コストで GPT-4 と同等のパフォーマンスを発揮できると主張しています。
基本的に、微調整では、プロジェクト ドキュメントやその他の文書化されたリファレンスなどのカスタム コンテンツについて GPT-3.5 Turbo に学習します。これは、製品やサービスに精通しているものの、トレーニング データにその知識が欠けている GPT-3.5 に基づいた AI アシスタントを構築したい場合に便利です (念のために言っておきますが、トレーニング データは、以前に Web から削除されたものです)。 2021年9月)。
「GPT-3.5 Turboのリリース以来、開発者や企業はモデルをカスタマイズしてユーザーにユニークで差別化されたエクスペリエンスを生み出す機能を求めてきました」とOpenAIはプロモーションブログで書いている。「今回のリリースにより、開発者は監視付き微調整を実行して、ユースケースに合わせてこのモデルのパフォーマンスを向上させることができるようになりました。」
GPT-3.5 のより強力ないとこであるGPT-4は、多くの主題に適応できるジェネラリストとしてよく知られていますが、実行速度が遅く、コストも高くなります。OpenAI は、特定の知識領域で GPT-4 のようなパフォーマンスを低コストでより高速な実行時間で実現する方法として 3.5 の微調整を提案しています。「初期のテストでは、微調整されたバージョンの GPT-3.5 Turbo が、特定の狭いタスクに関して基本的な GPT-4 レベルの機能と同等、あるいはそれを上回るパフォーマンスを発揮できることが示されました」と彼らは書いています。

また、OpenAI は、微調整されたモデルにより「操縦性が向上」する、つまり指示に従いやすくなると述べています。「信頼性の高い出力フォーマット」。これにより、API 呼び出しや JSON などのフォーマットでテキストを一貫して出力するモデルの機能が向上します。「カスタム トーン」は、チャットボットにカスタムのフレーバーや個性を組み込むことができます。
OpenAI によれば、微調整によりユーザーはプロンプトを短縮でき、トークンごとに課金される OpenAI API 呼び出しのコストを節約できるという。「初期のテスターは、命令をモデル自体に微調整することにより、プロンプトのサイズを最大 90% 削減しました」と OpenAI は述べています。現在、微調整のコンテキストの長さは 4K トークンに設定されていますが、OpenAI によると、微調整は「今秋後半」に16K トークン モデルに拡張される予定です。
独自のデータの使用にはコストがかかります
ここまでで、独自のデータを使用して GPT-3.5 をトレーニングすることがどのように機能するのか、またそのコストはいくらなのか疑問に思っているかもしれません。OpenAI は、API を使用したシステム プロンプトの設定、トレーニング用の OpenAI へのファイルのアップロード、コマンド ライン ツールのcurl を使用して API Web アドレスをクエリする微調整ジョブの作成を示す簡略化されたプロセスをブログに掲載しています。OpenAIによれば、微調整プロセスが完了すると、カスタマイズされたモデルはベースモデルと同じレート制限ですぐに使用できるようになるという。詳細については、OpenAI の公式ドキュメントを参照してください。
もちろん、これらにはすべて費用がかかり、トレーニング費用と使用コストに分けられます。GPT-3.5 をトレーニングするには、1,000 トークンあたり 0.008 ドルの費用がかかります。使用フェーズ中の API アクセスの料金は、テキスト入力の場合は 1,000 トークンあたり 0.012 ドル、テキスト出力の場合は 1,000 トークンあたり 0.016 ドルです。
比較すると、基本の 4K GPT-3.5 Turbo モデルのコストは1,000 トークン入力あたり 0.0015 ドル、1,000 トークン出力あたり 0.002 ドルであるため、微調整モデルの実行コストは約 8 倍になります。また、GPT-4 の 8K コンテキスト モデルも、1K トークン入力あたり 0.03 ドル、1K トークン出力あたり 0.06 ドルと安価ですが、それでも OpenAI は、微調整モデルではプロンプトの必要性が減るためコストを節約できると主張しています。極端ではありますが、狭いケースでは当てはまるかもしれません。
たとえコストが高くても、カスタム ドキュメントについて GPT-3.5 に教えることは、モデルがそれについてでっち上げないようにできれば、一部の人々にとってはその代償を払う価値があるかもしれません。カスタマイズすることは別のことですが、運用環境における GPT-3.5 Turbo 出力の精度と信頼性を信頼することはまったく別の問題です。GPT-3.5 は情報を捏造する傾向があることでよく知られています。
データプライバシーに関して、OpenAI は、すべての API と同様に、微調整 API に送受信されるデータは OpenAI (または他の誰か) によって AI モデルのトレーニングに使用されないと述べています。興味深いことに、OpenAI は、最近発表されたモデレーション APIを使用して、モデレーション目的ですべての顧客の微調整トレーニング データを GPT-4 経由で送信します。これは、微調整サービスの使用にかかるコストの一部を占める可能性があります。
そして、3.5 が十分ではない場合、OpenAI は GPT-4 の微調整がこの秋に行われる予定だと述べています。私たちの経験から言えば、GPT-4 はそれほど大きな問題を補うことはありませんが、そのモデル (または内部で連携していると噂の8 つのモデル)を微調整するには、はるかに費用がかかる可能性があります。時期が来るかどうか見てみる必要がある。
コメントを残す