Możesz teraz trenować ChatGPT na własnych dokumentach za pośrednictwem API

We wtorek OpenAI ogłosiło udoskonalenie GPT-3.5 Turbo – modelu AI, który obsługuje bezpłatną wersję ChatGPT – za pośrednictwem swojego API. Umożliwia szkolenie modelu z wykorzystaniem niestandardowych danych, takich jak dokumenty firmowe czy dokumentacja projektowa. OpenAI twierdzi, że w niektórych scenariuszach dopracowany model może działać równie dobrze jak GPT-4 przy niższych kosztach.

Zasadniczo dostrajanie uczy GPT-3.5 Turbo o niestandardowych treściach, takich jak dokumentacja projektowa lub inne pisemne odniesienia. Może się to przydać, jeśli chcesz zbudować asystenta AI opartego na GPT-3.5, który jest dobrze zaznajomiony z Twoim produktem lub usługą, ale brakuje mu wiedzy na ten temat w swoich danych szkoleniowych (które, dla przypomnienia, zostały zeskrobane z sieci przed wrzesień 2021).

„Od czasu premiery GPT-3.5 Turbo programiści i firmy prosiły o możliwość dostosowania modelu, aby zapewnić użytkownikom unikalne i zróżnicowane doświadczenia” – pisze OpenAI na swoim blogu promocyjnym . „Dzięki tej premierze programiści mogą teraz przeprowadzać nadzorowane dostrajanie, aby model ten działał lepiej w swoich przypadkach użycia”.

Chociaż GPT-4 , potężniejszy kuzyn GPT-3.5, jest dobrze znany jako narzędzie uniwersalne, które można dostosować do wielu tematów, jest wolniejszy i droższy w obsłudze. OpenAI proponuje dostrojenie wersji 3.5 jako sposób na uzyskanie wydajności podobnej do GPT-4 w określonej domenie wiedzy przy niższych kosztach i krótszym czasie realizacji. „Wczesne testy wykazały, że dopracowana wersja GPT-3.5 Turbo może równać się lub nawet przewyższać podstawowe możliwości poziomu GPT-4 w niektórych wąskich zadaniach” – piszą.

Artystyczna wizja spotkania z udoskonaloną wersją ChatGPT.

Ponadto OpenAI twierdzi, że dopracowane modele zapewniają „lepszą sterowność”, co oznacza lepsze przestrzeganie instrukcji; „niezawodne formatowanie wyjściowe”, które poprawia zdolność modelu do spójnego wyprowadzania tekstu w formacie takim jak wywołania API lub JSON; oraz „niestandardowy ton”, który może nadać chatbotowi niestandardowy charakter lub osobowość.

OpenAI twierdzi, że dostrojenie pozwala użytkownikom skrócić monity i zaoszczędzić pieniądze na wywołaniach API OpenAI, które są rozliczane za token. „Wcześni testerzy zmniejszyli rozmiar podpowiedzi nawet o 90%, dopasowując instrukcje do samego modelu” – mówi OpenAI. W tej chwili długość kontekstu do dostrajania jest ustalona na 4 tys. tokenów, ale OpenAI twierdzi, że dostrajanie obejmie model tokenów 16 tys. „później tej jesieni”.

Korzystanie z własnych danych wiąże się z kosztami

Być może zastanawiasz się już, jak działa używanie własnych danych do uczenia GPT-3.5 i ile to kosztuje. OpenAI przedstawia na swoim blogu uproszczony proces, który pokazuje konfigurowanie wiersza poleceń za pomocą interfejsu API, przesyłanie plików do OpenAI w celu szkolenia i tworzenie zadania dostrajania za pomocą narzędzia wiersza poleceń curl w celu wysłania zapytania do adresu internetowego interfejsu API . OpenAI twierdzi, że po zakończeniu procesu dostrajania dostosowany model jest natychmiast dostępny do użytku z tymi samymi limitami szybkości, co model podstawowy. Więcej szczegółów można znaleźć w oficjalnej dokumentacji OpenAI .

Wszystko to ma oczywiście swoją cenę, która dzieli się na koszty szkolenia i koszty użytkowania. Wyszkolenie GPT-3.5 kosztuje 0,008 USD za 1000 tokenów. Na etapie użytkowania dostęp do interfejsu API kosztuje 0,012 USD za 1000 tokenów do wprowadzania tekstu i 0,016 USD za 1000 tokenów do wysyłania tekstu.

Dla porównania, podstawowy model 4K GPT-3.5 Turbo kosztuje 0,0015 USD za 1000 tokenów wejściowych i 0,002 USD za 1000 tokenów wyjściowych, zatem dopracowany model jest około osiem razy droższy w obsłudze. I chociaż model kontekstowy 8 tys. tokenów GPT-4 jest również tańszy i wynosi 0,03 USD za 1 tys. tokenów wejściowych i 0,06 USD za 1 tys. tokenów wyjściowych, OpenAI nadal twierdzi, że pieniądze można zaoszczędzić dzięki zmniejszonej potrzebie podpowiedzi w dopracowanym modelu. Jest to naciągane, ale w wąskich przypadkach może mieć zastosowanie.

Nawet przy wyższych kosztach nauczenie GPT-3.5 o niestandardowych dokumentach może być warte swojej ceny dla niektórych osób – jeśli uda ci się powstrzymać modela od zmyślania na ten temat. Dostosowywanie to jedno, ale zaufanie do dokładności i niezawodności wyjść GPT-3.5 Turbo w środowisku produkcyjnym to zupełnie inna sprawa. GPT-3.5 jest dobrze znany ze swojej tendencji do konfabulacji informacji.

Jeśli chodzi o prywatność danych , OpenAI zauważa, że podobnie jak w przypadku wszystkich interfejsów API, dane wysyłane do i z interfejsu API dostrajania nie są wykorzystywane przez OpenAI (ani kogokolwiek innego) do uczenia modeli sztucznej inteligencji. Co ciekawe, OpenAI będzie wysyłać wszystkie dane szkoleniowe klientów dotyczące dostrajania poprzez GPT-4 w celach moderacyjnych, korzystając z niedawno ogłoszonego API moderacji. Może to stanowić część kosztów korzystania z usługi dostrajania.

A jeśli wersja 3.5 nie jest dla Ciebie wystarczająco dobra, OpenAI twierdzi, że poprawki dla GPT-4 nadejdą tej jesieni. Z naszego doświadczenia wynika, że GPT-4 nie zmyśla aż tak bardzo, ale dostrojenie tego modelu (lub podobno 8 modeli współpracujących pod maską) będzie prawdopodobnie znacznie droższe. Musimy zobaczyć, kiedy nadejdzie czas.

Posted on 23 sierpnia, 2023

News

admin

Możesz teraz trenować ChatGPT na własnych dokumentach za pośrednictwem API

Korzystanie z własnych danych wiąże się z kosztami

Dodaj komentarz Anuluj pisanie odpowiedzi

„Project Moohan” to nieunikniony klon Apple Vision Pro firmy Google i Samsung

Zdobądź ten uroczy, mały akumulator Anker za jedyne 23 USD