이제 API를 통해 자신의 문서에 대해 ChatGPT를 교육할 수 있습니다.
화요일에 OpenAI는 API를 통해 ChatGPT 무료 버전을 지원하는 AI 모델인 GPT-3.5 Turbo에 대한 미세 조정을 발표했습니다 . 회사 문서나 프로젝트 문서와 같은 사용자 정의 데이터로 모델을 교육할 수 있습니다. OpenAI는 미세 조정된 모델이 특정 시나리오에서 더 낮은 비용으로 GPT-4만큼 성능을 발휘할 수 있다고 주장합니다.
따라서 기본적으로 미세 조정은 GPT-3.5 Turbo에 프로젝트 문서 또는 기타 서면 참조와 같은 사용자 정의 콘텐츠에 대해 가르칩니다. 이는 귀하의 제품이나 서비스에 대해 잘 알고 있지만 훈련 데이터에 대한 지식이 부족한 GPT-3.5 기반의 AI 도우미를 구축하려는 경우 유용할 수 있습니다. 2021년 9월).
“GPT-3.5 Turbo 출시 이후 개발자와 기업은 사용자에게 독특하고 차별화된 경험을 제공하기 위해 모델을 맞춤 설정할 수 있는 기능을 요청했습니다.”라고 OpenAI는 홍보 블로그에 썼습니다 . “이번 출시를 통해 개발자는 감독된 미세 조정을 실행하여 이 모델이 자신의 사용 사례에 더 잘 작동하도록 만들 수 있습니다.”
GPT-3.5의 더욱 강력한 사촌격인 GPT-4는 다양한 주제에 적응할 수 있는 제너럴리스트로 잘 알려져 있지만 실행 속도가 느리고 비용이 더 많이 듭니다 . OpenAI는 특정 지식 영역에서 더 낮은 비용과 더 빠른 실행 시간으로 GPT-4와 유사한 성능을 얻는 방법으로 3.5 미세 조정을 제안하고 있습니다. “초기 테스트에서는 미세 조정된 GPT-3.5 Turbo 버전이 특정 좁은 작업에서 기본 GPT-4 수준 기능과 일치하거나 심지어 더 나은 성능을 발휘할 수 있는 것으로 나타났습니다.”라고 그들은 썼습니다.

또한 OpenAI는 미세 조정된 모델이 “향상된 조종성”을 제공한다고 말합니다. 이는 지침을 더 잘 따르는 것을 의미합니다. API 호출이나 JSON과 같은 형식으로 텍스트를 일관되게 출력하는 모델의 기능을 향상시키는 “신뢰할 수 있는 출력 형식”; 그리고 맞춤형 취향이나 개성을 챗봇에 적용할 수 있는 “맞춤형 톤”이 있습니다.
OpenAI는 미세 조정을 통해 사용자가 프롬프트를 단축하고 토큰별로 청구되는 OpenAI API 호출에서 비용을 절약할 수 있다고 말합니다. OpenAI는 “초기 테스터는 모델 자체에 지침을 미세 조정하여 프롬프트 크기를 최대 90%까지 줄였습니다.”라고 말합니다. 현재 미세 조정을 위한 컨텍스트 길이는 4K 토큰으로 설정되어 있지만 OpenAI는 미세 조정이 “올 가을 후반에” 16k 토큰 모델 로 확장될 것이라고 말합니다.
자신의 데이터를 사용하면 비용이 발생합니다.
지금쯤이면 자신의 데이터를 사용하여 GPT-3.5를 훈련하는 방법과 비용이 궁금할 것입니다. OpenAI는 블로그에서 API를 사용하여 시스템 프롬프트를 설정하고, 훈련을 위해 OpenAI에 파일을 업로드하고, API 웹 주소를 쿼리하기 위해 명령줄 도구 컬을 사용하여 미세 조정 작업을 생성하는 과정을 보여주는 단순화된 프로세스를 제시합니다 . OpenAI는 미세 조정 프로세스가 완료되면 기본 모델과 동일한 속도 제한으로 맞춤형 모델을 즉시 사용할 수 있다고 말합니다. 자세한 내용은 OpenAI의 공식 문서 에서 확인할 수 있습니다 .
물론 이 모든 것에는 대가가 따르며 교육 비용과 사용 비용으로 나뉩니다. GPT-3.5 교육 비용은 토큰 1,000개당 $0.008입니다. 사용 단계에서 API 액세스 비용은 텍스트 입력의 경우 토큰 1,000개당 $0.012, 텍스트 출력의 경우 토큰 1,000개당 $0.016입니다.
이에 비해 기본 4K GPT-3.5 Turbo 모델의 비용은 1,000개 토큰 입력당 0.0015달러, 1,000개 토큰 출력당 0.002달러이므로 미세 조정된 모델의 실행 비용은 약 8배 더 비쌉니다. GPT-4의 8K 컨텍스트 모델은 1K 토큰 입력당 0.03달러, 1K 토큰 출력당 0.06달러로 더 저렴하지만 OpenAI는 여전히 미세 조정 모델에서 메시지를 표시할 필요성이 줄어들기 때문에 비용을 절약할 수 있다고 주장합니다. 스트레칭이지만 좁은 경우에는 적용될 수 있습니다.
더 높은 비용이 들더라도 사용자 정의 문서에 대해 GPT-3.5를 가르치는 것은 모델이 이에 대해 내용을 작성하지 못하도록 할 수 있다면 일부 사람들에게는 그만한 가치가 있을 수 있습니다. 커스터마이징은 하나의 문제이지만 프로덕션 환경에서 GPT-3.5 Turbo 출력의 정확성과 신뢰성을 신뢰하는 것은 완전히 다른 문제입니다. GPT-3.5는 정보를 조작하는 경향으로 잘 알려져 있습니다.
데이터 개인 정보 보호와 관련하여 OpenAI는 모든 API와 마찬가지로 미세 조정 API로 전송된 데이터가 OpenAI(또는 다른 사람)에서 AI 모델을 훈련하는 데 사용되지 않는다는 점에 주목합니다. 흥미롭게도 OpenAI는 최근 발표된 조정 API 를 사용하여 조정 목적으로 모든 고객에게 GPT-4를 통해 미세 조정 교육 데이터를 보낼 예정입니다 . 이는 미세 조정 서비스 이용에 따른 비용 중 일부를 차지할 수 있습니다.
그리고 3.5가 충분하지 않다면 OpenAI는 올 가을에 GPT-4에 대한 미세 조정이 이루어질 것이라고 말합니다. 우리의 경험에 따르면 GPT-4는 그다지 많은 것을 만들어내지는 않지만 해당 모델(또는 내부적으로 함께 작동하는 소문난 8개 모델 )을 미세 조정하는 데는 훨씬 더 많은 비용이 소요될 가능성이 높습니다. 때가 되면 지켜봐야겠습니다.
답글 남기기