Vertex AI 가격 책정

가격은 미국 달러(USD)로 표기됩니다. USD 외의 통화로 지불하는 경우 Cloud Platform SKU에 해당 통화로 표기된 가격이 적용됩니다.

이 페이지에서는 Vertex AI의 생성형 AI 가격 책정을 설명합니다. 다음을 포함한 다른 모든 Vertex AI 가격 책정 ML 플랫폼 및 MLOps 서비스는 Vertex AI 가격 책정 페이지를 참조하세요.

Google 모델

Gemini

Vertex AI의 멀티모달 모델을 사용하면 텍스트나 미디어 (이미지, 동영상) 텍스트 입력 요금은 1,000자 단위로 입력(프롬프트) 및 1,000자(영문 기준)의 출력(응답)마다 문자는 UTF-8 코드 포인트로 계산되고 공백은 개수에서 제외됩니다. 토큰당 약 4자가 됩니다 Google Cloud의 입력에 대해서만 요금이 청구됩니다 결제 마지막 날 1센트 ($0.01)의 분수는 1센트로 반올림됩니다. Media 입력 이미지 또는 초당 (동영상) 단위로 요금이 청구됩니다

모델	기능	유형	가격 ( 컨텍스트 기간 128,000개 미만)	가격 (컨텍스트 기간 128,000개 초과)
Gemini 1.5 Flash	멀티모달	이미지 입력 비디오 입력 텍스트 입력 오디오 입력	$0.00002 / 이미지 $0.00002 / 초 $0.00001875 / 1,000자(영문 기준) $0.000002 / 초	$0.00004 / 이미지 $0.00004 / 초 $0.0000375 / 1,000자(영문 기준) $0.000004 / 초
Gemini 1.5 Flash		텍스트 출력	$0.000075 / 1,000자(영문 기준)	$0.00015 / 1,000자(영문 기준)
Gemini 1.5 Pro도	멀티모달	이미지 입력 비디오 입력 텍스트 입력 오디오 입력	$0.001315 / 이미지 $0.001315 / 초 $0.00125 / 1,000자(영문 기준) $0.000125 / 초	$0.00263 / 이미지 $0.00263 / 초 $0.0025 / 1,000자(영문 기준) $0.00025 / 초
Gemini 1.5 Pro도		텍스트 출력	$0.00375 / 1,000자(영문 기준)	$0.0075 / 1,000자(영문 기준)
Gemini 1.0 Pro	멀티모달	이미지 입력 동영상 입력 텍스트 입력	$0.0025/이미지 $0.002/초 $0.000125/1,000자
Gemini 1.0 Pro		텍스트 출력	$0.000375/1000자
Google 검색으로 그라운딩	텍스트	그라운딩 요청	요청 1,000회당 $35 (일일 최대 100만 개 요청) 더 필요한 경우 계정팀에 문의하세요. 요청 수 100만 회 이상

* 가격은 미국 달러 (USD)로 표기됩니다. USD 외의 통화로 지불하는 경우 해당 통화로 표기된 가격은 Cloud Platform SKU 적용됩니다.
* 쿼리 컨텍스트가 128K를 초과하면 모든 토큰에 긴 컨텍스트 요율로 요금이 청구됩니다.
* Gemini 모델은 배치 모드로 50% 할인된 가격으로 제공됩니다.
* Gemini 1.0 Pro는 최대 32,000개의 컨텍스트 윈도우만 지원합니다.
* PDF는 이미지 입력으로 청구되며, 하나의 PDF 페이지는 이미지 1개에 해당합니다.

Imagen

Vertex AI의 Imagen을 사용하면 새로운 이미지를 생성하고 사용자가 제공하는 텍스트 프롬프트를 기반으로 이미지를 편집하거나, 다른 여러 기능과 함께 정의한 마스크 영역을 사용하여 이미지의 일부만 편집할 수 있습니다.

모델	기능	Description(설명)	입력	출력	가격
Imagen 3	이미지 생성	이미지 생성	텍스트 프롬프트	이미지	이미지당 $0.04
Imagen 3 빠른 속도	이미지 생성	이미지 생성	텍스트 프롬프트	이미지	이미지당 $0.02
Imagen 2, Imagen	이미지 생성	이미지 생성	텍스트 프롬프트	이미지	이미지당 $0.020
	이미지 수정	마스크 없음 또는 마스크 방식을 사용하여 이미지 수정	이미지/텍스트 프롬프트	이미지	이미지당 $0.020
	업스케일링	생성된 이미지의 해상도를 2K 및 4K로 늘리기	이미지	이미지	이미지당 $0.003
	미세 조정	사용자가 제공한 '주제'를 Imagen 프롬프트(몇 장의 샷 학습)에서 사용하도록 사용 설정	텍스트 식별자와 주제당 4~8개의 이미지가 포함된 주제	미세 조정된 모델(사용자 제공 주제로 학습한 후)	노드 시간당 $(Vertex AI 커스텀 학습 가격 책정)
	시각적 캡셔닝	이미지의 짧은 텍스트 또는 긴 텍스트 설명 생성	이미지	텍스트 캡션	$0.0015/이미지
	시각적 질의 응답	이미지를 참조하는 질문을 기반으로 답변 제공	이미지/텍스트 프롬프트	텍스트 답변	$0.0015/이미지

가격은 미국 달러(USD)로 표기됩니다. USD 외의 통화로 지불하는 경우 Cloud Platform SKU에 해당 통화로 표기된 가격이 적용됩니다.

임베딩

모델	기능	Description(설명)	입력	출력	가격
멀티모달 임베딩	멀티모달용 임베딩: 텍스트	텍스트를 입력으로 사용하여 임베딩 생성	텍스트	임베딩	$0.0002 / 1,000자(영문 기준) 입력
	멀티모달용 임베딩: 이미지	이미지를 입력으로 사용하여 임베딩 생성	이미지	임베딩	$0.0001 / 이미지 입력
	멀티모달을 위한 임베딩: Video Plus	Video Plus	동영상	임베딩(동영상 분당 최대 15개의 임베딩)	동영상 초당 $0.0020
	멀티모달을 위한 임베딩: 동영상 표준	Video Standard	동영상	임베딩(동영상 분당 최대 8개의 임베딩)	동영상 초당 $0.0010
	멀티모달을 위한 임베딩: 필수 동영상	Video Essential	동영상	임베딩(동영상 분당 최대 4개의 임베딩)	동영상 초당 $0.0005

모델	유형	리전	1,000자당 가격
텍스트용 임베딩	입력	전역	온라인 요청: $0.000025 일괄 요청: $0.00002
텍스트용 임베딩	출력	글로벌	온라인 요청: 무료 일괄 요청: 무료

가격은 미국 달러(USD)로 표기됩니다. USD 외의 통화로 지불하는 경우 Cloud Platform SKU에 해당 통화로 표기된 가격이 적용됩니다.

코드 완성

Vertex AI의 생성형 AI는 입력(프롬프트) 1,000자마다, 출력(응답) 문자 1,000자마다 요금이 부과됩니다. 문자는 UTF-8 코드 포인트로 계산되며 화이트 스페이스는 개수에서 제외됩니다. 프리뷰 기간 중 요금은 100% 할인됩니다. 필터링된 것으로 이어지는 예측 요청 입력에 대해서만 요금이 청구됩니다 결제 주기가 끝날 때마다 1센트 ($0.01)의 분수는 1센트로 반올림됩니다.

모델	유형	리전	1,000자당 가격
코드 완성용 Codey	입력	글로벌	온라인 요청: $0.00025
코드 완성용 Codey	출력	글로벌	온라인 요청: $0.0005

가격은 미국 달러(USD)로 표기됩니다. USD 외의 통화로 지불하는 경우 Cloud Platform SKU에 해당 통화로 표기된 가격이 적용됩니다.

번역 (텍스트)

Vertex AI API와 번역 LLM을 사용하여 텍스트를 번역합니다. LLM 번역은 기존 번역 모델보다 유창하고 사람이 말하는 것처럼 느껴지는 경향이 있지만, 언어 지원이 제한됩니다(자세히 알아보기).

모델	메서드	사용	백만 자당 가격
LLM	텍스트 번역 (미리보기)^*	월별 입력 문자 수	백만 자당 $10^*
	텍스트 번역 (미리보기)^*	월별 출력 문자 수	백만 자당 $10^*

가격은 미국 달러(USD)로 표기됩니다. USD 외의 통화로 지불하는 경우 해당 통화로 표기된 가격은 Cloud Platform SKU 적용됩니다. 를 통해 개인정보처리방침을 정의할 수 있습니다.
^*가격은 모델이 처리하는 문자 기준으로 책정됩니다. 문자 수에 대한 자세한 내용은 청구 대상 문자를 참고하세요.

컨텍스트 캐싱

컨텍스트 캐싱을 사용하면 Gemini 입력 토큰 처리 비용을 절감할 수 있습니다. 콘텐츠의 컨텍스트 부분을 캐시하여 콘텐츠 생성의 지연 시간을 Gemini 모델에 텍스트나 미디어를 입력합니다 데이터가 제어될 수 있는 캐시는 '컨텍스트 캐시'를 Storage는 있습니다. 캐시된 컨텍스트를 만들면 사용자에게 표준 입력 토큰 비용이 청구됩니다. 입력 데이터의 캐시 적중에는 일반적인 입력 비용 대신 할인된 요율('캐시된 입력')이 청구됩니다. 두 가지 모두의 데이터 크기 스토리지 및 입력은 Gemini 입력 가격과 동일한 방식으로 계산됩니다.

모델	기능	유형	가격 ( 128,000개 미만의 컨텍스트 윈도우)	가격( 128,000개 이상의 컨텍스트 윈도우)
Gemini 1.5 Flash	캐시된 입력	이미지 입력 비디오 입력 텍스트 입력 오디오 입력	0.000005 / 이미지 0.000005 / 초 0.0000046875 / 1,000자(영문 기준) 0.0000005 / 초	0.00001 / 이미지 0.00001 / 초 0.000009375 / 1,000자(영문 기준) 0.000001 / 초
Gemini 1.5 Flash	컨텍스트 캐시 스토리지	이미지 입력 비디오 입력 텍스트 입력 오디오 입력	0.000263 / 이미지 / 시간 0.000263/ 초 / 시간 0.00025 / 1,000자 / 시간 0.000025 / 초 / 시간
Gemini 1.5 Pro도	캐시된 입력	이미지 입력 비디오 입력 텍스트 입력 오디오 입력	0.00032875 / 이미지 0.00032875 / 초 0.0003125 / 1,000자(영문 기준) 0.00003125 / 초	0.0006575 / 이미지 0.0006575 / 초 0.000625 / 1,000자(영문 기준) 0.0000625 / 초
Gemini 1.5 Pro도	컨텍스트 캐시 스토리지	이미지 입력 비디오 입력 텍스트 입력 오디오 입력	0.0011835 / 이미지 / 시간 0.0011835/ 초 / 시간 0.001125 / 1,000자(영문 기준)/시간 0.0001125 / 초 / 시간

가격은 미국 달러(USD)로 표기됩니다. USD 외의 통화로 지불하는 경우 Cloud Platform SKU에 해당 통화로 표기된 가격이 적용됩니다.

캐시된 비용 계산의 예

사용자가 2시간의 TTL로 250,000자(영문 기준)의 캐시된 컨텍스트를 생성한 후 이 2시간 동안 Gemini 1.5 Pro 모델에 20개의 개별 요청을 보내고 각 요청에 캐시된 컨텍스트에 200자(영문 기준) 쿼리가 추가되고 400자(영문 기준) 출력에 추가된 경우 총 요금은 다음과 같이 계산됩니다.

Cache Creation cost:
250,000 input characters x ($0.00125 / 1000) = $0.3125 input cost.

Cache Storage cost:
250,000 characters x 2 hours = 500,000 total character hours;
500,000 total character hours x ($0.001125 / 1000) = $0.5625 storage cost.

Requests using cache cost:
200 characters x 20 requests = 4,000 total character inputs
250,000 cached characters * 20 requests = 5,000,000 total cached chacater inputs
2,000 total character inputs * ($0.00125 / 1000) = $.0025 character input cost

5,000,000 total cached character inputs * ($0.0003125 / 1000) = $1.5625 cached input cost
$.0025 chacater input cost + $1.5625 cached input cost = $1.565 total input cost

Output cost:
400 output characters x 20 prompts = 8,000 total output characters;
8,000 total output characters x ($0.00375 / 1000) = $0.03 output cost.

Total cost:
.3125 cached input cost + 0.5625 cached storage cost + $1.565 input cost + $0.03 output cost = $2.47 total cost.

비용 계산 예시

사용자가 PaLM Text Bison 모델에 5개의 개별 요청을 전송하고 각 요청의 입력 값이 200자(영문 기준)이고 출력 값이 400자(영문 기준)인 경우 총 요금은 다음과 같이 계산됩니다.

Input cost:
200 input characters x 5 prompts = 1,000 total input characters;
1,000 total input characters x ($0.00025 / 1000) = $0.00025 input cost.

Output cost:
400 output characters x 5 prompts = 2,000 total output characters;
2,000 total output characters x ($0.0005 / 1000) = $0.001 output cost.

Total cost:
$0.00025 input cost + $0.001 output cost = $0.00125 total cost.

파트너 모델

파트너 모델은 Google Cloud에서 개발한 생성형 AI 모델을 Google 파트너 파트너 모델은 관리형 API로 제공됩니다. 자세한 내용은 자세한 내용은 파트너 모델 개요 다음 표에는 Google 파트너 모델의 가격 책정 세부정보가 나와 있습니다.

Anthropic의 Claude 모델

모델	가격 책정
Claude 3.5 Sonnet	입력: 토큰 백만 개당 $3 출력: 토큰 백만 개당 $15
Claude 3 Opus	입력: 토큰 100만 개당 $15 출력: 토큰 백만 개당 $75
Claude 3 Haiku	입력: 토큰 백만 개당 $0.25 출력: 토큰 백만 개당 $1.25
Claude 3 Sonnet	입력: 토큰 백만 개당 $3 출력: 토큰 백만 개당 $15

Mistral AI의 모델

모델	가격 책정
Mistral Large (2407)	입력: 토큰 백만 개당 $3 출력: 토큰 백만 개당 $9
미스트랄 네모	입력: 토큰 백만 개당 $0.30 출력: 토큰 백만 개당 $0.30
Codestral	입력: 토큰 백만 개당 $1 출력: 토큰 백만 개당 $3

커스텀 견적 요청

Google Cloud의 사용한 만큼만 지불하는 가격 책정 방식을 사용하면 사용한 서비스에 대한 요금만 지불하면 됩니다. 영업팀에 문의하여 조직에 대한 커스텀 견적을 받아 보세요.

영업팀에 문의