통합 모델 API

하나의 플랫폼으로
주요 모델을 호출하세요.

TokenFleet은 Anthropic, OpenAI, Google, DeepSeek 등 프로덕션 LLM 모델을 통합합니다: 36 개 모델을 하나의 API 키, 하나의 청구서, 안정적인 연결로 사용할 수 있습니다.


          # 같은 요청 본문에서 base_url만 바꾸면 연결됩니다
curl https://tokenfleet.ai/v1/chat/completions \
  -H "Authorization: Bearer $TOKENFLEET_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "claude-opus-4-7",
    "messages": [{"role": "user", "content": "RAG를 한 문장으로 설명해 주세요."}]
  }'
        

연결된 주요 모델

  • Anthropic Claude
  • OpenAI
  • Google Gemini
  • DeepSeek
  • Kimi · Moonshot
  • MiniMax
TokenFleet 제품군

하나의 엔드포인트로 모든 모델에 연결.

PRODUCT 01

통합 API 게이트웨이

프로덕션 모델을 하나의 API 게이트웨이 뒤에 통합합니다. 하나의 API 키로 여러 벤더의 모델에 바로 연결할 수 있습니다.

  • 통합 엔드포인트와 API 키
  • 하나의 계정, 정산, 청구서
  • 안정적인 저지연 연결
지원 모델 보기
TokenFleet을 선택하는 이유

TokenFleet을 선택하는 이유.

형용사가 아니라 검증 가능한 네 가지 기능입니다.

A

36개 프로덕션 모델, 하나의 엔드포인트

LLM, 이미지, 비디오, 오디오 호출을 하나의 API 게이트웨이에서 실행, 계량, 정산합니다.

  • claude-opus-4-7 Anthropic
  • claude-sonnet-4.6 Anthropic
  • claude-haiku-4.5 Anthropic
  • gpt-5.5 OpenAI
  • gpt-5.4 OpenAI
  • gpt-5.3-codex OpenAI
  • gemini-3-pro-preview Google
  • gemini-3.5-flash Google
  • DeepSeek-V3.2 DeepSeek
  • kimi-k2.6 Moonshot
  • kimi-k2.5 Moonshot
  • MiniMax-M2.5 MiniMax
+24 더 많은 프로덕션 모델
B

프라이빗 배포 / VPC 직접 연결

대규모 사용 시 트래픽이 사설 네트워크 경계를 벗어나지 않도록 VPC 엔드포인트를 요청할 수 있습니다.

peering
cn-shanghai-2 · cn-beijing-1
encryption
TLS 1.3 + mTLS
egress
프라이빗 경로만 사용
C

통합 엔드포인트 연동

하나의 API 키로 여러 모델 제공자를 호출하면서 연동 경로와 사용 기록을 일관되게 유지합니다.

 base_url="https://api.openai.com/v1"
+ base_url="https://tokenfleet.ai/v1"

월간 토큰 사용량, 오류율, 모델 구성은 하나의 콘솔에서 확인할 수 있습니다.

D

안정적인 저지연 라우팅

5개 도시의 첫 토큰까지 평균 시간(P50), 실제 프로덕션 샘플 기준입니다.

도시 P50 0 800ms
베이징 142 ms
상하이 128 ms
광저우 156 ms
선전 149 ms
항저우 134 ms
해외 직접 연결 ≥ 800ms

샘플 기간 2026-04 · 상태 보기

프로덕션 규모용

대규모 프로덕션 사용량을 위해 구축.

토큰 사용량이 셀프서비스 범위를 넘어서면 엔지니어링 팀과 직접 협업해 단일 진입 연동, 용량 계획, 전용 라우팅, 맞춤 조건을 설계합니다.

  1. SLA

    엔터프라이즈 SLA

    사용량 등급과 팀 규모에 맞춰 약정을 조정하고 월별 정산을 지원합니다.

  2. VPC

    프라이빗 배포 / VPC 직접 연결

    요청을 사설 네트워크 경계 안에 유지할 수 있습니다. 최종 형태는 규모에 따라 결정됩니다.

  3. SUPPORT

    전담 기술 담당자

    중국어 엔지니어링 지원 채널로 장애에 1차 대응합니다.

TokenFleet 영업 문의

TokenFleet WeChat 그룹 QR 코드

WeChat 그룹에 참여해 엔터프라이즈 사용량과 연동 지원을 받아보세요.

보통 24시간 이내 회신 · baynexusai@gmail.com