Evose
集成

集成 · 模型供应商

SaaS API · 自部署 · OpenAI 兼容 · 路由策略

把模型供应商接入 Evose。三大类:SaaS API自部署OpenAI 兼容

三大类接入

类别例子接入位置
SaaS APIOpenAI · Anthropic · Google · 阿里 · 腾讯 · 字节 · Azure接口平台
自部署Llama · Qwen · DeepSeek · Mistral 自部署模型部署
OpenAI 兼容任何遵守 OpenAI API 格式的服务接口平台(选 OpenAI 兼容供应商)

OpenAI

标准接入

平台名:OpenAI 美西
供应商:OpenAI
Base URL:https://api.openai.com/v1
API Keys:
  - sk-xxx(描述: 主 Key,权重: 1)
  - sk-yyy(描述: 备 Key,权重: 1)

注册模型:

模型: gpt-4-turbo / gpt-4o / gpt-4o-mini / text-embedding-3-large / ...

Anthropic Claude

平台名:Anthropic
供应商:Anthropic
Base URL:https://api.anthropic.com/v1
API Keys:sk-ant-xxx
模型:claude-sonnet-4-6 / claude-opus-4-7 / claude-haiku-4-5

Azure OpenAI

平台名:Azure OpenAI 中国东
供应商:Azure
Base URL:https://<your-resource>.openai.azure.com/openai
API Keys:<azure-key>
API Version:2024-06-01
模型:gpt-4-turbo(对应 Azure deployment 名称)

阿里云通义

平台名:阿里云通义
供应商:OpenAI 兼容
Base URL:https://dashscope.aliyuncs.com/compatible-mode/v1
API Keys:sk-xxx
模型:qwen-max / qwen-plus / qwen-turbo / text-embedding-v3

自部署 Llama / Qwen / DeepSeek

通过 模型部署:

模型: deepseek-v3
部署:
  实例 1: 10.0.0.5:8000 (副本 4, GPU 4×A100)
  实例 2: 10.0.0.6:8000 (副本 4, GPU 4×A100)
策略: Round Robin
健康检查: 每 30s

推理引擎

Evose 调用走 OpenAI 兼容协议。推理引擎可选 vLLM / TGI / SGLang / LMDeploy 等。

多供应商 Failover

把同一逻辑模型注册到多个平台:

模型 gpt-4-turbo:
  → OpenAI(优先级 1)
  → Azure(优先级 2,SaaS 挂了上)
  → 自部署 OpenAI 兼容(优先级 3,全部 SaaS 挂了上)

接口平台 · 路由

凭据管理

所有 API Key 都应该在 凭据 注册,字段级加密。

私有化下的成本归因

私有化无平台计费,但可在 Evose 内部归因:

[模型] 配单 token 成本(根据自家与供应商合同):
  gpt-4-turbo: in 0.01 / 1k token, out 0.03 / 1k token
[使用] Workflow 执行后,自动按 token × 单价计费
[报表] 在 [可观测性] 看每个 Workspace / 用户 / Agent 的成本

反模式

  • 把生产 Key 给所有空间共用 — 按空间 / 项目分配独立 Key
  • 不配 Failover — 单 SaaS 抖动影响全公司
  • 长上下文模型默认开 128K — 成本飙升,按场景选

接下来

页面导航