Evose

速率限制

默认配额 · 头信息 · 退避算法

防止滥用 + 保护底层模型。

默认配额

资源限制
API 整体每 API Key 每秒 20 请求
Agent chat每 user_id 每秒 5 请求
Workflow run每 API Key 每秒 10 触发
知识库 upload每 API Key 每分钟 60 文档
管理类(create / delete)每 API Key 每秒 2 请求

私有化下可调整

私有化部署可在 .env 中调整全局速率上限。

响应头

每个响应都含速率限制状态:

X-RateLimit-Limit: 20
X-RateLimit-Remaining: 18
X-RateLimit-Reset: 1715154000
含义
X-RateLimit-Limit当前窗口的总额
X-RateLimit-Remaining剩余额度
X-RateLimit-Reset重置时间(Unix 秒)

超限响应

HTTP/1.1 429 Too Many Requests
Retry-After: 1
{
  "error": {
    "code": "RATE_LIMITED",
    "message": "Rate limit exceeded. Retry after 1 second."
  }
}

推荐退避算法

attempt 1 → 立即
attempt 2 → 1s
attempt 3 → 2s
attempt 4 → 4s
attempt 5 → 8s
放弃

Retry-After 时遵守该值,否则用上面默认。

高并发场景

如果你的业务需要更高并发:

  1. 联系商务申请提升配额
  2. 私有化部署不受 SaaS 配额限制
  3. 设计层面:用 Webhook + 异步,而非密集轮询

接下来

页面导航