Skip to content

配额限制

大模型开放平台的 API 请求会按 credits 统一计量和限制。不同能力的 credits 扣减规则不同,对话模型按 token 计费,向量、重排、图像生成和语音能力按调用次数计费。

新的配额算法将于 2026 年 6 月 1 日正式生效,配额查询后台同步开放。

默认配额

当前用户的个人令牌默认配额如下所示。多个模型和能力共享同一 credits 配额。

配额说明
每 5 小时2000 credits
每天5000 credits
每月50000 credits

分钟级限流已取消,当前按 5 小时、每天和每月配额进行统一限制。短时间内的异常高频请求仍可能触发服务保护策略。

credits 余额查询

如需查看当前 credits 余额,可登录 ChatECNU,点击左侧“开放平台”入口查看。

额度等价 token 估算

为便于直观理解,可以将 credits 配额粗略折算为可使用的 token 规模。由于输入 token 和输出 token 的单价不同,以下提供两种估算口径:

  • 仅按输入 token 折算:适合看理论上限。
  • 按输入:输出 = 4:1 折算:更接近日常对话、问答和代码助手场景。
配额ecnu-plus 仅输入估算ecnu-plus 4:1 混合估算ecnu-max 仅输入估算ecnu-max 4:1 混合估算
每 5 小时 2000 credits约 2000 万输入 tokens约 1250 万总 tokens约 667 万输入 tokens约 417 万总 tokens
每天 5000 credits约 5000 万输入 tokens约 3125 万总 tokens约 1667 万输入 tokens约 1042 万总 tokens
每月 50000 credits约 5 亿输入 tokens约 3.125 亿总 tokens约 1.67 亿输入 tokens约 1.04 亿总 tokens

对于长文档处理、代码库分析、知识库检索增强等偏输入场景,实际可覆盖的 token 规模通常会更接近“仅输入估算”这一列。

计算口径

  • LLM 模型按 token 计费,区分输入 token 和输出 token。
  • 非 LLM 能力继续按调用次数固定扣减 credits。

模型 Credits 计算表

模型计费方式输入单价输出/思考单价credits 计算公式备注
ecnu-plus按 token100 credits / 1M tokens400 credits / 1M tokensinput_tokens / 1,000,000 * 100 + output_tokens / 1,000,000 * 400标准对话,基准模型
ecnu-max按 token300 credits / 1M tokens1200 credits / 1M tokensinput_tokens / 1,000,000 * 300 + output_tokens / 1,000,000 * 1200旗舰对话,ecnu-plus 的 3 倍
ecnu-embedding-small按次--调用次数 * 0.050.05 credits / 次
ecnu-rerank按次--调用次数 * 0.10.1 credits / 次
ecnu-image按次--成功生成次数 * 3030 credits / 次
ecnu-tts按次--调用次数 * 55 credits / 次

样例测算

请求规模ecnu-plus 扣减ecnu-max 扣减
1,500 输入 + 800 输出0.47 credits1.41 credits
10k 输入 + 2k 输出1.8 credits5.4 credits
100k 输入 + 2k 输出10.8 credits32.4 credits
500k 输入 + 5k 输出52 credits156 credits
1M 输入 + 10k 输出104 credits312 credits

独立配额池与联系我们

为校内师生提供服务的生产系统所配套的 API 令牌有独立的配额池,不受上述策略限制。

如果您有更高的速率要求,请与我们联系:dataservice@ecnu.edu.cn