← AI 百科

Rate limit限流报错

报错库 ·
一句话:接口调用太频繁或额度不足时出现的限流报错,常见于AI API、短信、邮件和第三方服务。

它是什么

Rate limit 是服务商为了保护系统和控制资源,对单位时间内请求次数、并发数或Token数量做的限制。超过限制后,接口会返回限流错误,需要降低频率、排队重试或升级额度。

适合干什么

  • 调用AI API的人
  • 做批量生成内容的人
  • 开发自动化脚本的人
  • 遇到429报错的新手

不适合干什么

  • 代码语法错误
  • 账号密码错误
  • 服务器完全无法联网

普通人怎么用

  • 查看报错里是否有429或rate limit字样
  • 降低请求频率
  • 减少一次请求的内容长度
  • 等待一段时间再重试
  • 检查账号额度和套餐限制

进阶用户怎么用

  • 加入指数退避重试
  • 做任务队列控制并发
  • 缓存重复请求结果
  • 按模型或服务拆分调用压力

常见误区

  • 失败后立刻疯狂重试,导致更严重限流
  • 多线程并发太高
  • 没有读取响应头里的限制信息
  • 把限流误认为模型坏了

和相似工具的区别

  • Rate limit vs Quota exceeded:
  • Rate limit vs Timeout:

入门步骤

  • 确认错误码
  • 降低频率
  • 减少并发
  • 增加重试间隔
  • 检查额度
  • 必要时升级套餐或换模型

推荐工具(第三方)

OpenAI API、Claude API、Postman、Redis、BullMQ