百 AI 实战百科

Rate limit限流报错

报错库 ·

一句话：接口调用太频繁或额度不足时出现的限流报错，常见于AI API、短信、邮件和第三方服务。

它是什么

Rate limit 是服务商为了保护系统和控制资源，对单位时间内请求次数、并发数或Token数量做的限制。超过限制后，接口会返回限流错误，需要降低频率、排队重试或升级额度。

适合干什么

调用AI API的人
做批量生成内容的人
开发自动化脚本的人
遇到429报错的新手

不适合干什么

代码语法错误
账号密码错误
服务器完全无法联网

普通人怎么用

查看报错里是否有429或rate limit字样
降低请求频率
减少一次请求的内容长度
等待一段时间再重试
检查账号额度和套餐限制

进阶用户怎么用

加入指数退避重试
做任务队列控制并发
缓存重复请求结果
按模型或服务拆分调用压力

常见误区

失败后立刻疯狂重试，导致更严重限流
多线程并发太高
没有读取响应头里的限制信息
把限流误认为模型坏了

和相似工具的区别

Rate limit vs Quota exceeded：
Rate limit vs Timeout：

入门步骤

确认错误码
降低频率
减少并发
增加重试间隔
检查额度
必要时升级套餐或换模型

推荐工具（第三方）

OpenAI API、Claude API、Postman、Redis、BullMQ