Gemini API的速率限制是Google为了保护服务稳定性和公平分配资源而设置的访问控制机制。不同于简单的"每天X次"限制,Gemini采用了多维度的限制体系,理解这些概念是有效使用API的基础。
- RPM(Requests Per Minute) 是每分钟请求次数限制,这是最直观的指标。无论你的请求内容多长或多短,每次API调用都计为1次请求。如果你的RPM限制是15,那么每分钟最多只能发起15次API调用,超过就会触发429错误。
- TPM(Tokens Per Minute) 是每分钟处理的token数量限制,这个指标更加细腻。Token是语言模型处理文本的基本单位,对于英文大约4个字符等于1个token,中文通常1个汉字占2-3个token。TPM限制意味着即使你的请求次数没超,但如果单次请求的内容太长(输入+输出token总和太大),同样会被限制。实际开发中,TPM往往比RPM更容易触发,因为一次包含长文档的请求可能消耗数万token。
- RPD(Requests Per Day) 是每日请求总数限制,这是一个较长周期的约束。对于Free Tier用户,RPD通常是1500次,意味着即使你严格控制每分钟的请求频率,一天下来的总量也不能超过这个上限。
IPM(Images Per Minute) 是图片生成频率限制,专门针对Gemini的图片生成功能(如gemini-2.5-flash的图片生成能力)。由于图片生成比文本生成消耗更多计算资源,Google对此设置了独立的限制维度。
这四种限制是同时生效的关系,任何一个触发都会导致请求被拒绝。在实际应用中,开发者需要同时监控这四个指标,而不仅仅是其中一个。
