Cómo solicitar aumentos de cuota para Amazon Bedrock (y que te los aprueben)
Estás viendo errores como estos en tu app: ThrottlingException: Too many requests, please wait before trying again. El problema son las cuotas de Bedrock: RPM (requests por minuto) o TPM (tokens po...

Source: DEV Community
Estás viendo errores como estos en tu app: ThrottlingException: Too many requests, please wait before trying again. El problema son las cuotas de Bedrock: RPM (requests por minuto) o TPM (tokens por minuto). La solución es solicitar un aumento. En esta guía vas a encontrar el proceso completo: cómo revisar tus límites actuales, qué métricas sacar de CloudWatch, y una plantilla lista para pegar en el Support Center. Tiempos: AWS Support tiene un SLA de 48 horas, pero abre el caso con al menos 72 horas de antelación. No improvises cuando ya estás en producción. Idioma: Escribe el caso en inglés. Se resuelve más rápido. La plantilla al final ya está en inglés. Paso 1: Revisa tus cuotas actuales Ve a AWS Console → Service Quotas → AWS Services → Amazon Bedrock. Busca tu modelo y revisa los valores de RPM y TPM aplicados. Si la cuota fue aumentada antes, verás el valor real, no el default de AWS. También puedes ver si ya tienes una solicitud en vuelo en la pestaña Pending quota requests. Pa