| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | |||
| 5 | 6 | 7 | 8 | 9 | 10 | 11 |
| 12 | 13 | 14 | 15 | 16 | 17 | 18 |
| 19 | 20 | 21 | 22 | 23 | 24 | 25 |
| 26 | 27 | 28 | 29 | 30 |
- react
- API
- backend
- Security
- observability
- database
- Git
- Kubernetes
- frontend
- PostgreSQL
- DevOps
- CI
- timeout
- reliability
- Performance
- Microservices
- NextJS
- Infra
- SRE
- aws
- architecture
- 성능
- Debugging
- web
- JavaScript
- Ops
- HTTP
- CSS
- Operations
- version-control
- Today
- Total
목록timeout (9)
고민보단 실천을
Nginx 리버스 프록시 운영 실전: timeout, buffering, keepalive 설정으로 장애 줄이기Nginx는 잘못 설정해도 당장 티가 안 나다가 트래픽이 몰릴 때 한꺼번에 문제를 드러낸다.중급 운영에서는 timeout, buffering, keepalive를 별개의 튜닝 포인트가 아니라 같은 연결 수명 관리 문제로 봐야 한다.왜 지금 이 주제가 중요한가프록시 timeout과 업스트림 timeout이 어긋나면 재시도 폭주가 쉽게 생긴다.buffering은 느린 클라이언트를 보호해 주지만 디스크 I/O와 메모리 사용을 바꿔 놓는다.keepalive는 성능 레버이지만 과하면 서버와 LB 연결 자원을 잠식한다.핵심 설계 포인트client, proxy, upstream의 timeout 계층을 짧은 ..
Spring Boot Resilience4j 실전: timeout-retry-circuit breaker를 '같이' 설계하는 법재시도는 쉽게 붙이지만, 타임아웃과 서킷 브레이커를 같이 설계하지 않으면 폭주를 만든다.원칙Timeout을 먼저 정한다(상한).Retry는 멱등 요청에만, 횟수는 적게(지터 포함).Circuit Breaker로 계속 실패하는 다운스트림을 잠시 격리한다.Bulkhead로 장애 전파를 막는다(격리).설정 예시(application.yml)resilience4j: timelimiter: instances: partnerApi: timeoutDuration: 800ms retry: instances: partnerApi: maxA..
HTTP 커넥션 풀/Keep-Alive 실전: 타임아웃, 재사용, 커넥션 누수로 장애 나는 패턴의외로 HTTP 커넥션(keep-alive/풀) 때문에 장애가 나는 경우가 많다. 풀 고갈/누수/타임아웃을 운영 관점에서 정리한다.OkHttp 설정 예시val client = OkHttpClient.Builder() .connectTimeout(300, TimeUnit.MILLISECONDS) .readTimeout(800, TimeUnit.MILLISECONDS) .callTimeout(1000, TimeUnit.MILLISECONDS) .connectionPool(ConnectionPool(50, 30, TimeUnit.SECONDS)) .build()커넥션 누수의 전형적인 원인응답 바디를 끝까지 ..
타임아웃 설계 실전: 클라이언트-프록시-서버-DB 타임아웃을 '정렬'하는 방법타임아웃은 짧게가 아니라 '정렬'이 핵심입니다. 레이어마다 제각각이면 장애가 길어집니다.클라이언트/프록시/서버/DB 타임아웃을 어떤 순서로 맞추는지, 재시도 예산까지 포함해 정리합니다.이 글의 목표는 '개념 정리'보다, "어떤 기준으로 결정할지"와 "어떻게 운영에서 사고를 줄일지"를 남기는 것입니다.왜 이게 어려운가(운영 관점)API/HTTP 영역은 '작은 정책'이 전체 사용자 경험과 운영 비용을 바꿉니다. 그래서 실무에서는 구현보다도 기준(정책)과 검증 루프가 중요합니다.특히 프록시/CDN/게이트웨이가 있는 환경에서는 서버 코드만 보면 원인을 놓치기 쉽습니다. 레이어를 같이 정리해두면 같은 장애를 반복하지 않게 됩니다.실전 내..
Kubernetes Ingress 실전: TLS, path rewrite, timeout 설정에서 자주 터지는 문제Ingress는 '라우팅 설정' 같지만, 실제로는 운영 사고의 시작점이 되기 쉽습니다.TLS, rewrite, timeout, body size에서 자주 터지는 포인트를 체크리스트로 정리합니다.이 글의 목표는 '개념 정리'보다, "어떤 기준으로 결정할지"와 "어떻게 운영에서 사고를 줄일지"를 남기는 것입니다.왜 이게 어려운가(운영 관점)운영 이슈는 대부분 한 설정이 아니라 '정렬되지 않은 설정 조합'에서 나옵니다(타임아웃, 종료, 리소스, 재시도).따라서 증상 -> 원인 -> 검증 루틴을 팀 표준으로 만들면, 장애 대응 시간이 크게 줄어듭니다.실전 내용(바로 적용)Ingress는 '라우팅 설..
Nginx 리버스 프록시 튜닝: timeout/buffering/body size로 업/다운로드 안정화목표: 이 글을 읽고 나면 "어떤 선택이 우리 팀에 맞는지"를 기준으로 정할 수 있고, "바로 적용할 체크리스트"를 가져갈 수 있게 만드는 것입니다.전제: 인기 있는 글은 "개념"보다 "결정"과 "실수 방지"에 시간을 씁니다. 그래서 이 글은 설명을 길게 늘리기보다, 기준/예시/검증 순서로 정리합니다.이 글이 필요한 사람배포/운영 중 5xx/타임아웃/리소스 고갈이 간헐적으로 터지는 팀Kubernetes/Nginx/Docker 같은 인프라 설정에서 원인 찾는 시간이 긴 팀장애를 '재현/측정/완화' 순서로 표준화하고 싶은 팀추천 기본값(실무에서 안전한 시작점)시간 예산(타임아웃)과 종료(드레인)를 먼저 정렬..
대용량 파일 다운로드 최적화: Range Request, 스트리밍, 타임아웃 함정목표: 이 글을 읽고 나면 "어떤 선택이 우리 팀에 맞는지"를 기준으로 정할 수 있고, "바로 적용할 체크리스트"를 가져갈 수 있게 만드는 것입니다.전제: 인기 있는 글은 "개념"보다 "결정"과 "실수 방지"에 시간을 씁니다. 그래서 이 글은 설명을 길게 늘리기보다, 기준/예시/검증 순서로 정리합니다.이 글이 필요한 사람API 계약이 자주 깨져서(혹은 깨질까봐) 변경을 두려워하는 팀성능/운영 이슈가 나는데 원인이 '네트워크/헤더/캐시/정책' 쪽인지 헷갈리는 상황문서를 '참고'가 아니라 '계약'으로 쓰고 싶은 팀추천 기본값(실무에서 안전한 시작점)정책(기준)을 먼저 정하고, 구현/도구는 그 다음에 선택한다관측(로그/지표)을 먼..
gRPC 실전 가이드: Protobuf, Deadline, Retry, Streaming 설계 포인트목표: 이 글을 읽고 나면 "어떤 선택이 우리 팀에 맞는지"를 기준으로 정할 수 있고, "바로 적용할 체크리스트"를 가져갈 수 있게 만드는 것입니다.전제: 인기 있는 글은 "개념"보다 "결정"과 "실수 방지"에 시간을 씁니다. 그래서 이 글은 설명을 길게 늘리기보다, 기준/예시/검증 순서로 정리합니다.이 글이 필요한 사람API 계약이 자주 깨져서(혹은 깨질까봐) 변경을 두려워하는 팀성능/운영 이슈가 나는데 원인이 '네트워크/헤더/캐시/정책' 쪽인지 헷갈리는 상황문서를 '참고'가 아니라 '계약'으로 쓰고 싶은 팀추천 기본값(실무에서 안전한 시작점)정책(기준)을 먼저 정하고, 구현/도구는 그 다음에 선택한다관..
PostgreSQL 커넥션 고갈 디버깅: HikariCP pool size 계산과 timeout 튜닝커넥션 고갈은 SQL을 AI에 물어봐도 해결되지 않는 운영 이슈입니다. 풀을 키우기 전에 '점유 시간이 긴 쿼리/트랜잭션'을 먼저 확인해야 합니다. 이 글은 HikariCP 설정과 디버깅 포인트를 정리합니다.풀은 제한된 커넥션을 큐잉합니다. 설정과 쿼리 시간이 함께 중요합니다.옵션/핵심 요소(3~6개)항목의미언제 쓰는지(실무 상황)maximumPoolSize최대 커넥션DB max connections와 인스턴스 수로 계산connectionTimeout대기 한도고갈 시 빠르게 실패시켜 전파 통제leakDetectionThreshold누수 감지반납 누락 추적slow query점유 시간긴 쿼리/트랜잭션이 풀을 ..
