
<aside> 🥰
**안녕하세요?
Site Reliability Engineer**라는 역할에 대해 심도 있는 이야기를 나누었던 재은님을 모시고 다시 한번 이야기를 나누어보았어요! 이번 특집에서는 토스페이먼츠 SRE는 어떤 점이 다른지, 그리고 어떻게 일하는지 재은님께 직접 들어봤습니다.
*아직 릴레이 인터뷰 SRE 특집 1편을 못봤다면? 👉🏻 지금 1편 보러가기
</aside>
<aside> 💬
토스페이먼츠가 빠르게 성장하면서 다양한 상황을 마주하게 되는데요, 이런 환경에서 SRE로 일하면 어떤 점들을 경험할 수 있을까요?”
</aside>
재은님
토스페이먼츠처럼 빠르게 성장하는 회사에서 SRE로 일한다는 건 매일매일 새로운 케이스를 만난다는 거예요. 결제라는 도메인 자체도 복잡한데 성장 속도까지 더해지니까 정말 다양한 상황을 경험할 수 있죠.
보통 SRE는 인프라나 기술적인 장애 해결에만 집중하는 경우가 많아요. 그런데 토스페이먼츠 SRE는 거기서 한 발 더 나아가 ***‘제품 관점’***에서 문제를 바라봐야 해요. 단순히 기술적인 원인만 보는 게 아니라 제품의 맥락이나 가맹점·사용자 경험까지 함께 생각하거든요.
그래서 이곳에서 SRE로 합류하면 단순히 엔지니어링 실력만 키우는 게 아니라 도메인도 깊게 이해하고 기술과 제품을 함께 보는 눈을 기를 수 있어요. 그게 진짜 특별한 경험이죠.
<aside> 💬
토스페이먼츠 SRE는 단순히 기술만 보는 게 아니라 제품까지 함께 본다는 게 인상적인데요, 구체적으로 어떤 방식으로 ‘제품 관점’에서 일하게 되나요?
</aside>
재은님
토스페이먼츠에는 업종도, 고객층도 다른 수많은 가맹점이 있어요. 그래서 가맹점마다 필요한 결제 제품도 다르고, 그걸 조합해서 쓰는 경우도 많죠. 이렇게 조합이 달라지면 필요한 기술도 달라지고, 장애 양상도 완전히 달라져요.
SRE는 이런 걸 단순히 ‘기술 문제’로만 보지 않아요. 결제 제품의 특징과 관계를 함께 고려하면서 안정성을 지켜내는 거예요. 서버나 인프라만 보는 게 아니라, 실제로 가맹점이 어떤 상황에서 문제를 겪는지도 같이 생각하죠.
그래서 토스페이먼츠 SRE는 눈앞의 장애를 빠르게 해결하는 동시에, 결제 제품 전체를 바라보는 넓은 시야를 키우게 돼요. 단순히 엔지니어링이 아니라, 제품과 비즈니스 관점에서 안정성을 만들어가는 거죠.
<aside> 💬
말씀해 주신 ‘제품 전체를 보는 관점’이 실제 업무에서는 어떻게 드러나는지 궁금해요. 예시로 설명해 주실 수 있을까요?
</aside>
재은님 예를 들어, 내부 서버에서 오래 걸리는 API 요청 때문에 Timeout 이슈가 생긴다고 해볼게요.
이런 상황에서 토스페이먼츠 SRE는 단순히 ‘Timeout을 늘려서 해결하자’라는 기술적 대응에만 머무르지 않아요. 단기·중기·장기적으로 어떤 영향을 줄지, 또 제품과 사용자 경험에 어떤 의미가 있을지까지 함께 고민하죠.
결국 중요한 건 ‘기술만으로 당장 문제를 막았다’가 아니라, 제품·가맹점·사용자 관점까지 아우르며 장애를 방지하고 미래를 준비한다는 점이에요. 이런 사고 방식이 토스페이먼츠 SRE가 다른 회사와 차별화되는 부분이죠
<aside> 💬
토스페이먼츠 SRE는 장애를 단순히 해결하는 걸 넘어서 미래의 장애까지 예측하고 방지하는 중요한 역할을 하네요. 그렇다면 지금처럼 팀의 기반을 함께 다져가는 시기에 합류한다면, 어떤 특별한 성장 경험을 할 수 있을까요?”
</aside>