포지션 상세
[합류하게 될 팀에 대해 알려드려요]
• 토스플레이스는 새로운 오프라인 결제 생태계를 만들어가는 여정에 있습니다. 합류하신다면 토스플레이스의 DevOps 초기 멤버로, 오프라인 시장을 혁신하는 여정을 초기부터 함께 이끌어갈 수 있어요.
• 개발자들이 더 빠르고 안전하게 서비스를 배포하고, 장애에 흔들리지 않는 시스템을 운영할 수 있도록 Kubernetes 기반의 Cloud Native 플랫폼을 고도화하고 있습니다.
• 서비스 장애가 생겨도 빠른 시간 내에 복구할 수 있도록 만반의 준비를 하고, 늘 안정적으로 운영될 수 있도록 든든하게 지켜주는 서버 플랫폼 팀 소속으로 일해요.
• 토스플레이스 서버 플랫폼 팀은 단순히 인프라를 유지하는 팀이 아니라, 개발자들이 더 빠르고 안전하게 실험하고 배포할 수 있는 환경을 만들고 제공하는 팀이에요.
• DevOps Engineer는 모든 서비스를 뒷받침하는 서버 플랫폼 개발자, 장애와 관련 있는 부분을 모니터링 하는 SRE, 배포 파이프라인을 고도화하는 DevOps, 데이터 파이프라인을 운영하는 Data Platform Team, 각 사일로의 개발자들과 긴밀하게 협업해요.
• 배포 자동화 파이프라인을 운영하고 CI/CD 환경을 개선해요.
• 서비스 안정성을 위한 모니터링/로깅 시스템을 구축하고 운영해요.
• 여러 Kubernetes 클러스터를 운영/최적화하며 대규모 트래픽 환경에 대응해요.
• 인프라 비용 및 리소스 효율을 분석해 최적화 전략을 수립해요.
• 보안 컴플라이언스를 고려한 클라우드 인프라를 설계하고 운영해요.
• 운영장애 대응 및 복구 프로세스를 자동화하고, 구조적 개선을 주도해요.
• 인프라에 대한 오너십을 가지고 주도적으로 운영/개선해온 경험이 있는 분과 함께하고 싶어요.
• 장애에 대한 단기 해결뿐만 아니라 재발 방지를 위한 원인 분석과 구조적 개선 경험까지 있는 분이면 좋아요.
• OS, Network 등 다양한 레이어에서의 모니터링, 트러블슈팅 경험이 있으신 분이면 좋아요.
• Kubernetes와 Service Mesh에 대한 경험이 많은 분이면 좋아요.
• 대규모의 실시간 트래픽을 처리하는 인프라의 운영 경험이 있으신 분이면 좋아요.
• IaC 경험이 있는 분이면 좋아요.
• AI 서비스 배포/운영 경험이 있다면 더욱 좋아요.
• 토스플레이스는 새로운 오프라인 결제 생태계를 만들어가는 여정에 있습니다. 합류하신다면 토스플레이스의 DevOps 초기 멤버로, 오프라인 시장을 혁신하는 여정을 초기부터 함께 이끌어갈 수 있어요.
• 개발자들이 더 빠르고 안전하게 서비스를 배포하고, 장애에 흔들리지 않는 시스템을 운영할 수 있도록 Kubernetes 기반의 Cloud Native 플랫폼을 고도화하고 있습니다.
• 서비스 장애가 생겨도 빠른 시간 내에 복구할 수 있도록 만반의 준비를 하고, 늘 안정적으로 운영될 수 있도록 든든하게 지켜주는 서버 플랫폼 팀 소속으로 일해요.
• 토스플레이스 서버 플랫폼 팀은 단순히 인프라를 유지하는 팀이 아니라, 개발자들이 더 빠르고 안전하게 실험하고 배포할 수 있는 환경을 만들고 제공하는 팀이에요.
• DevOps Engineer는 모든 서비스를 뒷받침하는 서버 플랫폼 개발자, 장애와 관련 있는 부분을 모니터링 하는 SRE, 배포 파이프라인을 고도화하는 DevOps, 데이터 파이프라인을 운영하는 Data Platform Team, 각 사일로의 개발자들과 긴밀하게 협업해요.
주요업무
[합류하면 함께할 업무예요]• 배포 자동화 파이프라인을 운영하고 CI/CD 환경을 개선해요.
• 서비스 안정성을 위한 모니터링/로깅 시스템을 구축하고 운영해요.
• 여러 Kubernetes 클러스터를 운영/최적화하며 대규모 트래픽 환경에 대응해요.
• 인프라 비용 및 리소스 효율을 분석해 최적화 전략을 수립해요.
• 보안 컴플라이언스를 고려한 클라우드 인프라를 설계하고 운영해요.
• 운영장애 대응 및 복구 프로세스를 자동화하고, 구조적 개선을 주도해요.
자격요건
[이런 분과 함께하고 싶어요]• 인프라에 대한 오너십을 가지고 주도적으로 운영/개선해온 경험이 있는 분과 함께하고 싶어요.
• 장애에 대한 단기 해결뿐만 아니라 재발 방지를 위한 원인 분석과 구조적 개선 경험까지 있는 분이면 좋아요.
• OS, Network 등 다양한 레이어에서의 모니터링, 트러블슈팅 경험이 있으신 분이면 좋아요.
• Kubernetes와 Service Mesh에 대한 경험이 많은 분이면 좋아요.
• 대규모의 실시간 트래픽을 처리하는 인프라의 운영 경험이 있으신 분이면 좋아요.
• IaC 경험이 있는 분이면 좋아요.
• AI 서비스 배포/운영 경험이 있다면 더욱 좋아요.



