포지션 상세
부서소개
저희 부서는 대규모 머신러닝/딥러닝 서비스의 개발, 운영, 최적화를 담당하는 MLOps 부서입니다. 다양한 도메인과 서비스에서 발생하는 데이터와 모델을 효율적으로 관리하고 안정적이면서 확장성 높은 ML 시스템을 구축합니다. ML 엔지니어와 연구자들이 실험과 배포에 전념하도록 돕고, 대용량 트래픽도 안정적으로 서빙할 수 있는 솔루션을 제공합니다.
팀원들은 최신 AI/ML 기술 트렌드를 빠르게 서비스에 적용해 다양한 기술적 도전을 경험하며 함께 성장하고 있습니다.
• 대규모 트래픽 처리를 위한 모델 서버 최적화
• 온라인/오프라인 모델 서빙 시스템 개발 및 성능 최적화
• GPU/CPU 등 컴퓨팅 자원 효율화 및 분산 시스템 운영
• 대규모 데이터 파이프라인(ETL, 스트리밍) 구축 및 최적화
2. ML 파이프라인 자동화 및 CI/CD 환경 구축
• 모델 학습, 검증, 배포 자동화
• 지속적 통합/배포(CI/CD) 및 모니터링 시스템 구축
3. 고가용성, 확장성, 안정성을 위한 클러스터 및 오케스트레이션 환경 운영
• 컨테이너 및 오케스트레이션(Kubernetes 등) 기반 인프라 관리
• 장애 탐지, 진단, 복구 등 운영 자동화 및 SRE 업무
4. 데이터 및 모델 라이프사이클 관리
• 대규모 데이터 저장, 처리, 품질 관리 및 보안 체계 구축
• 모델 및 데이터 버전 관리, 라이프사이클 자동화
5. 다양한 직군과 협업(ML 엔지니어, 데이터 엔지니어, SRE, DevOps 등)
• 원활한 커뮤니케이션 및 협업 능력을 갖추신 분
• 아래 자격요건 중 2개 이상 경험 혹은 기술을 보유하신 분
1) 분산 시스템 및 컨테이너 기술(Kubernetes 등)에 대한 이해와 경험이 있으신 분
2) Go, Python, Kotlin, Java, Rust 등 하나 이상의 프로그래밍 언어에 능숙하신 분
3) 데이터 파이프라인, ML 파이프라인 또는 백엔드 시스템 개발 경험이 있으신 분
저희 부서는 대규모 머신러닝/딥러닝 서비스의 개발, 운영, 최적화를 담당하는 MLOps 부서입니다. 다양한 도메인과 서비스에서 발생하는 데이터와 모델을 효율적으로 관리하고 안정적이면서 확장성 높은 ML 시스템을 구축합니다. ML 엔지니어와 연구자들이 실험과 배포에 전념하도록 돕고, 대용량 트래픽도 안정적으로 서빙할 수 있는 솔루션을 제공합니다.
팀원들은 최신 AI/ML 기술 트렌드를 빠르게 서비스에 적용해 다양한 기술적 도전을 경험하며 함께 성장하고 있습니다.
주요업무
1. 대규모 ML 워크로드를 위한 인프라 설계·개발·운영• 대규모 트래픽 처리를 위한 모델 서버 최적화
• 온라인/오프라인 모델 서빙 시스템 개발 및 성능 최적화
• GPU/CPU 등 컴퓨팅 자원 효율화 및 분산 시스템 운영
• 대규모 데이터 파이프라인(ETL, 스트리밍) 구축 및 최적화
2. ML 파이프라인 자동화 및 CI/CD 환경 구축
• 모델 학습, 검증, 배포 자동화
• 지속적 통합/배포(CI/CD) 및 모니터링 시스템 구축
3. 고가용성, 확장성, 안정성을 위한 클러스터 및 오케스트레이션 환경 운영
• 컨테이너 및 오케스트레이션(Kubernetes 등) 기반 인프라 관리
• 장애 탐지, 진단, 복구 등 운영 자동화 및 SRE 업무
4. 데이터 및 모델 라이프사이클 관리
• 대규모 데이터 저장, 처리, 품질 관리 및 보안 체계 구축
• 모델 및 데이터 버전 관리, 라이프사이클 자동화
5. 다양한 직군과 협업(ML 엔지니어, 데이터 엔지니어, SRE, DevOps 등)
자격요건
• 소프트웨어, 데이터, ML 등 관련 분야 실무 경험 3년 이상이신 분• 원활한 커뮤니케이션 및 협업 능력을 갖추신 분
• 아래 자격요건 중 2개 이상 경험 혹은 기술을 보유하신 분
1) 분산 시스템 및 컨테이너 기술(Kubernetes 등)에 대한 이해와 경험이 있으신 분
2) Go, Python, Kotlin, Java, Rust 등 하나 이상의 프로그래밍 언어에 능숙하신 분
3) 데이터 파이프라인, ML 파이프라인 또는 백엔드 시스템 개발 경험이 있으신 분








