포지션 상세
• Moreh는 대규모 AI 모델과 GPU/NPU 클러스터 시스템을 위한 AI 소프트웨어 스택을 개발하고 있습니다.
• Moreh는 자체 데이터센터에 수백 노드 규모의 GPU 클러스터를 운영하고 있으며 다양한 고객에게 인프라를 공급하고 관리합니다.
• Moreh의 SRE/DevOps Engineer는 다양한 시스템의 하드웨어와 소프트웨어 구성 요소 설치, 통합/배포, 관리하는 역할을 담당합니다.
• GPU 드라이버, 통신 라이브러리, 디렉터리 서비스, 분산 파일 시스템 등 다양한 시스템 소프트웨어 설치, 관리
• Kubernetes 등 컨테이너 오케스트레이션 도구 설치, 관리
• Terraform, Ansible 등 IaC 툴을 사용하여 자동화 및 코드화 수행
• 모레 솔루션 배포를 위한 CI/CD 파이프라인 구축, 관리
• 클러스터 자원 및 시스템 성능 모니터링 구축, 시스템 장애 발생 시 원인 분석 및 해결
• 다음 중 하나에 해당하시는 분
- 2년 이상의 SRE/DevOps 엔지니어 경력이 있으신 분
- 2년 이상의 On-premise, Public Cloud 등 Linux 기반 시스템을 구축, 운영 경력이 있으신 분
• Python/Go/Shell 등 스크립트 언어를 활용한 개발 역량을 보유하신 분
• 컴퓨터 시스템에 대한 이해가 있으신 분
• 뛰어난 논리적 사고 및 문제 해결 능력이 있으신 분
• 해외여행 결격사유가 없는 분
• 팀워크를 중시하고, 긍정적인 태도로 동료들과 적극적으로 협력할 수 있으신 분
• Moreh는 자체 데이터센터에 수백 노드 규모의 GPU 클러스터를 운영하고 있으며 다양한 고객에게 인프라를 공급하고 관리합니다.
• Moreh의 SRE/DevOps Engineer는 다양한 시스템의 하드웨어와 소프트웨어 구성 요소 설치, 통합/배포, 관리하는 역할을 담당합니다.
주요업무
• IDC 내 CPU/GPU 서버, 고대역 네트워크, 분산스토리지 등 대규모 클러스터 시스템의 구축, 운영• GPU 드라이버, 통신 라이브러리, 디렉터리 서비스, 분산 파일 시스템 등 다양한 시스템 소프트웨어 설치, 관리
• Kubernetes 등 컨테이너 오케스트레이션 도구 설치, 관리
• Terraform, Ansible 등 IaC 툴을 사용하여 자동화 및 코드화 수행
• 모레 솔루션 배포를 위한 CI/CD 파이프라인 구축, 관리
• 클러스터 자원 및 시스템 성능 모니터링 구축, 시스템 장애 발생 시 원인 분석 및 해결
자격요건
• 컴퓨터공학 혹은 관련 전공 학부 졸업, 혹은 이와 동등한 경력이 있으신 분• 다음 중 하나에 해당하시는 분
- 2년 이상의 SRE/DevOps 엔지니어 경력이 있으신 분
- 2년 이상의 On-premise, Public Cloud 등 Linux 기반 시스템을 구축, 운영 경력이 있으신 분
• Python/Go/Shell 등 스크립트 언어를 활용한 개발 역량을 보유하신 분
• 컴퓨터 시스템에 대한 이해가 있으신 분
• 뛰어난 논리적 사고 및 문제 해결 능력이 있으신 분
• 해외여행 결격사유가 없는 분
• 팀워크를 중시하고, 긍정적인 태도로 동료들과 적극적으로 협력할 수 있으신 분





