포지션 상세
에듀테크 글로벌 강자! 캐치잇플레이에서 인공지능 교육의 미래를 바꾸어 나가기 위해 9.7억 건의 학습 행동 데이터를 기반으로,
신규 제품·엔진 개발의 데이터·ML 플랫폼 리드를 맡아 주실 '데이터 엔지니어' 한 분을 모시려고 합니다.
대규모 학습 로그를 안정적으로 다루고, ML 모델 인프라까지 함께 책임질 데이터 엔지니어를 찾습니다.
데이터 플랫폼에서 시작해 MLOps 영역으로 자기 역할을 확장해 나갈 분을 모시고 싶습니다.
• 데이터 파이프라인의 안정성과 비용을 동시에 고려할 줄 아는 분
• 피처의 필요성과 활용 맥락을 ML 엔지니어와 함께 논의할 수 있는 분
• 처음부터 완벽한 설계보다, MVP로 먼저 돌리고 점진적으로 개선하는 접근을 선호하는 분
• 장애 발생 시 원인을 끝까지 추적하고 재발 방지까지 가져가는 책임감을 가진 분
• 데이터 플랫폼에서 ML 플랫폼·MLOps 영역으로 자기 역할을 확장해 나가는 데 관심이 있는 분
• 라이브 서비스에서 발생하는 대규모 이벤트·로그·학습 데이터 수집·가공 파이프라인 설계·구현·운영
• Airflow 등 워크플로우 도구로 ETL/ELT 파이프라인 안정 운영, 장애 대응·성능 최적화·비용 효율 책임
• 분석가·ML 엔지니어·기획팀이 활용하기 좋은 형태로 데이터 웨어하우스(DW)·데이터 마트(DM) 설계·구축 및 자산화
• 데이터 품질 관리 및 거버넌스(메타데이터·카탈로그·접근 제어) 구축으로 데이터 신뢰성 확보
• 클라우드(AWS, GCP 등) 기반 데이터 인프라 운영, 확장성·비용 효율 고려한 아키텍처 개선 주도
B. ML 플랫폼·MLOps 인접 영역 (~40%)
• ML팀과 협업하여 추천·매칭·이탈 예측 등 모델 학습·서빙용 데이터 파이프라인과 Feature Store 운영
• 모델 서빙·모니터링 인프라 함께 운영, 저지연 추론 환경과 운영 안정성 확보
• 데이터·성능 드리프트 감지·알람 체계 운영
• Python, SQL 능숙
• 대규모 사용자 로그 처리 경험 (high-volume event processing)
• Spark, Flink 등 분산 처리 프레임워크 실무 경험
• ETL 파이프라인 구축 경험 (Airflow, Prefect 등)
• 배치 + 스트리밍 데이터 처리의 차이를 이해하고 양쪽을 설계할 수 있는 분
• 클라우드(AWS, GCP 등) 환경에서 데이터 인프라 구축 경험
• Docker / Kubernetes 기반 컨테이너 환경 운영 경험
• 인프라 코드(IaC, Terraform 등) 관리 경험
신규 제품·엔진 개발의 데이터·ML 플랫폼 리드를 맡아 주실 '데이터 엔지니어' 한 분을 모시려고 합니다.
대규모 학습 로그를 안정적으로 다루고, ML 모델 인프라까지 함께 책임질 데이터 엔지니어를 찾습니다.
데이터 플랫폼에서 시작해 MLOps 영역으로 자기 역할을 확장해 나갈 분을 모시고 싶습니다.
• 데이터 파이프라인의 안정성과 비용을 동시에 고려할 줄 아는 분
• 피처의 필요성과 활용 맥락을 ML 엔지니어와 함께 논의할 수 있는 분
• 처음부터 완벽한 설계보다, MVP로 먼저 돌리고 점진적으로 개선하는 접근을 선호하는 분
• 장애 발생 시 원인을 끝까지 추적하고 재발 방지까지 가져가는 책임감을 가진 분
• 데이터 플랫폼에서 ML 플랫폼·MLOps 영역으로 자기 역할을 확장해 나가는 데 관심이 있는 분
주요업무
A. 데이터 플랫폼 (~60%)• 라이브 서비스에서 발생하는 대규모 이벤트·로그·학습 데이터 수집·가공 파이프라인 설계·구현·운영
• Airflow 등 워크플로우 도구로 ETL/ELT 파이프라인 안정 운영, 장애 대응·성능 최적화·비용 효율 책임
• 분석가·ML 엔지니어·기획팀이 활용하기 좋은 형태로 데이터 웨어하우스(DW)·데이터 마트(DM) 설계·구축 및 자산화
• 데이터 품질 관리 및 거버넌스(메타데이터·카탈로그·접근 제어) 구축으로 데이터 신뢰성 확보
• 클라우드(AWS, GCP 등) 기반 데이터 인프라 운영, 확장성·비용 효율 고려한 아키텍처 개선 주도
B. ML 플랫폼·MLOps 인접 영역 (~40%)
• ML팀과 협업하여 추천·매칭·이탈 예측 등 모델 학습·서빙용 데이터 파이프라인과 Feature Store 운영
• 모델 서빙·모니터링 인프라 함께 운영, 저지연 추론 환경과 운영 안정성 확보
• 데이터·성능 드리프트 감지·알람 체계 운영
자격요건
• 데이터 엔지니어링 관련 실무 경력 3년 이상• Python, SQL 능숙
• 대규모 사용자 로그 처리 경험 (high-volume event processing)
• Spark, Flink 등 분산 처리 프레임워크 실무 경험
• ETL 파이프라인 구축 경험 (Airflow, Prefect 등)
• 배치 + 스트리밍 데이터 처리의 차이를 이해하고 양쪽을 설계할 수 있는 분
• 클라우드(AWS, GCP 등) 환경에서 데이터 인프라 구축 경험
• Docker / Kubernetes 기반 컨테이너 환경 운영 경험
• 인프라 코드(IaC, Terraform 등) 관리 경험







