포지션 상세
■ 팀 소개 | AI R&D팀
AI Lab은 사람과 기술을 연결하는 미래의 인터페이스를 만드는 팀입니다.
우리는 3D 캐릭터 & 모션 생성 AI, 캐릭터 애니메이션, 인터랙티브 AI 캐릭터, 생성형 콘텐츠 제작 기술을 연구하고 있습니다.
특히 3D 캐릭터 & 모션 Data, Data Pipeline, AI+3D 캐릭터챗 유저 로그을 통합 관리하며, AI 모델 모션 검색 제품으로 이어지는 데이터 플라이휠(Data Flywheel)을 구축하고 있습니다.
AI Data Engineer는 이 생태계의 중심에서 모션·비디오·텍스트·로그 등 다양한 원천 데이터를 자동 수집하고 정제하여 AI 학습과 검색 시스템이 효율적으로 작동하도록 데이터 인프라와 파이프라인을 설계·운영합니다.
■ 우리가 하는 일
• 회사내 데이터 레이크 및 데이터베이스 설계·구축
• 3D Charactor & Motion 메타데이터 관리 및 품질 평가 자동화
• AI+3D 캐릭터챗 유저 대화/세션/행동 로그 ETL 파이프라인 구축
• AI 학습용 데이터셋 및 Embedding Index 관리
• 3D 모션 검색과 AI+3D 캐릭터챗 Vector DB 시스템 구축
■ 협업 문화
• AI R&D팀은 “데이터-연구-서비스의 순환하는 구조”를 중요하게 생각합니다.
• ML 엔지니어, 데이터 엔지니어, AI 프롬프트 엔지니어가 한 팀으로 협력하며, 데이터를 기반으로 모델을 개선하고, 모델이 다시 새로운 데이터를 생성하며 인사이트를 만들어내는 순환 구조를 구축합니다.
• 기획자, 디자이너, 엔지니어와의 수평적 협업을 지향하며, 모든 멤버가 문제 해결에 주도적으로 참여합니다.
■ About the Role
이 역할은 AI Lab의 데이터 생태계를 처음부터 만들어가는 핵심 포지션입니다.
3D 캐릭터 & Motion 데이터, AI+3D 캐릭터챗 유저 로그, 3D AI 모델 데이터셋 등 서로 다른 소스의 데이터를 수집·정제·저장할 수 있는 데이터베이스 및 데이터 레이크 아키텍처를 직접 설계하며, 데이터 접근 제어, 권한 관리, 보안 정책까지 고려한 통합 데이터 거버넌스를 구축합니다.
또한 이 데이터를 기반으로 AI 학습용 Feature Store를 구성하고, 검색/추천 시스템의 Embedding Index를 관리하며, 유저 데이터로 부터 AI 개선 인사이트를 추출하는 데이터 플라이휠을 완성하는 역할을 맡습니다.
•스타트업 환경에서 유저 로그·모션 데이터·AI 학습를 통합 관리할 수 있는 데이터베이스 구조 설계\
•Cloud SQL / Firestore 등 운영 데이터베이스 설계 및 관리
•Motion / Video / Text / Log 등 원천 데이터 수집 및 관리
•Composer(Airflow)와 Dataflow 기반 ETL/ELT 파이프라인 설계
2. 3D 캐릭터&모션 데이터 및 유저 로그 및 서비스 데이터 관리
• AI 학습용 데이터셋 생성 파이프라인 구축
• 모션 품질 지표 자동 평가 시스템 구축
• AI+3D 캐릭터챗 대화 로그, 세션, 감정/의도 데이터 수집 및 가공
3. 검색 시스템 및 품질/모니터링 및 협업
• Text / Embedding 기반 Semantic Search 시스템 구축
• 메타데이터 스키마 설계
• 데이터 검증/품질 관리 자동화
• Python, SQL, PySpark 등 데이터 파이프라인 개발 역량
• AWS, GCP 기반 데이터 인프라 설계 및 구축 경험
• Airflow, Prefect, Dagster 등의 배치 파이프라인 운영 경험
• Elasticsearch, OpenSearch, FAISS 등 검색 인프라 이해
AI Lab은 사람과 기술을 연결하는 미래의 인터페이스를 만드는 팀입니다.
우리는 3D 캐릭터 & 모션 생성 AI, 캐릭터 애니메이션, 인터랙티브 AI 캐릭터, 생성형 콘텐츠 제작 기술을 연구하고 있습니다.
특히 3D 캐릭터 & 모션 Data, Data Pipeline, AI+3D 캐릭터챗 유저 로그을 통합 관리하며, AI 모델 모션 검색 제품으로 이어지는 데이터 플라이휠(Data Flywheel)을 구축하고 있습니다.
AI Data Engineer는 이 생태계의 중심에서 모션·비디오·텍스트·로그 등 다양한 원천 데이터를 자동 수집하고 정제하여 AI 학습과 검색 시스템이 효율적으로 작동하도록 데이터 인프라와 파이프라인을 설계·운영합니다.
■ 우리가 하는 일
• 회사내 데이터 레이크 및 데이터베이스 설계·구축
• 3D Charactor & Motion 메타데이터 관리 및 품질 평가 자동화
• AI+3D 캐릭터챗 유저 대화/세션/행동 로그 ETL 파이프라인 구축
• AI 학습용 데이터셋 및 Embedding Index 관리
• 3D 모션 검색과 AI+3D 캐릭터챗 Vector DB 시스템 구축
■ 협업 문화
• AI R&D팀은 “데이터-연구-서비스의 순환하는 구조”를 중요하게 생각합니다.
• ML 엔지니어, 데이터 엔지니어, AI 프롬프트 엔지니어가 한 팀으로 협력하며, 데이터를 기반으로 모델을 개선하고, 모델이 다시 새로운 데이터를 생성하며 인사이트를 만들어내는 순환 구조를 구축합니다.
• 기획자, 디자이너, 엔지니어와의 수평적 협업을 지향하며, 모든 멤버가 문제 해결에 주도적으로 참여합니다.
■ About the Role
이 역할은 AI Lab의 데이터 생태계를 처음부터 만들어가는 핵심 포지션입니다.
3D 캐릭터 & Motion 데이터, AI+3D 캐릭터챗 유저 로그, 3D AI 모델 데이터셋 등 서로 다른 소스의 데이터를 수집·정제·저장할 수 있는 데이터베이스 및 데이터 레이크 아키텍처를 직접 설계하며, 데이터 접근 제어, 권한 관리, 보안 정책까지 고려한 통합 데이터 거버넌스를 구축합니다.
또한 이 데이터를 기반으로 AI 학습용 Feature Store를 구성하고, 검색/추천 시스템의 Embedding Index를 관리하며, 유저 데이터로 부터 AI 개선 인사이트를 추출하는 데이터 플라이휠을 완성하는 역할을 맡습니다.
주요업무
1. 데이터베이스 & 데이터 레이크 구축•스타트업 환경에서 유저 로그·모션 데이터·AI 학습를 통합 관리할 수 있는 데이터베이스 구조 설계\
•Cloud SQL / Firestore 등 운영 데이터베이스 설계 및 관리
•Motion / Video / Text / Log 등 원천 데이터 수집 및 관리
•Composer(Airflow)와 Dataflow 기반 ETL/ELT 파이프라인 설계
2. 3D 캐릭터&모션 데이터 및 유저 로그 및 서비스 데이터 관리
• AI 학습용 데이터셋 생성 파이프라인 구축
• 모션 품질 지표 자동 평가 시스템 구축
• AI+3D 캐릭터챗 대화 로그, 세션, 감정/의도 데이터 수집 및 가공
3. 검색 시스템 및 품질/모니터링 및 협업
• Text / Embedding 기반 Semantic Search 시스템 구축
• 메타데이터 스키마 설계
• 데이터 검증/품질 관리 자동화
자격요건
• 데이터 엔지니어링 또는 데이터 인프라 관련 실무 경력 3년 이상• Python, SQL, PySpark 등 데이터 파이프라인 개발 역량
• AWS, GCP 기반 데이터 인프라 설계 및 구축 경험
• Airflow, Prefect, Dagster 등의 배치 파이프라인 운영 경험
• Elasticsearch, OpenSearch, FAISS 등 검색 인프라 이해










