포지션 상세
저희 부서는 이미지/비디오 생성 파운데이션 모델을 연구·개발하며, 대규모 GPU 클러스터를 활용해 고품질의 모델을 학습하고 배포합니다. 단순 텍스트·프롬프트 기반 생성을 넘어 다양한 모달리티 입력에 대응하는 Any-to-Any 생성으로의 확장을 추구하며, 이를 세계적인 수준으로 끌어올린 옴니생성 모델을 만들고 공개하는 도전적인 목표를 가지고 있습니다.
- 각 데이터 도메인에 맞는 다양한 특징 추출 모델 (Aesthetics Score, Typography OCR, Optical Flow, Scene Change 등) 적용 및 개선
- 비정상 데이터 감지 및 품질 기반 필터링 적용 및 개선
• 복합 시나리오 학습 데이터셋 구축
- 웹/문서/비디오 등의 원시 데이터에서 구조화된 Interleaved 데이터 추출
- 이미지/비디오 편집 기능을 위한 모델 기반 데이터 합성
• 데이터 캡션링 파이프라인 고도화
- 이미지/비디오에서 추출한 다양한 특징을 반영한 캡션링 파이프라인 개발 및 개선
• 데이터 통계 분석 및 시각화를 통한 지속적 품질 개선
- git & PR 기반 공동 코드개발에 능숙하신 분
- python 및 pytorch 활용이 능숙하신 분
주요업무
• 고품질 이미지/비디오 데이터 큐레이션 모델 개발- 각 데이터 도메인에 맞는 다양한 특징 추출 모델 (Aesthetics Score, Typography OCR, Optical Flow, Scene Change 등) 적용 및 개선
- 비정상 데이터 감지 및 품질 기반 필터링 적용 및 개선
• 복합 시나리오 학습 데이터셋 구축
- 웹/문서/비디오 등의 원시 데이터에서 구조화된 Interleaved 데이터 추출
- 이미지/비디오 편집 기능을 위한 모델 기반 데이터 합성
• 데이터 캡션링 파이프라인 고도화
- 이미지/비디오에서 추출한 다양한 특징을 반영한 캡션링 파이프라인 개발 및 개선
• 데이터 통계 분석 및 시각화를 통한 지속적 품질 개선
자격요건
• 2인 이상이 참여한 프로젝트에서 6개월 이상의 코드 협업 경험이 있으신 분- git & PR 기반 공동 코드개발에 능숙하신 분
- python 및 pytorch 활용이 능숙하신 분