포지션 상세
Lunit은 "Learning Unit"을 줄여 만든 이름으로, 암 진단 및 치료에 기여하는 인공지능 솔루션을 개발하고 제공하는 의료 AI 기업입니다.
루닛은 인공지능 기술을 통해 더 정확한 암 진단과 치료 효과 예측이 가능해지고, 환자를 위한 신속한 맞춤형 치료가 가능해지는 시대를 열고자 합니다.
[About the Team]
• What do we do? (Department Mission)
AI Platform Department 는 전 세계 환자의 진단과 치료에 실제로 사용되는 의료 AI 모델이 안정적으로 동작하도록 데이터·학습·운영·서빙 전반을 아우르는 기반 플랫폼을 구축합니다. 우리는 기술을 통해 암의 조기 발견과 정확한 치료라는 목표에 기여하고자 합니다.
• How do we work? (Work Style)
• 빠르게 시도하고 실사용자 피드백을 바탕으로 지속적으로 개선하는 개발 문화
• 문제 정의 단계부터 PM, AI 연구자, 엔지니어가 함께 참여하는 강한 협업 구조
• 품질을 지키면서 속도를 높이기 위해 AI 기반 개발·자동화 도구 적극 활용
• 명확한 기술 RFC와 코드 리뷰를 통한 투명한 기술 의사결정
• What kind of problems do we solve? (Design Philosophy)
• TB~PB 규모의 의료 데이터를 다루는 대규모 데이터 인프라 문제
• 데이터 보안·프라이버시 규제를 충족하는 엔터프라이즈 아키텍처
• 연구자가 수천 건의 실험을 수행할 수 있도록 지원하는 대규모 ML 파이프라인 자동화
• 글로벌 병원 인프라와 연결된 데이터 연동·모니터링 시스템
• Who will I spend 8+ hours/day with? (Co-workers)
• 글로벌 인재로 구성된 AI 연구자, SW 엔지니어, MLOps 엔지니어 등 전문성 높은 동료들
• 영어와 한국어가 자연스럽게 공존하는 팀 환경
• 서로의 지식과 배경을 존중하며 함께 성장하는 문화
[About the Position]
• What will I build? (Scope of Work)
• 의료 데이터 수집·정제·변환 파이프라인
• AI 학습 데이터셋 생성 및 버전 관리 시스템
• 대규모 ML 워크플로우 자동화
• Data Lineage, Metadata, Quality 관리 체계
• 규제·보안이 중요한 의료 데이터 거버넌스 인프라
• 글로벌 SaaS 형태의 의료 AI 데이터 플랫폼
• What design/engineering challenges will I face? (Focus Area)
• PB 규모 의료 데이터 파이프라인 설계
• 멀티클라우드(AWS/GCP/Azure) 운영
• 의료 규제 준수 + 자동화를 동시에 만족하는 구조 설계
• GPU 학습 환경과 연동되는 고성능 데이터 공급 문제 해결
• 글로벌 연구자와 함께 사용하는 공용 ML 플랫폼 구축
• 제품–연구–엔지니어링 요구를 조율하는 협업 중심의 문제 해결
• What kind of engineer fits well here? (Ideal Profile)
• 데이터 시스템의 “전체 흐름”과 “구조”를 설계하는 일을 좋아하는 분
• 복잡한 문제를 구조화하고 실용적인 해결책을 제시할 수 있는 분
• Data Quality, Security, Lineage 에 높은 기준을 가진 분
• '의료 AI'라는 어려운 도메인에서 의미 있는 변화를 만들고 싶은 분
• How will I grow? (Opportunities)
• 복잡한 AI·데이터 시스템을 총괄적으로 설계하는 경험
• 글로벌 의료 AI SaaS 플랫폼 구축 경험
• Research–MLOps–Engineering이 맞물린 대규모 조직 구조에서의 성장
• 플랫폼 아키텍처 전반에 영향을 미치는 핵심 기술 결정 기회
• TB~PB 규모의 의료 영상·진단 데이터를 안정적으로 처리하기 위한 데이터 파이프라인을 설계·자동화·운영
• 통합된 데이터 포맷에 대한 Governance 를 수립하고 지속적으로 관리하여 데이터 표준화와 품질을 보장
• 데이터 수집–정제–변환–검증–배포까지 이어지는 End-to-End DataOps 워크플로우를 구축하여, AI 연구자와 MLOps 엔지니어의 생산성을 극대화
• 의료 규제(HIPAA, GDPR, EU AI Act 등)를 충족하는 보안·접근제어·감사 체계(RBAC, Audit Trail)를 설계
• GPU 대규모 학습 환경과 연동되는 학습 데이터 관리 파이프라인(Data Versioning, Lineage, Quality Check)을 구성
• Airflow·Prefect 등 Workflow Orchestrator 기반의 스케줄링·모니터링·장애 대응 자동화를 구축
• AI 기반 개발도구(Cursor, Codex, ChatGPT, Claude Code 등)을 적극 활용해 파이프라인 생성·테스트·문서화를 자동화하며 팀 전체의 생산성을 향상
• 플랫폼을 사용하는 연구자·엔지니어와 긴밀하게 협업하여, 실제 문제를 해결하는 운영 친화적 데이터 인프라를 구축
[Tech Stack]
AI Platform Department는 AI를 활용해 품질을 유지하면서 생산성을 극대화하는 엔지니어링 문화를 지향합니다.
• Core Technologies
• Python 기반 데이터·워크플로우 개발
• Prefect, Airflow 기반 ETL/ML 파이프라인
• PostgreSQL, BigQuery, Athena
• S3/GCS 기반 대용량 데이터 처리
• Kubernetes, Docker
• MLflow, DVC, LakeFS
• Kafka, Redis (필요 시)
• Security / Governance
• 의료 데이터 및 모델에 대한 Governance/Lineage
• RBAC 기반 안전한 데이터 접근
• 데이터 품질 검증 및 정책 기반 접근 관리
• 데이터 플랫폼/파이프라인 설계·운영 7년 이상의 실무 경험
• DataOps/MLOps 환경 구축 경험
• Airflow, Prefect 기반 ETL/ML 파이프라인 설계·운영 경험
• 분산 환경(S3/GCS/HDFS 등)에서의 대용량 파일·메타데이터 처리 경험
• 데이터 버전 관리(DVC, LakeFS) 및 메타데이터 추적 구현 경험
• 데이터 품질·보안·거버넌스
• 데이터 품질, 안정성, 보안, 거버넌스를 고려한 설계 경험
• RBAC, IAM, 정책 기반 접근제어 시스템 설계 경험
• 데이터 품질 지표 및 자동화된 테스트·검증 구축 경험
• AI·의료 도메인 이해
• 의료 데이터(DICOM, pathology, PHI 등) 이해 또는 학습 의지
• AI 모델 개발·임상 워크플로우 등 도메인 지식
• 플랫폼 아키텍처 및 운영 경험
• SaaS 기반 데이터 플랫폼 구축 경험
• 실시간/스트리밍 데이터 처리(Kafka, Flink 등) 경험
• 클라우드 비용 최적화 및 데이터 카탈로그 구축 경험
• 협업 및 커뮤니케이션
• AI Research, MLOps, Backend, 의료 전문가 등과의 협업 능력
• 요구사항 조율 및 기술적 커뮤니케이션 역량
• 영어 커뮤니케이션 역량
• 문제 정의 및 설계 역량
• 문제를 구조화하고 실행 가능한 설계·로드맵으로 구체화하는 분석력
• 사용자 중심의 플랫폼 구조 설계 경험
• 조직 기여 및 기술 성장
• 주니어 엔지니어 멘토링 경험
루닛은 인공지능 기술을 통해 더 정확한 암 진단과 치료 효과 예측이 가능해지고, 환자를 위한 신속한 맞춤형 치료가 가능해지는 시대를 열고자 합니다.
[About the Team]
• What do we do? (Department Mission)
AI Platform Department 는 전 세계 환자의 진단과 치료에 실제로 사용되는 의료 AI 모델이 안정적으로 동작하도록 데이터·학습·운영·서빙 전반을 아우르는 기반 플랫폼을 구축합니다. 우리는 기술을 통해 암의 조기 발견과 정확한 치료라는 목표에 기여하고자 합니다.
• How do we work? (Work Style)
• 빠르게 시도하고 실사용자 피드백을 바탕으로 지속적으로 개선하는 개발 문화
• 문제 정의 단계부터 PM, AI 연구자, 엔지니어가 함께 참여하는 강한 협업 구조
• 품질을 지키면서 속도를 높이기 위해 AI 기반 개발·자동화 도구 적극 활용
• 명확한 기술 RFC와 코드 리뷰를 통한 투명한 기술 의사결정
• What kind of problems do we solve? (Design Philosophy)
• TB~PB 규모의 의료 데이터를 다루는 대규모 데이터 인프라 문제
• 데이터 보안·프라이버시 규제를 충족하는 엔터프라이즈 아키텍처
• 연구자가 수천 건의 실험을 수행할 수 있도록 지원하는 대규모 ML 파이프라인 자동화
• 글로벌 병원 인프라와 연결된 데이터 연동·모니터링 시스템
• Who will I spend 8+ hours/day with? (Co-workers)
• 글로벌 인재로 구성된 AI 연구자, SW 엔지니어, MLOps 엔지니어 등 전문성 높은 동료들
• 영어와 한국어가 자연스럽게 공존하는 팀 환경
• 서로의 지식과 배경을 존중하며 함께 성장하는 문화
[About the Position]
• What will I build? (Scope of Work)
• 의료 데이터 수집·정제·변환 파이프라인
• AI 학습 데이터셋 생성 및 버전 관리 시스템
• 대규모 ML 워크플로우 자동화
• Data Lineage, Metadata, Quality 관리 체계
• 규제·보안이 중요한 의료 데이터 거버넌스 인프라
• 글로벌 SaaS 형태의 의료 AI 데이터 플랫폼
• What design/engineering challenges will I face? (Focus Area)
• PB 규모 의료 데이터 파이프라인 설계
• 멀티클라우드(AWS/GCP/Azure) 운영
• 의료 규제 준수 + 자동화를 동시에 만족하는 구조 설계
• GPU 학습 환경과 연동되는 고성능 데이터 공급 문제 해결
• 글로벌 연구자와 함께 사용하는 공용 ML 플랫폼 구축
• 제품–연구–엔지니어링 요구를 조율하는 협업 중심의 문제 해결
• What kind of engineer fits well here? (Ideal Profile)
• 데이터 시스템의 “전체 흐름”과 “구조”를 설계하는 일을 좋아하는 분
• 복잡한 문제를 구조화하고 실용적인 해결책을 제시할 수 있는 분
• Data Quality, Security, Lineage 에 높은 기준을 가진 분
• '의료 AI'라는 어려운 도메인에서 의미 있는 변화를 만들고 싶은 분
• How will I grow? (Opportunities)
• 복잡한 AI·데이터 시스템을 총괄적으로 설계하는 경험
• 글로벌 의료 AI SaaS 플랫폼 구축 경험
• Research–MLOps–Engineering이 맞물린 대규모 조직 구조에서의 성장
• 플랫폼 아키텍처 전반에 영향을 미치는 핵심 기술 결정 기회
주요업무
우리가 구축하는 데이터 인프라와 파이프라인은 의료 AI 모델의 정확도·재현성·신뢰성을 결정하는 핵심 요소입니다. Data Engineer의 한 줄 코드, 하나의 파이프라인 개선은 결국 전 세계 환자의 진단 결과에 직접적인 영향을 미칩니다.• TB~PB 규모의 의료 영상·진단 데이터를 안정적으로 처리하기 위한 데이터 파이프라인을 설계·자동화·운영
• 통합된 데이터 포맷에 대한 Governance 를 수립하고 지속적으로 관리하여 데이터 표준화와 품질을 보장
• 데이터 수집–정제–변환–검증–배포까지 이어지는 End-to-End DataOps 워크플로우를 구축하여, AI 연구자와 MLOps 엔지니어의 생산성을 극대화
• 의료 규제(HIPAA, GDPR, EU AI Act 등)를 충족하는 보안·접근제어·감사 체계(RBAC, Audit Trail)를 설계
• GPU 대규모 학습 환경과 연동되는 학습 데이터 관리 파이프라인(Data Versioning, Lineage, Quality Check)을 구성
• Airflow·Prefect 등 Workflow Orchestrator 기반의 스케줄링·모니터링·장애 대응 자동화를 구축
• AI 기반 개발도구(Cursor, Codex, ChatGPT, Claude Code 등)을 적극 활용해 파이프라인 생성·테스트·문서화를 자동화하며 팀 전체의 생산성을 향상
• 플랫폼을 사용하는 연구자·엔지니어와 긴밀하게 협업하여, 실제 문제를 해결하는 운영 친화적 데이터 인프라를 구축
[Tech Stack]
AI Platform Department는 AI를 활용해 품질을 유지하면서 생산성을 극대화하는 엔지니어링 문화를 지향합니다.
• Core Technologies
• Python 기반 데이터·워크플로우 개발
• Prefect, Airflow 기반 ETL/ML 파이프라인
• PostgreSQL, BigQuery, Athena
• S3/GCS 기반 대용량 데이터 처리
• Kubernetes, Docker
• MLflow, DVC, LakeFS
• Kafka, Redis (필요 시)
• Security / Governance
• 의료 데이터 및 모델에 대한 Governance/Lineage
• RBAC 기반 안전한 데이터 접근
• 데이터 품질 검증 및 정책 기반 접근 관리
자격요건
• 데이터 플랫폼·파이프라인 설계/운영• 데이터 플랫폼/파이프라인 설계·운영 7년 이상의 실무 경험
• DataOps/MLOps 환경 구축 경험
• Airflow, Prefect 기반 ETL/ML 파이프라인 설계·운영 경험
• 분산 환경(S3/GCS/HDFS 등)에서의 대용량 파일·메타데이터 처리 경험
• 데이터 버전 관리(DVC, LakeFS) 및 메타데이터 추적 구현 경험
• 데이터 품질·보안·거버넌스
• 데이터 품질, 안정성, 보안, 거버넌스를 고려한 설계 경험
• RBAC, IAM, 정책 기반 접근제어 시스템 설계 경험
• 데이터 품질 지표 및 자동화된 테스트·검증 구축 경험
• AI·의료 도메인 이해
• 의료 데이터(DICOM, pathology, PHI 등) 이해 또는 학습 의지
• AI 모델 개발·임상 워크플로우 등 도메인 지식
• 플랫폼 아키텍처 및 운영 경험
• SaaS 기반 데이터 플랫폼 구축 경험
• 실시간/스트리밍 데이터 처리(Kafka, Flink 등) 경험
• 클라우드 비용 최적화 및 데이터 카탈로그 구축 경험
• 협업 및 커뮤니케이션
• AI Research, MLOps, Backend, 의료 전문가 등과의 협업 능력
• 요구사항 조율 및 기술적 커뮤니케이션 역량
• 영어 커뮤니케이션 역량
• 문제 정의 및 설계 역량
• 문제를 구조화하고 실행 가능한 설계·로드맵으로 구체화하는 분석력
• 사용자 중심의 플랫폼 구조 설계 경험
• 조직 기여 및 기술 성장
• 주니어 엔지니어 멘토링 경험











