포지션 상세
에비드넷은 병원 데이터에 기반한 실제 임상 근거(Real World Evidence, RWE) 솔루션을 제공하고 생명과학 및 헬스케어 산업의 연구개발과 비즈니스 의사결정을 지원하는 헬스케어 IT 기업입니다.
국내 50여 개 대학병원 및 상급/종합병원과 협력하여 OMOP-CDM 표준을 활용한 실제 임상 데이터(Real World Data, RWD)를 구축하고 있습니다.
FeederNet 데이터 플랫폼은 개인정보 보호와 보안을 유지하면서 다기관 연구와 AI 연합학습(Federated Learning)을 가능하게 합니다. 우리의 솔루션과 AI 기술은 R&D부터 상용화에 이르기까지 고객에게 다양한 인사이트를 제공합니다.
워크플로우 오케스트레이션: Digdag 또는 Airflow를 이용한 파이프라인 생명주기(Lifecycle) 스케줄링 및 모니터링 자동화
데이터 품질 및 정합성 보장: DQ(Data Quality) 체크 로직 구현 및 멱등성(Idempotency)을 고려한 파이프라인 설계
의료 데이터 표준화: 의료 도메인 지식 기반 민감 정보 비식별화 및 분석용 데이터셋 변환 자동화
워크플로우 설계 역량: Digdag, Airflow 등 오픈소스 엔진을 활용한 태스크 의존성 관리 및 자동화 경험
SQL 전문성: SQLD 자격 보유자 또는 이에 준하는 RDB 및 SQL 쿼리 최적화 지식 보유자
데이터 수집 기술: ETL 생태계 이해 및 대용량 데이터 마이그레이션 시 성능 병목 해결 역량
대용량 데이터 처리: Spark, DuckDB 등을 활용한 대규모 데이터 처리 인프라 구축 및 운영 유경험자
국내 50여 개 대학병원 및 상급/종합병원과 협력하여 OMOP-CDM 표준을 활용한 실제 임상 데이터(Real World Data, RWD)를 구축하고 있습니다.
FeederNet 데이터 플랫폼은 개인정보 보호와 보안을 유지하면서 다기관 연구와 AI 연합학습(Federated Learning)을 가능하게 합니다. 우리의 솔루션과 AI 기술은 R&D부터 상용화에 이르기까지 고객에게 다양한 인사이트를 제공합니다.
주요업무
컨테이너 기반 데이터 파이프라인 구축: Linux 및 Docker 환경에서 Embulk를 활용한 고효율 데이터 수집(Ingestion) 프로세스 설계 및 운영워크플로우 오케스트레이션: Digdag 또는 Airflow를 이용한 파이프라인 생명주기(Lifecycle) 스케줄링 및 모니터링 자동화
데이터 품질 및 정합성 보장: DQ(Data Quality) 체크 로직 구현 및 멱등성(Idempotency)을 고려한 파이프라인 설계
의료 데이터 표준화: 의료 도메인 지식 기반 민감 정보 비식별화 및 분석용 데이터셋 변환 자동화
자격요건
인프라 활용 능력: Linux OS 숙련 및 Docker를 활용한 서비스 컨테이너화/환경 격리 운영 경험워크플로우 설계 역량: Digdag, Airflow 등 오픈소스 엔진을 활용한 태스크 의존성 관리 및 자동화 경험
SQL 전문성: SQLD 자격 보유자 또는 이에 준하는 RDB 및 SQL 쿼리 최적화 지식 보유자
데이터 수집 기술: ETL 생태계 이해 및 대용량 데이터 마이그레이션 시 성능 병목 해결 역량
대용량 데이터 처리: Spark, DuckDB 등을 활용한 대규모 데이터 처리 인프라 구축 및 운영 유경험자


