포지션 상세
바이오리서치에이아이는 사람 대신 자연어처리 모델이 제약바이오 관련 텍스트(기사, 논문, 특허 등)를 대신 읽고 처리할 수 있도록 자연어 처리 모델을 개발하고 이를 활용하여 데이터베이스 서비스, 메일링 서비스, 챗봇 서비스, 제약바이오 특화 커뮤니티를 개발중에 있어요.
그 중에서 검색엔진 엔지니어는 수천만개의 전세계 제약회사, 바이오텍 데이터를 open search에 동기화하고 FastAPI로 검색 및 집계 시스템을 개발하는 일을 합니다.
• 검색 엔진 스키마, 분석기(Tokenizer/Normalizer/Synonym), 랭킹 로직을 설계/최적화합니다.
• FastAPI 기반 검색 API 및 집계 API를 개발하고 운영합니다.
• 검색 품질 향상을 위한 실험(지표 정의, 로그 분석)을 진행합니다.
• 대용량 인덱스(수천만 건)의 업데이트/재색인 전략을 설계합니다.
• OpenSearch 모니터링, 쿼리 튜닝, 성능 병목 제거 작업을 수행합니다.
[핵심기술]
• Python: Python ETL, Batch/Streaming 기반 동기화(Kafka)
• FastAPI: 검색 API 및 집계 API 개발
• OpenSearch: 검색용 데이터베이스
• AWS: ECS/Fargate, EC2, RDS, OpenSearch Service, MSK
• Monitoring: Prometheus, Grafana, OpenSearch Dashboard
• 데이터베이스: MariaDB, OpenSearch, Redis
• Container / DevOps : Docker, GitHub Actions (CI/CD)
• 버전 관리 및 협업 도구 : Git / GitHub
• Django/Flask/FastAPI 중 하나 이상의 Python 웹 프레임워크 사용 경험
• REST API 개발 경험 또는 개인 프로젝트 수준의 구현 경험
• SQL 기초 이해 (조인·집계·인덱스에 대한 이해)
그 중에서 검색엔진 엔지니어는 수천만개의 전세계 제약회사, 바이오텍 데이터를 open search에 동기화하고 FastAPI로 검색 및 집계 시스템을 개발하는 일을 합니다.
주요업무
Python 기반 데이터 수집/가공 코드를 작성해 OpenSearch 인덱스에 동기화합니다.• 검색 엔진 스키마, 분석기(Tokenizer/Normalizer/Synonym), 랭킹 로직을 설계/최적화합니다.
• FastAPI 기반 검색 API 및 집계 API를 개발하고 운영합니다.
• 검색 품질 향상을 위한 실험(지표 정의, 로그 분석)을 진행합니다.
• 대용량 인덱스(수천만 건)의 업데이트/재색인 전략을 설계합니다.
• OpenSearch 모니터링, 쿼리 튜닝, 성능 병목 제거 작업을 수행합니다.
[핵심기술]
• Python: Python ETL, Batch/Streaming 기반 동기화(Kafka)
• FastAPI: 검색 API 및 집계 API 개발
• OpenSearch: 검색용 데이터베이스
• AWS: ECS/Fargate, EC2, RDS, OpenSearch Service, MSK
• Monitoring: Prometheus, Grafana, OpenSearch Dashboard
• 데이터베이스: MariaDB, OpenSearch, Redis
• Container / DevOps : Docker, GitHub Actions (CI/CD)
• 버전 관리 및 협업 도구 : Git / GitHub
자격요건
• Python 기반 프로젝트 경험• Django/Flask/FastAPI 중 하나 이상의 Python 웹 프레임워크 사용 경험
• REST API 개발 경험 또는 개인 프로젝트 수준의 구현 경험
• SQL 기초 이해 (조인·집계·인덱스에 대한 이해)






