포지션 상세
바이오리서치에이아이는 제약바이오 산업의 복잡한 의사결정을 데이터와 AI로 자동화하는 글로벌 서비스를 만들고 있습니다.
기사, 논문, 특허 등 다양한 텍스트 데이터를 수집·분석하여 제약바이오 리서치와 투자, 사업개발에 필요한 정보를 제공하는 AI 기반 데이터 플랫폼을 개발하고 있습니다.
데이터 엔지니어는 이러한 서비스의 기반이 되는 데이터를 수집·정제하고, 안정적인 데이터 파이프라인을 구축하는 역할을 담당합니다.
전 세계에서 생성되는 데이터를 효율적으로 수집하고, AI 모델과 서비스에 활용할 수 있는 형태로 가공하며, 데이터 품질을 지속적으로 개선해 나갑니다.
단순한 데이터 처리에 그치지 않고, 데이터 구조 설계부터 파이프라인 최적화, 서비스 연계까지 전 과정에 참여하며 제품의 핵심 기반을 함께 만들어가는 포지션입니다.
• 매일매일 수집된 데이터를 확인하고 이상이 없는지 확인해요.
• 인공지능 팀과 정확도를 높히기 위한 협업을 진행하고 있어요.
• 데이터 수집 현황을 모니터링하기 위한 대시보드 개발을 할 예정이에요.
• 그 외 논문, 특허 등 다양한 데이터 리소스를 수집할 예정이에요.
• 또한 필요에 따라 다양한 데이터 소싱 작업을 진행할 예정이에요.
[기술스택]
• Python (Selenium, BeautifulSoup4)
• MariaDB, MongoDB
• AWS, Github
• Airflow
• 파이썬으로 웹 스크래핑을 해보신 분이면 좋아요.
• 데이터 엔지니어링 관련 팀 프로젝트를 해보신 분이면 좋아요.
• 다양한 기술을 사용하여 개발을 진행보신 분이면 좋아요.
기사, 논문, 특허 등 다양한 텍스트 데이터를 수집·분석하여 제약바이오 리서치와 투자, 사업개발에 필요한 정보를 제공하는 AI 기반 데이터 플랫폼을 개발하고 있습니다.
데이터 엔지니어는 이러한 서비스의 기반이 되는 데이터를 수집·정제하고, 안정적인 데이터 파이프라인을 구축하는 역할을 담당합니다.
전 세계에서 생성되는 데이터를 효율적으로 수집하고, AI 모델과 서비스에 활용할 수 있는 형태로 가공하며, 데이터 품질을 지속적으로 개선해 나갑니다.
단순한 데이터 처리에 그치지 않고, 데이터 구조 설계부터 파이프라인 최적화, 서비스 연계까지 전 과정에 참여하며 제품의 핵심 기반을 함께 만들어가는 포지션입니다.
주요업무
• 매일매일 전세계 수많은 회사에서 보도자료를 수집하는 역할을 하고 있어요. 빠른 수집을 위해 병렬처리 프로그래밍을 이용해요.• 매일매일 수집된 데이터를 확인하고 이상이 없는지 확인해요.
• 인공지능 팀과 정확도를 높히기 위한 협업을 진행하고 있어요.
• 데이터 수집 현황을 모니터링하기 위한 대시보드 개발을 할 예정이에요.
• 그 외 논문, 특허 등 다양한 데이터 리소스를 수집할 예정이에요.
• 또한 필요에 따라 다양한 데이터 소싱 작업을 진행할 예정이에요.
[기술스택]
• Python (Selenium, BeautifulSoup4)
• MariaDB, MongoDB
• AWS, Github
• Airflow
자격요건
• 1~3년차 데이터 엔지니어링 경험이나 컴퓨터공학 관련 학사 혹은 그에 준하는 실력이 있으신 분이면 좋아요.• 파이썬으로 웹 스크래핑을 해보신 분이면 좋아요.
• 데이터 엔지니어링 관련 팀 프로젝트를 해보신 분이면 좋아요.
• 다양한 기술을 사용하여 개발을 진행보신 분이면 좋아요.





