래브라도랩스-파이썬 기반 데이터 크롤링 및 정제 담당자
래브라도랩스-파이썬 기반 데이터 크롤링 및 정제 담당자
래브라도랩스-파이썬 기반 데이터 크롤링 및 정제 담당자
래브라도랩스-파이썬 기반 데이터 크롤링 및 정제 담당자
래브라도랩스-파이썬 기반 데이터 크롤링 및 정제 담당자
래브라도랩스-파이썬 기반 데이터 크롤링 및 정제 담당자
1/6
래브라도랩스서울 서초구경력 5-11년

파이썬 기반 데이터 크롤링 및 정제 담당자

포지션 상세

래브라도랩스는 최근 Series B 143억원 투자유치 완료하였습니다.
래브라도는 오픈소스 소프트웨어들이 갖고 있는 알려진 취약점(CVE)을 수집하여, 고객이 구현한 소프트웨어에 어떠한 보안 취약점이 있는지를 분석하고 해결방안을 제시해 주는 서비스입니다.

이번 채용은 다양한 웹 서비스로부터 비정형 데이터를 수집(Crawling/Scraping)하고, 분석 및 모델링이 가능한 형태의 고품질 데이터 세트로 정제(Cleaning)하는 프로세스를 구축합니다. 효율적이고 안정적인 데이터 파이프라인 운영을 통해 비즈니스 인사이트 도출의 기초를 마련하는 역할을 수행합니다.

주요업무

* 데이터 수집 체계 구축: Python을 활용하여 국내외 오픈소스, 라이선스, 취약점, 등의 데이터를 수집하는 스크래퍼 개발 및 유지보수
* 데이터 정제 및 가공: 수집된 비정형 데이터(HTML, JSON 등)의 노이즈 제거, 텍스트 정규화, 결측치 처리 및 구조화
* 크롤링 자동화 및 모니터링: Airflow 등을 활용한 수집 스케줄링 관리 및 사이트 구조 변경에 따른 장애 대응 모니터링 시스템 운영
* 우회 기술 적용: 차단 정책 대응을 위한 Proxy 활용, User-Agent 최적화, 동적 페이지 렌더링 처리

자격요건

* Python 숙련도: Pandas, NumPy 등 데이터 핸들링 라이브러리 활용 능력
* 크롤링 프레임워크 경험: BeautifulSoup, Scrapy, Selenium, Playwright 중 1개 이상의 실무 경험
* 웹 기술 이해: HTML5, CSS Selector, XPath, JavaScript, HTTP 통신(REST API)에 대한 깊은 이해
* 데이터베이스 활용: MySQL, PostgreSQL 등 RDBMS 또는 MongoDB와 같은 NoSQL 활용 경험

기술 스택 • 툴

태그

마감일

2026.05.31

근무지역

서울특별시 서초구 반포대로 20, 3,4층
본 채용정보는 원티드랩의 동의없이 무단전재, 재배포, 재가공할 수 없으며, 구직활동 이외의 용도로 사용할 수 없습니다.
본 채용 정보는 에서 제공한 자료를 바탕으로 원티드랩에서 표현을 수정하고 이의 배열 및 구성을 편집하여 완성한 원티드랩의 저작자산이자 영업자산입니다. 본 정보 및 데이터베이스의 일부 내지는 전부에 대하여 원티드랩의 동의 없이 무단전재 또는 재배포, 재가공 및 크롤링할 수 없으며, 게재된 채용기업의 정보는 구직자의 구직활동 이외의 용도로 사용될 수 없습니다. 원티드랩은 에서 게재한 자료에 대한 오류나 그 밖에 원티드랩이 가공하지 않은 정보의 내용상 문제에 대하여 어떠한 보장도 하지 않으며, 사용자가 이를 신뢰하여 취한 조치에 대해 책임을 지지 않습니다.
<저작권자 (주)원티드랩. 무단전재-재배포금지>