포지션 상세
래브라도랩스는 최근 Series B 143억원 투자유치 완료하였습니다.
래브라도는 오픈소스 소프트웨어들이 갖고 있는 알려진 취약점(CVE)을 수집하여, 고객이 구현한 소프트웨어에 어떠한 보안 취약점이 있는지를 분석하고 해결방안을 제시해 주는 서비스입니다.
이번 채용은 다양한 웹 서비스로부터 비정형 데이터를 수집(Crawling/Scraping)하고, 분석 및 모델링이 가능한 형태의 고품질 데이터 세트로 정제(Cleaning)하는 프로세스를 구축합니다. 효율적이고 안정적인 데이터 파이프라인 운영을 통해 비즈니스 인사이트 도출의 기초를 마련하는 역할을 수행합니다.
* 데이터 정제 및 가공: 수집된 비정형 데이터(HTML, JSON 등)의 노이즈 제거, 텍스트 정규화, 결측치 처리 및 구조화
* 크롤링 자동화 및 모니터링: Airflow 등을 활용한 수집 스케줄링 관리 및 사이트 구조 변경에 따른 장애 대응 모니터링 시스템 운영
* 우회 기술 적용: 차단 정책 대응을 위한 Proxy 활용, User-Agent 최적화, 동적 페이지 렌더링 처리
* 크롤링 프레임워크 경험: BeautifulSoup, Scrapy, Selenium, Playwright 중 1개 이상의 실무 경험
* 웹 기술 이해: HTML5, CSS Selector, XPath, JavaScript, HTTP 통신(REST API)에 대한 깊은 이해
* 데이터베이스 활용: MySQL, PostgreSQL 등 RDBMS 또는 MongoDB와 같은 NoSQL 활용 경험
래브라도는 오픈소스 소프트웨어들이 갖고 있는 알려진 취약점(CVE)을 수집하여, 고객이 구현한 소프트웨어에 어떠한 보안 취약점이 있는지를 분석하고 해결방안을 제시해 주는 서비스입니다.
이번 채용은 다양한 웹 서비스로부터 비정형 데이터를 수집(Crawling/Scraping)하고, 분석 및 모델링이 가능한 형태의 고품질 데이터 세트로 정제(Cleaning)하는 프로세스를 구축합니다. 효율적이고 안정적인 데이터 파이프라인 운영을 통해 비즈니스 인사이트 도출의 기초를 마련하는 역할을 수행합니다.
주요업무
* 데이터 수집 체계 구축: Python을 활용하여 국내외 오픈소스, 라이선스, 취약점, 등의 데이터를 수집하는 스크래퍼 개발 및 유지보수* 데이터 정제 및 가공: 수집된 비정형 데이터(HTML, JSON 등)의 노이즈 제거, 텍스트 정규화, 결측치 처리 및 구조화
* 크롤링 자동화 및 모니터링: Airflow 등을 활용한 수집 스케줄링 관리 및 사이트 구조 변경에 따른 장애 대응 모니터링 시스템 운영
* 우회 기술 적용: 차단 정책 대응을 위한 Proxy 활용, User-Agent 최적화, 동적 페이지 렌더링 처리
자격요건
* Python 숙련도: Pandas, NumPy 등 데이터 핸들링 라이브러리 활용 능력* 크롤링 프레임워크 경험: BeautifulSoup, Scrapy, Selenium, Playwright 중 1개 이상의 실무 경험
* 웹 기술 이해: HTML5, CSS Selector, XPath, JavaScript, HTTP 통신(REST API)에 대한 깊은 이해
* 데이터베이스 활용: MySQL, PostgreSQL 등 RDBMS 또는 MongoDB와 같은 NoSQL 활용 경험






