포지션 상세
영상 장면 분석부터 전문성 분석 기반의 유튜버 추천 AI까지 멋있어 보이는 서비스들을 시도했지만, 결과는 실패였습니다.
"유튜브 광고들 한 곳에서 볼 수 있는 서비스 좀 만들어주세요"
한 유저의 요청에 '유튜브 광고 검색기' 라는 프로토타입을 만들었습니다.
이제 '유튜브 광고 검색기'는 광고 없이 1만 5천 명 이상의 유저와 1500개 이상의 기업이 사용하는 서비스가 되었습니다.
하이픈은 우리가 만들고 싶은 서비스가 아닌 유저들이 원하는 웹서비스를 만들고 있습니다.
• Elasticsearch/OpenSearch 인덱스 관리 및 full-text / 벡터 검색 품질 개선
• RAG·MCP 기반 AI 에이전트 파이프라인에 필요한 피처·메타데이터 공급 및 스키마 설계
• 데이터 웨어하우스에 적재된 로그로부터 BI 대시보드용 집계 테이블 생성·자동화
• Python ETL
• Python 3.x 기반 데이터 수집·전처리
• Airflow 또는 Prefect로 워크플로 자동화
• SQL & DB
• MySQL 실전 운영 경험(인덱싱·쿼리 튜닝)
• Databricks SQL 또는 Delta Lake 경험
• API 연동
• YouTube Data API v3 또는 기타 SNS API 호출·쿼터 관리
• 클라우드 & 컨테이너
• Azure Storage / Data Factory 기본 사용 경험
• Docker 기반 개발·배포
• RAG & 에이전트 생태계
• LangChain·LangGraph 등 RAG 파이프라인 설계 이해
• MCP(Model Context Protocol)·Tool/Skill Registry 개념 이해
• 버전 관리 & 협업
• Git flow, PR 리뷰, 영어·한국어 기술 문서 작성
"유튜브 광고들 한 곳에서 볼 수 있는 서비스 좀 만들어주세요"
한 유저의 요청에 '유튜브 광고 검색기' 라는 프로토타입을 만들었습니다.
이제 '유튜브 광고 검색기'는 광고 없이 1만 5천 명 이상의 유저와 1500개 이상의 기업이 사용하는 서비스가 되었습니다.
하이픈은 우리가 만들고 싶은 서비스가 아닌 유저들이 원하는 웹서비스를 만들고 있습니다.
주요업무
• 매일 크롤링되는 YouTube 데이터(영상·채널·광고 지표)의 수집·정제 파이프라인 설계·운영• Elasticsearch/OpenSearch 인덱스 관리 및 full-text / 벡터 검색 품질 개선
• RAG·MCP 기반 AI 에이전트 파이프라인에 필요한 피처·메타데이터 공급 및 스키마 설계
• 데이터 웨어하우스에 적재된 로그로부터 BI 대시보드용 집계 테이블 생성·자동화
자격요건
필수 기술 스택• Python ETL
• Python 3.x 기반 데이터 수집·전처리
• Airflow 또는 Prefect로 워크플로 자동화
• SQL & DB
• MySQL 실전 운영 경험(인덱싱·쿼리 튜닝)
• Databricks SQL 또는 Delta Lake 경험
• API 연동
• YouTube Data API v3 또는 기타 SNS API 호출·쿼터 관리
• 클라우드 & 컨테이너
• Azure Storage / Data Factory 기본 사용 경험
• Docker 기반 개발·배포
• RAG & 에이전트 생태계
• LangChain·LangGraph 등 RAG 파이프라인 설계 이해
• MCP(Model Context Protocol)·Tool/Skill Registry 개념 이해
• 버전 관리 & 협업
• Git flow, PR 리뷰, 영어·한국어 기술 문서 작성