포지션 상세
뛰어난 동료들과 함께 도전하고 성장하세요!
크라우드웍스는 네이버, LG, KT 등 국내 주요 ICT 기업을 포함해,
다양한 산업 분야 500개 이상의 기업이 선택한 대한민국 대표 AI 테크 기업입니다.
네이버 하이퍼클로바X, LG 엑사원 등 초거대 언어모델(LLM) 학습 데이터 구축에 참여하며
국내 최고 수준의 데이터 기술력을 인정받아,
2023년 8월 업계 최초로 코스닥 시장에 상장하는 성과를 이루었습니다.
독보적인 데이터 전문성을 기반으로 LLM 분야에서 차별화된 경쟁력을 갖추고 있으며,
가트너 보고서와 CB 인사이트에도 생성형 AI 기술 공급기업으로 등재되는 등
해외 시장에서도 기술력을 인정받고 있습니다.
크라우드웍스 동료들은 데이터를 바탕으로 신뢰할 수 있는 AI를 구축하는
최고의 테크 기업으로 성장하기 위해 노력하고 있습니다.
크라우드웍스 AI 연구개발본부 데이터플랫폼팀에서
데이터 수집·파싱·청킹·임베딩·검색까지 이어지는 LLM 기반 데이터 파이프라인을 설계·구현·운영합니다.
비정형 데이터 처리부터 LLM 기반 검색 시스템까지 이어지는 파이프라인을 구축하고, 이를 안정적으로 운영하는 백엔드 엔지니어의 역할을 수행합니다.
※ 주요업무
• Java 또는 Kotlin 기반 Spring Framework를 활용한 애플리케이션 개발
• Vector DB(OpenSearch 등) 기반 검색·색인 아키텍처 설계 및 운영
• 문서 청킹(Chunking) 전략 설계 및 품질 개선
• 문서 구조 기반 Chunking
• Context-aware Chunking
• Hybrid Search(Vector + Keyword) 최적화
• 임베딩 모델 연계 및 벡터 인덱스 운영
• Embedding 생성·적재 파이프라인 개발
• Re-indexing 및 모델 변경 대응
• 검색 성능 최적화 및 대용량 데이터 운영
• Shard/Replica 설계
• Index Lifecycle 및 Scale-out 전략
• Vector Search 성능 튜닝
• Java·Spring Boot·Python 등 백엔드 서비스 개발 경험
• Vector DB 설계·운영 경험
• 청킹 전략 설계·개발·운영
• OpenSearch 등
• Chunking·Embedding·Search 구조에 대한 이해
• 대용량 데이터 처리 및 운영 경험
• 문제 해결 및 운영 안정화 경험
크라우드웍스는 네이버, LG, KT 등 국내 주요 ICT 기업을 포함해,
다양한 산업 분야 500개 이상의 기업이 선택한 대한민국 대표 AI 테크 기업입니다.
네이버 하이퍼클로바X, LG 엑사원 등 초거대 언어모델(LLM) 학습 데이터 구축에 참여하며
국내 최고 수준의 데이터 기술력을 인정받아,
2023년 8월 업계 최초로 코스닥 시장에 상장하는 성과를 이루었습니다.
독보적인 데이터 전문성을 기반으로 LLM 분야에서 차별화된 경쟁력을 갖추고 있으며,
가트너 보고서와 CB 인사이트에도 생성형 AI 기술 공급기업으로 등재되는 등
해외 시장에서도 기술력을 인정받고 있습니다.
크라우드웍스 동료들은 데이터를 바탕으로 신뢰할 수 있는 AI를 구축하는
최고의 테크 기업으로 성장하기 위해 노력하고 있습니다.
주요업무
※ BE 엔지니어의 역할크라우드웍스 AI 연구개발본부 데이터플랫폼팀에서
데이터 수집·파싱·청킹·임베딩·검색까지 이어지는 LLM 기반 데이터 파이프라인을 설계·구현·운영합니다.
비정형 데이터 처리부터 LLM 기반 검색 시스템까지 이어지는 파이프라인을 구축하고, 이를 안정적으로 운영하는 백엔드 엔지니어의 역할을 수행합니다.
※ 주요업무
• Java 또는 Kotlin 기반 Spring Framework를 활용한 애플리케이션 개발
• Vector DB(OpenSearch 등) 기반 검색·색인 아키텍처 설계 및 운영
• 문서 청킹(Chunking) 전략 설계 및 품질 개선
• 문서 구조 기반 Chunking
• Context-aware Chunking
• Hybrid Search(Vector + Keyword) 최적화
• 임베딩 모델 연계 및 벡터 인덱스 운영
• Embedding 생성·적재 파이프라인 개발
• Re-indexing 및 모델 변경 대응
• 검색 성능 최적화 및 대용량 데이터 운영
• Shard/Replica 설계
• Index Lifecycle 및 Scale-out 전략
• Vector Search 성능 튜닝
자격요건
• 백엔드 또는 데이터 플랫폼 개발 경력 7년 이상• Java·Spring Boot·Python 등 백엔드 서비스 개발 경험
• Vector DB 설계·운영 경험
• 청킹 전략 설계·개발·운영
• OpenSearch 등
• Chunking·Embedding·Search 구조에 대한 이해
• 대용량 데이터 처리 및 운영 경험
• 문제 해결 및 운영 안정화 경험










