업스테이지-Senior Data Engineer - LLM
1/1
업스테이지경기 경력 7-15년

Senior Data Engineer - LLM

포지션 상세

업스테이지는 AI 기술을 활용하여 비즈니스 문제를 해결하는 데 주력하고 있습니다. “Making AI Beneficial” 이라는 비전과 “Building intelligence for the future of work” 라는 미션을 바탕으로, 단순한 업무 자동화를 넘어서 복잡한 의사결정 지원 및 비용 절감을 통해 기업의 생산성을 증진시킬 수 있는 AI 제품과 솔루션을 제공합니다. 이를 통해 우리는 기업들이 업무 처리 방식을 혁신하고 더욱 효율적으로 성장할 수 있도록 지원합니다.

업스테이지는 누구나 손쉽게 AI 기술을 활용할 수 있도록 ‘사용이 쉬운 AI 솔루션’을 제공하는 것을 목표로 하고 있습니다. 이미 최고 수준의 OCR 기술과 문서 내 의미 있는 정보를 자동으로 추출하는 Key-Value 추출 기술을 보유하고 있으며, 최근에는 다양한 문서 레이아웃을 분석하는 Document Parsing 모델을 공개하였습니다. 이러한 기술들을 바탕으로, 업스테이지는 기업들의 업무 효율과 생산성을 극대화하는 맞춤형 AI 솔루션을 제공하여 AI가 실제 비즈니스에서 큰 가치를 창출할 수 있도록 노력하고 있습니다.

또한 LLM 기술을 비즈니스 환경에 맞게 최적화해 기업들의 업무 효율과 생산성을 높일 수 있는 Private LLM 서비스를 제공하는 등 AI가 세상에 이롭게 쓰이게 하기 위해 세계 최고 수준의 AI 모델을 다양한 분야에서 손쉽게 활용할 수 있는 API 시리즈를 출시하여 기업 고객들의 비즈니스 성공에 기여하고 있습니다. 그 중에서 업스테이지 Document AI는 세계 최고 수준의 OCR 및 정보추출 기술력을 바탕으로 한 제품으로, AI를 통해 번거로운 문서 처리를 자동화하고 효율화하겠다는 목표를 가지고 있습니다.

데이터는 최근 LLM 개발의 전부라고 생각이 될 정도로 중요하게 판단되고 있습니다. 해당 직무는 좋은 데이터를 인수, 처리, 사용, 발전하는 데이터 리니지(data lineage)를 설계하고 그에 필요한 툴을 개발하는 업무를 수행하여 Upstage의 LLM 개발 사이클을 더 나은 방향으로 발전시킵니다. 현재 중요하게 생각되는 (1) 데이터 전처리 파이프라인, (2) 데이터 관리 시스템, (3) 휴먼 피드백 파이프라인 개발에 기여하여 발전을 시킬 수 있으며, 그 외에 더 큰 뷰에서 데이터 리니지를 개선, 확장하는 롤을 수행합니다.

Upstage의 LLM Data Team은 크게 Data Engineer, Data Curator, Human Annotation Manager로 구성이 되어 있으며, Solar의 데이터 리니지를 설계하고 개발하며, 이를 통하여 좋은 데이터를 인수, 개선을 수행합니다.

주요업무

주요 업무
• LLM 데이터 전처리 자동화 파이프라인 설계 및 개발
• LLM 데이터 관리 시스템 설계 및 개발
• Human Feedback Tool 설계 및 개발
• 데이터 획득, 제작, 개선을 위한 LLM Data Lineage 개발

근무 형태
• 정규직

*지원자의 민감 정보(연봉 정보, 주민번호 등) 및 고유식별번호는 이력서에 기재하지 않도록 유의해주시기를 바랍니다.
*제출하시는 모든 문서는 반드시 PDF 파일로 업로드해주시기를 바랍니다.

자격요건

• API 설계, 개발 및 유지보수 경력 3~10년 또는 그에 준하는 개발 업무 역량
• 아래 3가지 요건 중 최소 1가지 충족
1) supervised fine-tuning (SFT), Reinforcement Learning from Human Feedback (RLHF) 등에 대한 개념적 이해
2) LLM 및 MLLM을 위한 사전 훈련 데이터의 최근 동향에 대한 이해
3)레이블이 지정된 데이터 구성(LLM용), 데이터 큐레이션 및 데이터 합성에 대한 경험
• AI 기술에 대한 최소 7년 이상의 경험(M.S. 및 Ph.D 기간 포함)

기술 스택 • 툴

태그

마감일

상시채용

근무지역

리모트근무
본 채용정보는 원티드랩의 동의없이 무단전재, 재배포, 재가공할 수 없으며, 구직활동 이외의 용도로 사용할 수 없습니다.

본 채용 정보는 에서 제공한 자료를 바탕으로 원티드랩에서 표현을 수정하고 이의 배열 및 구성을 편집하여 완성한 원티드랩의 저작자산이자 영업자산입니다. 본 정보 및 데이터베이스의 일부 내지는 전부에 대하여 원티드랩의 동의 없이 무단전재 또는 재배포, 재가공 및 크롤링할 수 없으며, 게재된 채용기업의 정보는 구직자의 구직활동 이외의 용도로 사용될 수 없습니다. 원티드랩은 에서 게재한 자료에 대한 오류나 그 밖에 원티드랩이 가공하지 않은 정보의 내용상 문제에 대하여 어떠한 보장도 하지 않으며, 사용자가 이를 신뢰하여 취한 조치에 대해 책임을 지지 않습니다.
<저작권자 (주)원티드랩. 무단전재-재배포금지>