LLM Engineer (Reinforcement Learning)

포지션 상세

We are looking for the best

LLM Engineer(Reinforcement Learning)는 LLM학습 파이프라인을 설계하여 실서비스에서 활용 가능한 생성형 언어모델을 학습합니다. 지속적인 품질 향상을 위하여 끊임없이 새로운 방법론을 시도하여, 실사용자에게 꼭 필요한 서비스를 출시하고, LLM 스스로 품질을 개선할 수 있도록 가다듬는 일에 기여합니다.

주요업무

• LLM학습 과정의 효율 향상: PLM 또는 Fine-tuned LLM의 Direct Alignment Algorithm / PPO, GRPO, DPO 등을 이용한 학습 과정의 전반적인 효율 향상
• 생성 결과의 전반적인 정확성과 안정성 향상: 생성 결과의 품질 향상을 위하여 Reward Hacking을 방지하고, Self-Refine이 가능한 학습 구조 설계
• 외부 지식 및 API와 연동 가능한 기초 모델 개발: 지시의 종류에 따라 스스로 필요한 외부 연동 Tool을 선택하는 LLM 학습

자격요건

• Deep Learning 또는 NLP 관련 경력 5년 이상
• 숙련된 프로그래밍 (Python & pytorch) 능력
• PyTorch를 활용한 모델 설계, 학습, 평가 및 최적화 경험
• GPU를 활용한 LLM 학습 및 Trouble shooting 능력
• 분산 학습 프레임워크(Slurm, DDP, Horovod 등) 사용 경험
• 동료와의 원활한 협업 능력

기술 스택 • 툴

마감일

상시채용

근무지역

경기 성남시 수정구 창업로40번길 20, A동 42dot

포티투닷(42dot)IT, 컨텐츠

본 채용 정보는 에서 제공한 자료를 바탕으로 원티드랩에서 표현을 수정하고 이의 배열 및 구성을 편집하여 완성한 원티드랩의 저작자산이자 영업자산입니다. 본 정보 및 데이터베이스의 일부 내지는 전부에 대하여 원티드랩의 동의 없이 무단전재 또는 재배포, 재가공 및 크롤링할 수 없으며, 게재된 채용기업의 정보는 구직자의 구직활동 이외의 용도로 사용될 수 없습니다. 원티드랩은 에서 게재한 자료에 대한 오류나 그 밖에 원티드랩이 가공하지 않은 정보의 내용상 문제에 대하여 어떠한 보장도 하지 않으며, 사용자가 이를 신뢰하여 취한 조치에 대해 책임을 지지 않습니다.
<저작권자 (주)원티드랩. 무단전재-재배포금지>

포지션 상세

주요업무

자격요건

기술 스택 • 툴

태그

마감일

근무지역