포지션 상세
차세대 대규모 언어 모델 학습 시스템을 함께 구축할 LLM Training Engineer를 찾고 있습니다.
1. 이 포지션은 Reasoning, Code Generation, Tool Use, Agentic Workflow를 포함한 다양한 LLM 학습 및 강화 학습 시스템을 실제 Production 환경에서 설계하고 운영하는 역할입니다.
2. 최신 LLM 연구를 실제 대규모 학습 시스템으로 구현하며, GPU 인프라부터 모델 학습 최적화까지 전체 스택을 직접 다룹니다.
3. 프로젝트는 Reinforcement Learning for LLM, Efficient Reasoning, Synthetic Data Generation, Language-Specific Reward Model, Precise Instruction Following 등 LLM 성능 향상에 핵심적인 영역에 집중합니다.
• 대규모 Distributed GPU 환경에서 학습 시스템 구축 및 운영
• PyTorch, CUDA, DeepSpeed, FSDP 기반 학습 성능 최적화
• Reasoning, Code, Tool Use 모델을 위한 학습 및 평가 시스템 개발
• Synthetic Data Generation 및 Reward Model Pipeline 구축
• Throughput, Latency, Memory Efficiency 등 학습 성능 병목 분석 및 개선
• 최신 연구 결과를 Production-Grade Training System으로 구현
• Large-Scale Experimentation 및 Model Evaluation 자동화
• PyTorch 기반 학습 시스템 개발 경험
• Distributed Training 및 Multi-GPU Optimization 경험
• CUDA, NCCL, Mixed Precision 등 GPU Acceleration 이해
• DeepSpeed, FSDP, Megatron-LM 등 학습 프레임워크 경험
• RLHF, RLVR, DPO 등 Post-Training 기법에 대한 이해
• 팀워크를 중시하고, 긍정적인 태도로 동료들과 적극적으로 협력할 수 있으신 분
1. 이 포지션은 Reasoning, Code Generation, Tool Use, Agentic Workflow를 포함한 다양한 LLM 학습 및 강화 학습 시스템을 실제 Production 환경에서 설계하고 운영하는 역할입니다.
2. 최신 LLM 연구를 실제 대규모 학습 시스템으로 구현하며, GPU 인프라부터 모델 학습 최적화까지 전체 스택을 직접 다룹니다.
3. 프로젝트는 Reinforcement Learning for LLM, Efficient Reasoning, Synthetic Data Generation, Language-Specific Reward Model, Precise Instruction Following 등 LLM 성능 향상에 핵심적인 영역에 집중합니다.
주요업무
• Reinforcement Learning 기반의 LLM Training Pipeline 설계 및 개발• 대규모 Distributed GPU 환경에서 학습 시스템 구축 및 운영
• PyTorch, CUDA, DeepSpeed, FSDP 기반 학습 성능 최적화
• Reasoning, Code, Tool Use 모델을 위한 학습 및 평가 시스템 개발
• Synthetic Data Generation 및 Reward Model Pipeline 구축
• Throughput, Latency, Memory Efficiency 등 학습 성능 병목 분석 및 개선
• 최신 연구 결과를 Production-Grade Training System으로 구현
• Large-Scale Experimentation 및 Model Evaluation 자동화
자격요건
• LLM Training 또는 Large-Scale Deep Learning 경험• PyTorch 기반 학습 시스템 개발 경험
• Distributed Training 및 Multi-GPU Optimization 경험
• CUDA, NCCL, Mixed Precision 등 GPU Acceleration 이해
• DeepSpeed, FSDP, Megatron-LM 등 학습 프레임워크 경험
• RLHF, RLVR, DPO 등 Post-Training 기법에 대한 이해
• 팀워크를 중시하고, 긍정적인 태도로 동료들과 적극적으로 협력할 수 있으신 분





