포지션 상세
업스테이지는 AI 기술을 활용하여 비즈니스 문제 해결에 주력하는 기업으로, "Making AI Beneficial"이라는 비전과 "Artificial General Intelligence (AGI) for Work"라는 미션을 기반으로 운영됩니다. 단순한 업무 자동화를 넘어, 복잡한 의사결정 지원 및 비용 절감을 통해 기업의 생산성을 혁신적으로 향상시키는 AI 솔루션 개발에 집중하고 있습니다.
이러한 비전 실현을 위해 업스테이지는 AGI의 핵심 기반 기술인 LLM(Large Language Model) 모델을 지속적으로 발전시키고 있습니다. 기술 경쟁력 강화를 위해 Global Frontier에서 추적하는 벤치마크 지표를 통하여 모델 성능을 진단 및 개선하며, 동시에 고객사의 실제 니즈를 반영한 Workspace Benchmark Set을 구축해 모델의 실용성과 성능을 극대화에 활용하고 있습니다. 이를 통해 업스테이지는 산업 현장의 복잡한 문제를 해결하는 동시에 글로벌 수준의 기술 표준을 선도하기 위해 노력하고 있습니다.
LLM Post-training 팀은 (1) 지식/추론 능력 강화, (2) 인간 선호도 정렬(human preference alignment), (3) 에이전트형 도구 활용(agentic tool use) 성능 향상을 핵심 목표로 삼고, 확장 가능한 데이터 구축 방법론, 초고품질 데이터 필터링 시스템, DPO·RLHF·RLVR 등 최신 학습 기법을 활용해 세계 최고 수준의 사후 학습 기술 개발을 주도합니다. 이 팀에 합류한다면, 진화하는 LLM 기술을 선도하며 산업 현장의 문제를 해결하는 차세대 기술 혁신을 함께 실현할 수 있을 것 입니다.
• Reinforcement learning for LLM (math, code, general reasoning, tool use)
• Efficient & effective reasoning
• A scalable agentic tool use data synthesis pipeline
• Language-specific reward models
• Precise instruction following
** 기술의 흐름과 상황에 따라서 개발하는 프로젝트는 변화하며, 프로젝트는 각 시점에 LLM 모델 발전에 가장 영향력있는 기술 요소에 집중합니다.
[근무 형태]
• 정규직/인턴십(체험형, 3개월~6개월)
• LLM post-training/fine-tuning을 수행하여 특정 문제에서 최고 성능을 달성해본 경험
• ML과 NLP 토픽으로 국제 학회에서 출판 기록 (1저자 혹은 교신저자)
May helpful
• AI 관련 연구 또는 프로덕트 개발을 리딩한 경험
• LLM Post-training을 위한 데이터 수집, 생성, 정제등을 수행해 본 경험
• 국제 혹은 국내 AI 대회 (Kaggle 등) 상위권 입상
• 0.1%의 성능에 민감하여 제한된 자원과 시간에 최적화를 수행할 수 있는 집중력
• 논리적인 사고실험을 수행하고 가설/검증의 방식으로 실험 설계 및 결과를 도출할 수 있는 사고력
• 레슨런을 효과적이고 효율적으로 전파하고 논의할 수 있는 의사소통 능력
이러한 비전 실현을 위해 업스테이지는 AGI의 핵심 기반 기술인 LLM(Large Language Model) 모델을 지속적으로 발전시키고 있습니다. 기술 경쟁력 강화를 위해 Global Frontier에서 추적하는 벤치마크 지표를 통하여 모델 성능을 진단 및 개선하며, 동시에 고객사의 실제 니즈를 반영한 Workspace Benchmark Set을 구축해 모델의 실용성과 성능을 극대화에 활용하고 있습니다. 이를 통해 업스테이지는 산업 현장의 복잡한 문제를 해결하는 동시에 글로벌 수준의 기술 표준을 선도하기 위해 노력하고 있습니다.
LLM Post-training 팀은 (1) 지식/추론 능력 강화, (2) 인간 선호도 정렬(human preference alignment), (3) 에이전트형 도구 활용(agentic tool use) 성능 향상을 핵심 목표로 삼고, 확장 가능한 데이터 구축 방법론, 초고품질 데이터 필터링 시스템, DPO·RLHF·RLVR 등 최신 학습 기법을 활용해 세계 최고 수준의 사후 학습 기술 개발을 주도합니다. 이 팀에 합류한다면, 진화하는 LLM 기술을 선도하며 산업 현장의 문제를 해결하는 차세대 기술 혁신을 함께 실현할 수 있을 것 입니다.
주요업무
[Representative projects]• Reinforcement learning for LLM (math, code, general reasoning, tool use)
• Efficient & effective reasoning
• A scalable agentic tool use data synthesis pipeline
• Language-specific reward models
• Precise instruction following
** 기술의 흐름과 상황에 따라서 개발하는 프로젝트는 변화하며, 프로젝트는 각 시점에 LLM 모델 발전에 가장 영향력있는 기술 요소에 집중합니다.
[근무 형태]
• 정규직/인턴십(체험형, 3개월~6개월)
자격요건
Strongly wanted• LLM post-training/fine-tuning을 수행하여 특정 문제에서 최고 성능을 달성해본 경험
• ML과 NLP 토픽으로 국제 학회에서 출판 기록 (1저자 혹은 교신저자)
May helpful
• AI 관련 연구 또는 프로덕트 개발을 리딩한 경험
• LLM Post-training을 위한 데이터 수집, 생성, 정제등을 수행해 본 경험
• 국제 혹은 국내 AI 대회 (Kaggle 등) 상위권 입상
• 0.1%의 성능에 민감하여 제한된 자원과 시간에 최적화를 수행할 수 있는 집중력
• 논리적인 사고실험을 수행하고 가설/검증의 방식으로 실험 설계 및 결과를 도출할 수 있는 사고력
• 레슨런을 효과적이고 효율적으로 전파하고 논의할 수 있는 의사소통 능력