포지션 상세
업스테이지는 AI 기술을 활용하여 비즈니스 문제를 해결하는 데 주력하고 있습니다. “Making AI Beneficial” 이라는 비전과 “Building intelligence for the future of work” 라는 미션을 바탕으로, 단순한 업무 자동화를 넘어서 복잡한 의사결정 지원 및 비용 절감을 통해 기업의 생산성을 증진시킬 수 있는 AI 제품과 솔루션을 제공합니다. 이를 통해 우리는 기업들이 업무 처리 방식을 혁신하고 더욱 효율적으로 성장할 수 있도록 지원합니다.
업스테이지는 누구나 손쉽게 AI 기술을 활용할 수 있도록 ‘사용이 쉬운 AI 솔루션’을 제공하는 것을 목표로 하고 있습니다. 이미 최고 수준의 OCR 기술과 문서 내 의미 있는 정보를 자동으로 추출하는 Key-Value 추출 기술을 보유하고 있으며, 최근에는 다양한 문서 레이아웃을 분석하는 Document Parsing 모델을 공개하였습니다. 이러한 기술들을 바탕으로, 업스테이지는 기업들의 업무 효율과 생산성을 극대화하는 맞춤형 AI 솔루션을 제공하여 AI가 실제 비즈니스에서 큰 가치를 창출할 수 있도록 노력하고 있습니다.
또한 LLM 기술을 비즈니스 환경에 맞게 최적화해 기업들의 업무 효율과 생산성을 높일 수 있는 Private LLM 서비스를 제공하는 등 AI가 세상에 이롭게 쓰이게 하기 위해 세계 최고 수준의 AI 모델을 다양한 분야에서 손쉽게 활용할 수 있는 API 시리즈를 출시하여 기업 고객들의 비즈니스 성공에 기여하고 있습니다. 그 중에서 업스테이지 Document AI는 세계 최고 수준의 OCR 및 정보추출 기술력을 바탕으로 한 제품으로, AI를 통해 번거로운 문서 처리를 자동화하고 효율화하겠다는 목표를 가지고 있습니다.
Enterprise AI Workspace는 기업 내부의 문서 · 데이터 · 시스템을 LLM과 결합해 "찾고, 정리하고, 작성하는 일"에 쓰던 시간을 더 본질적인 판단과 창작에 쓸 수 있도록 만드는 Agent 플랫폼 입니다. 이 포지션은 Enterprise AI Workspace를 만드는 풀스택 AI 엔지니어 역할입니다. 백엔드 API 설계, 수만~수십만 건 규모의 사내 문서를 다루는 RAG 파이프라인, 비용·품질·지연시간을 함께 고려한 모델 라우팅, Agent Harness, 그리고 이 모든 것이 고객 환경에서 실제로 잘 동작하는지 측정·개선하는 인프라까지 — 한 사람이 한 기능의 흐름 전체를 책임지고 끌고 가는 방식으로 일합니다.
특히 다음과 같은 문제를 함께 풀어갈 분을 찾고 있습니다.
- 데모 수준의 AI 기능을 "고객사에서 매일 쓸 수 있는" 프로덕션 제품으로 만드는 일
- 고객사마다 다른 데이터·권한·보안 요구사항 안에서도 동작하는 Agent 아키텍처 설계
- LLM 응답 품질을 정성적 감이 아닌 측정 가능한 지표로 만들고, 회귀를 막는 평가 체계 구축
- 새로운 모델·기법이 등장할 때마다 기존 설계를 빠르게 재구성할 수 있는 시스템 만들기
AI EWS Engineering 팀은 소수의 풀스택 AI 엔지니어가 제품·디자인·연구 조직과 가깝게 협업하는 형태로 운영됩니다. "한 명이 한 기능을 설계부터 운영까지 책임지되, 혼자 일하지는 않는다"가 팀이 일하는 방식입니다.
- 각자의 경계 안에서만 일하지 않고 시스템의 설계 → 구현 → 배포 → 운영 전 과정을 직접 운영하고 관리합니다.
- Claude Code, Codex 등 AI 툴을 적극 활용하여 더 나은 결과를 만드는 데 집중합니다.
- 명세 · 테스트 · 코드 · 다이어그램 같은 기준을 이용하여 "spec ↔ test ↔ code”의 형상을 관리하고 애플리케이션의 안정성을 높입니다.
팀이 중요하게 여기는 것들:
- AI 도구를 적극적으로 활용해 개인의 산출 범위를 확장합니다. Claude Code, Codex 등을 일상 워크플로우에 녹여 쓰며, "AI를 잘 쓰는 것" 자체를 엔지니어링 역량의 일부로 봅니다.
- 의사결정의 근거를 문서·다이어그램·평가 데이터로 남깁니다. 회의록보다 디자인 문서와 PR이, 개인의 인상보다 eval 결과가 우선합니다.
- 모델·프롬프트·검색 전략에 대한 의견 차이는 토론이 아니라 실험으로 정리합니다. 평가셋을 먼저 만들고, 그 위에서 옵션을 비교합니다.
- 6개월이면 모범 사례가 바뀌는 영역임을 받아들입니다. 새 모델이 나오면 라우팅과 평가셋부터 다시 짜는 일이 자연스럽습니다.
업스테이지의 자체 모델(Solar 시리즈)과 외부 프론티어 모델을 함께 다루기 때문에, 연구 조직과의 거리도 가깝습니다. 모델 사이드의 한계를 제품 디자인으로 보완하거나, 반대로 제품에서 발견한 문제를 모델 팀에 피드백하는 일이 자연스럽게 일어납니다.
- 사내 문서·데이터를 다루는 RAG 파이프라인을 구축하고 품질을 개선합니다. 임베딩 전략, 청크 분할, 재랭킹, 메타데이터 필터링, 권한 기반 검색까지 — 검색 품질이 곧 제품 품질이라는 전제로 일합니다.
- 멀티 모델 라우팅과 비용·품질·지연시간 최적화를 책임집니다. 자체 모델(Solar)과 외부 프론티어 모델을 함께 다루며, 기능·고객·트래픽 특성에 맞는 모델 선택과 운영 전략을 만듭니다.
- AI 기능의 평가(eval) 체계를 설계하고 자동화합니다. 새 모델·프롬프트·검색 전략 변경이 회귀 없이 배포될 수 있도록 정량 평가를 CI에 녹이고, 평가셋 자체를 제품과 함께 성장시킵니다.
- 프로덕션 LLM 시스템의 백엔드·observability·안전성 운영을 함께 만들어 갑니다. 멀티테넌시 데이터 모델, 인증·권한, 호출 추적과 비용 모니터링, prompt injection 방어 등 엔터프라이즈 환경에서 매일 쓰이는 시스템에 필요한 기반을 다집니다.
- 설계 → 구현 → 배포 → 운영까지 전체 프로세스를 이끌어 갈 수 있는 분
- AI 코딩 도구(Claude Code, Codex 등)를 적극적으로 사용하는 분
- 문서 · 다이어그램 · 테스트 기반 산출물 협업 방식이 자연스러운 분
- LLM 동작에 대한 실무 감각을 가지고 계신 분
프롬프트, RAG, tool calling / agent loop, eval 설계 및 최적화 작업을 실제 서비스에 반영해본 경험이 있는 분
모델별 강·약점, 비용·latency trade-off 를 모델 선택·라우팅 결정에 반영해본 경험이 있는 분
- 멀티테넌시, RBAC/SSO, 데이터 격리, 감사 로그 등 B2B SaaS의 기본기를 갖추고 있으며 엔터프라이즈 환경 제약 내에서 개발해본 경험이 있는 분
- 고객사별 코퍼스가 수만~수십만 건 규모로 분리되어 운영되는 대규모 문서/지식베이스 RAG 시스템을 설계해본 경험이 있는 분
- Langfuse, LangSmith 또는 자체 구축을 통해 추적·비용·응답 품질 모니터링이 Production-grade로 갖춰진 LLM Observability 시스템을 만들어본 경험이 있는 분
업스테이지는 누구나 손쉽게 AI 기술을 활용할 수 있도록 ‘사용이 쉬운 AI 솔루션’을 제공하는 것을 목표로 하고 있습니다. 이미 최고 수준의 OCR 기술과 문서 내 의미 있는 정보를 자동으로 추출하는 Key-Value 추출 기술을 보유하고 있으며, 최근에는 다양한 문서 레이아웃을 분석하는 Document Parsing 모델을 공개하였습니다. 이러한 기술들을 바탕으로, 업스테이지는 기업들의 업무 효율과 생산성을 극대화하는 맞춤형 AI 솔루션을 제공하여 AI가 실제 비즈니스에서 큰 가치를 창출할 수 있도록 노력하고 있습니다.
또한 LLM 기술을 비즈니스 환경에 맞게 최적화해 기업들의 업무 효율과 생산성을 높일 수 있는 Private LLM 서비스를 제공하는 등 AI가 세상에 이롭게 쓰이게 하기 위해 세계 최고 수준의 AI 모델을 다양한 분야에서 손쉽게 활용할 수 있는 API 시리즈를 출시하여 기업 고객들의 비즈니스 성공에 기여하고 있습니다. 그 중에서 업스테이지 Document AI는 세계 최고 수준의 OCR 및 정보추출 기술력을 바탕으로 한 제품으로, AI를 통해 번거로운 문서 처리를 자동화하고 효율화하겠다는 목표를 가지고 있습니다.
Enterprise AI Workspace는 기업 내부의 문서 · 데이터 · 시스템을 LLM과 결합해 "찾고, 정리하고, 작성하는 일"에 쓰던 시간을 더 본질적인 판단과 창작에 쓸 수 있도록 만드는 Agent 플랫폼 입니다. 이 포지션은 Enterprise AI Workspace를 만드는 풀스택 AI 엔지니어 역할입니다. 백엔드 API 설계, 수만~수십만 건 규모의 사내 문서를 다루는 RAG 파이프라인, 비용·품질·지연시간을 함께 고려한 모델 라우팅, Agent Harness, 그리고 이 모든 것이 고객 환경에서 실제로 잘 동작하는지 측정·개선하는 인프라까지 — 한 사람이 한 기능의 흐름 전체를 책임지고 끌고 가는 방식으로 일합니다.
특히 다음과 같은 문제를 함께 풀어갈 분을 찾고 있습니다.
- 데모 수준의 AI 기능을 "고객사에서 매일 쓸 수 있는" 프로덕션 제품으로 만드는 일
- 고객사마다 다른 데이터·권한·보안 요구사항 안에서도 동작하는 Agent 아키텍처 설계
- LLM 응답 품질을 정성적 감이 아닌 측정 가능한 지표로 만들고, 회귀를 막는 평가 체계 구축
- 새로운 모델·기법이 등장할 때마다 기존 설계를 빠르게 재구성할 수 있는 시스템 만들기
AI EWS Engineering 팀은 소수의 풀스택 AI 엔지니어가 제품·디자인·연구 조직과 가깝게 협업하는 형태로 운영됩니다. "한 명이 한 기능을 설계부터 운영까지 책임지되, 혼자 일하지는 않는다"가 팀이 일하는 방식입니다.
- 각자의 경계 안에서만 일하지 않고 시스템의 설계 → 구현 → 배포 → 운영 전 과정을 직접 운영하고 관리합니다.
- Claude Code, Codex 등 AI 툴을 적극 활용하여 더 나은 결과를 만드는 데 집중합니다.
- 명세 · 테스트 · 코드 · 다이어그램 같은 기준을 이용하여 "spec ↔ test ↔ code”의 형상을 관리하고 애플리케이션의 안정성을 높입니다.
팀이 중요하게 여기는 것들:
- AI 도구를 적극적으로 활용해 개인의 산출 범위를 확장합니다. Claude Code, Codex 등을 일상 워크플로우에 녹여 쓰며, "AI를 잘 쓰는 것" 자체를 엔지니어링 역량의 일부로 봅니다.
- 의사결정의 근거를 문서·다이어그램·평가 데이터로 남깁니다. 회의록보다 디자인 문서와 PR이, 개인의 인상보다 eval 결과가 우선합니다.
- 모델·프롬프트·검색 전략에 대한 의견 차이는 토론이 아니라 실험으로 정리합니다. 평가셋을 먼저 만들고, 그 위에서 옵션을 비교합니다.
- 6개월이면 모범 사례가 바뀌는 영역임을 받아들입니다. 새 모델이 나오면 라우팅과 평가셋부터 다시 짜는 일이 자연스럽습니다.
업스테이지의 자체 모델(Solar 시리즈)과 외부 프론티어 모델을 함께 다루기 때문에, 연구 조직과의 거리도 가깝습니다. 모델 사이드의 한계를 제품 디자인으로 보완하거나, 반대로 제품에서 발견한 문제를 모델 팀에 피드백하는 일이 자연스럽게 일어납니다.
주요업무
- Enterprise AI Workspace의 LLM 기반 핵심 기능을 설계하고 구현합니다. "어디까지를 LLM에 맡기고 어디부터는 결정적 코드로 처리할지"의 경계를 직접 설계합니다.- 사내 문서·데이터를 다루는 RAG 파이프라인을 구축하고 품질을 개선합니다. 임베딩 전략, 청크 분할, 재랭킹, 메타데이터 필터링, 권한 기반 검색까지 — 검색 품질이 곧 제품 품질이라는 전제로 일합니다.
- 멀티 모델 라우팅과 비용·품질·지연시간 최적화를 책임집니다. 자체 모델(Solar)과 외부 프론티어 모델을 함께 다루며, 기능·고객·트래픽 특성에 맞는 모델 선택과 운영 전략을 만듭니다.
- AI 기능의 평가(eval) 체계를 설계하고 자동화합니다. 새 모델·프롬프트·검색 전략 변경이 회귀 없이 배포될 수 있도록 정량 평가를 CI에 녹이고, 평가셋 자체를 제품과 함께 성장시킵니다.
- 프로덕션 LLM 시스템의 백엔드·observability·안전성 운영을 함께 만들어 갑니다. 멀티테넌시 데이터 모델, 인증·권한, 호출 추적과 비용 모니터링, prompt injection 방어 등 엔터프라이즈 환경에서 매일 쓰이는 시스템에 필요한 기반을 다집니다.
자격요건
- 백엔드 / 인프라 / 데이터 중 한 영역 이상에서 프로덕션 환경을 직접 운영해봤거나 다른 영역으로 확장하는 데 거리낌이 없는 분- 설계 → 구현 → 배포 → 운영까지 전체 프로세스를 이끌어 갈 수 있는 분
- AI 코딩 도구(Claude Code, Codex 등)를 적극적으로 사용하는 분
- 문서 · 다이어그램 · 테스트 기반 산출물 협업 방식이 자연스러운 분
- LLM 동작에 대한 실무 감각을 가지고 계신 분
프롬프트, RAG, tool calling / agent loop, eval 설계 및 최적화 작업을 실제 서비스에 반영해본 경험이 있는 분
모델별 강·약점, 비용·latency trade-off 를 모델 선택·라우팅 결정에 반영해본 경험이 있는 분
- 멀티테넌시, RBAC/SSO, 데이터 격리, 감사 로그 등 B2B SaaS의 기본기를 갖추고 있으며 엔터프라이즈 환경 제약 내에서 개발해본 경험이 있는 분
- 고객사별 코퍼스가 수만~수십만 건 규모로 분리되어 운영되는 대규모 문서/지식베이스 RAG 시스템을 설계해본 경험이 있는 분
- Langfuse, LangSmith 또는 자체 구축을 통해 추적·비용·응답 품질 모니터링이 Production-grade로 갖춰진 LLM Observability 시스템을 만들어본 경험이 있는 분

