세타온-LLM Serving Engineer(Py/GPU/vLLM AI Infra 개발)
1/1
세타온서울 강남구경력 1-3년

LLM Serving Engineer(Py/GPU/vLLM AI Infra 개발)

포지션 상세

㈜세타온(ThetaON)은 AI 인프라의 물리적 한계를 소프트웨어 지능으로 돌파하는 AI 인프라 최적화 솔루션 기업입니다. 회사는 설립 이후, GPU/NPU 자원 효율화와 AI 추론 최적화를 핵심으로 하는 독자 엔진 '세타엔진(Theta-Engine)'을 개발해왔습니다.
세타온은 핵심 원천기술 6건을 특허 출원(1건 등록, PCT 진행 중)했으며, 아이티센그룹, 인텔코리아, 쎄르띠실리콘, 테라텍 등과 PoC 및 파트너십을 진행하고 있습니다. 사업 영역은 데이터센터 전력효율을 높이는 그린 AIDC, AI PC 온디바이스 최적화, 영구기억 기반 엔터프라이즈 AI 에이전트(SaaS) 세 가지로, 글로벌 AI 인프라 최적화 시장 안에서 성장하고 있습니다.

주요업무

• 세타엔진(Theta-Engine) 핵심 알고리즘 연구 및 AI 엔진 개발
• AI 추론 최적화: GPU/NPU 자원 효율화, KV 캐시 최적화, Attention 연산 경량화 등 모델·하드웨어 단의 성능 개선
• LLM, 바이오 AI(Evoformer, ESM-2 등) 등 다양한 도메인으로의 기술 적용 및 검증(PoC)
• 중.대형 파트너사와의 공동 PoC 환경 구축 및 성능 측정·분석(vLLM, HuggingFace Transformers 등 활용)
• 특허 기반 원천기술의 실제 제품/솔루션 구현

자격요건

• AI/딥러닝 모델 또는 GPU·NPU 하드웨어 최적화 경험이 있는 분.
• Python 기반 개발 역량, vLLM·PyTorch·HuggingFace 등 AI 프레임워크 활용 경험.
• Linux/CLI 능숙: SSH·tmux·bash·프로세스/GPU 관리.
• LLM 추론 기본기: 토큰·KV cache·배치·처리량/지연 개념. vLLM이나 HuggingFace를 직접 구축 경험.
• GPU 운영: nvidia-smi, CUDA 환경, GPU 메모리. 커널을 못 짜도 되지만 서빙 환경은 혼자 세팅 가능.

기술 스택 • 툴

태그

마감일

상시채용

근무지역

서울 강남구 봉은사로20길 26
본 채용정보는 원티드랩의 동의없이 무단전재, 재배포, 재가공할 수 없으며, 구직활동 이외의 용도로 사용할 수 없습니다.
본 채용 정보는 에서 제공한 자료를 바탕으로 원티드랩에서 표현을 수정하고 이의 배열 및 구성을 편집하여 완성한 원티드랩의 저작자산이자 영업자산입니다. 본 정보 및 데이터베이스의 일부 내지는 전부에 대하여 원티드랩의 동의 없이 무단전재 또는 재배포, 재가공 및 크롤링할 수 없으며, 게재된 채용기업의 정보는 구직자의 구직활동 이외의 용도로 사용될 수 없습니다. 원티드랩은 에서 게재한 자료에 대한 오류나 그 밖에 원티드랩이 가공하지 않은 정보의 내용상 문제에 대하여 어떠한 보장도 하지 않으며, 사용자가 이를 신뢰하여 취한 조치에 대해 책임을 지지 않습니다.
<저작권자 (주)원티드랩. 무단전재-재배포금지>