AI Evaluation Engineer

포지션 상세

Thesen AI는 AI가 중심이 되는 엔터프라이즈 소프트웨어 개발 자동화 플랫폼입니다. 아이디어 기획부터 설계, 배포, 유지보수까지 모든 과정을 전문화된 AI 에이전트들이 협력해 자동화합니다. 기존 개발 방식보다 더 빠르고, 저렴하며, 신뢰도 높은 소프트웨어를 구축할 수 있습니다.

노코드/로우코드와 달리 Thesen은 생산 환경에 바로 적용 가능한 고품질 코드와 자동 유지관리 기능을 제공하여, 엔터프라이즈 기술 경쟁력을 높입니다.

AI Evaluation Engineer 직무 소개
소프트웨어 개발 자동화를 위한 전문 AI 에이전트들의 지시문과 컨텍스트를 최적화하고, 체계적인 평가 시스템을 통해 모델 성능을 지속적으로 개선합니다. LLM 기반 에이전트들의 A/B 테스트와 프롬프트 튜닝을 통해 기획부터 배포까지 전 개발 과정의 AI 자동화 품질을 향상시키는 핵심 역할을 담당합니다.

주요업무

• 소프트웨어 개발 각 단계에 특화된 다양한 AI 에이전트의 Instruction / Context 최적화
• 에이전트별로 다양한 모델, 지시문, 컨텍스트를 벤치마킹할 수 있는 AI 평가 체계 설계 및 운영
• 설계된 평가 시스템을 기반으로 모델 선택, A/B 테스트, 프롬프트 튜닝 전략 수립
• 고도화된 LLM 기반 Agent 성능 개선 및 반복 실험

자격요건

• 타입 힌트 및 테스트를 포함한 고급 수준의 Python 개발 역량
• pandas 또는 Polars를 활용한 풍부한 데이터 분
• LLM 컨텍스트 구성, 샘플링 전략, 모델 편향 등에 대한 깊은 이해
• 프롬프트 최적화, RAG, 파인튜닝 등 고급 LLM 기술 경험

기술 스택 • 툴

마감일

상시채용

근무지역

서울 강남구 영동대로85길 34, 스파크플러스 10층 1008호

데센코리아IT, 컨텐츠

본 채용 정보는 에서 제공한 자료를 바탕으로 원티드랩에서 표현을 수정하고 이의 배열 및 구성을 편집하여 완성한 원티드랩의 저작자산이자 영업자산입니다. 본 정보 및 데이터베이스의 일부 내지는 전부에 대하여 원티드랩의 동의 없이 무단전재 또는 재배포, 재가공 및 크롤링할 수 없으며, 게재된 채용기업의 정보는 구직자의 구직활동 이외의 용도로 사용될 수 없습니다. 원티드랩은 에서 게재한 자료에 대한 오류나 그 밖에 원티드랩이 가공하지 않은 정보의 내용상 문제에 대하여 어떠한 보장도 하지 않으며, 사용자가 이를 신뢰하여 취한 조치에 대해 책임을 지지 않습니다.
<저작권자 (주)원티드랩. 무단전재-재배포금지>

포지션 상세

주요업무

자격요건

기술 스택 • 툴

태그

마감일

근무지역