세이지-AI Large Vision-Language Model Researcher
1/1
세이지서울 강남구경력 3-7년

AI Large Vision-Language Model Researcher

포지션 상세

세이지는 2017년 '혁신적인 AI기술로 산업을 탈바꿈시킨다'는 Mission하에 제조 산업의 고객들의 다양한 문제를 해결하고자 설립되었어요. 세이지는 제조업 자동화의 첫걸음으로 스마트 팩토리를 위한 AI비전 플랫폼을 만들어 결함검사와 공정 및 현장 모니터링의 자동화를 이끌고 있어요. 주요 고객은 이차전지 분야 및 반도체(PCB) 분야 등 국내 다수의 제조기업으로 아래 솔루션들을 제공하고 있으며, 국내 뿐만 아니라 중국이나 유럽 등의 제조 공장에서 활용되고 있습니다.


[세이지에서 서비스하는 제품]
• SAIGE VISION - AI 기반 머신비전 솔루션
- 딥러닝을 이용한 제조업 비전 검사 솔루션으로, 빠르고 정확하게 제품의 결함을 찾아내요.
- SAIGE VISION의 기능은 링크를 통해 확인하실 수 있어요. (
https://saige.ai/kr/solutions/vision)
- UI 가 제공되는 Developer, C/C++, C# 언어의 라이브러리 형태로 제공되는 SDK 제품이 있어요.

• SAIGE VIMS - AI 기반 제조 공정 모니터링 솔루션
- 제품 생산 공정을 실시간으로 모니터링하며 공정의 이상을 발견하는 솔루션이에요.
- 영상 데이터를 주로 다루며, 제품 생산 공정을 통합 관제하는 화면 등을 포함해요.
- SAIGE VIMS의 기능은 링크를 통해 확인하실 수 있어요. (
https://saige.ai/solution/saige-vims/)

• SAIGE SAFETY - AI 기반 안전 모니터링 솔루션
- 산업 현장에 위험이 되는 상황을 실시간으로 감지하는 솔루션으로 안전한 작업 환경을 만들어요.
- 주로 산업 현장을 통합 관제하는 화면을 다루어요.
- SAIGE SAFETY의 기능은 링크를 통해 확인하실 수 있어요. (
https://saige.ai/solution/saige-safety/)

주요업무

1. LVLM 연구 및 모델 개발
- 이미지/영상 기반 Scene Understanding + Language Reasoning 모델 연구
- 안전 상황 인식 (위험 행동, 보호구 미착용, 위험 구역 침입 등)
- 현장 상황에 대한 자연어 설명, 위험도 진단, 개선 방안 생성
- 최신 LVLM 논문 조사 및 적용 (GPT-4V 계열, Gemma3, Qwen-VL, InternVL 등)
2. 영상 안전 관제 도메인 문제 정의
- 실제 현장의 안전 이슈를 AI 문제로 구조화
- 객체 인식/행동 인식 + 언어 모델 결합 전략 설계
- Rule-based 관제 vs LVLM 기반 추론의 역할 분리 및 설계
3. 데이터 및 학습 전략 설계
- 영상/이미지 + 텍스트 어노테이션 전략 설계
- 멀티모달 데이터셋 구축 및 품질 관리
- Fine-tuning, Instruction Tuning, Prompt Engineering 전략 수립
4. 기술 리딩 및 협업
- 주니어 연구원/엔지니어 기술 멘토링
- 서비스/플랫폼 팀과 협업하여 PoC 상용화 연결
- 모델 성능 지표 정의 및 실험 설계 리드


[합류하시게 될 팀]
• 세이지의 AI LVLM Researcher로 합류하시면 AI 기반 안전 관제 기술을 개발해요.
- 영상·이미지 기반 현장 안전 관제 시스템을 개발해요. LVLM(Large Vision-Language Model)을 활용하여 영상/이미지 씬을 이해하고 현장의 안전 상태 진단, 위험 요소 설명, 개선 가이드 생성까지 연결하는 핵심 연구를 리드해요.
- 연구소 스쿼드는 2~4명으로 구성되며, 하나의 목표를 향해 긴밀히 소통하고 협업해요.
- 프로젝트 성격에 따라 연구자가 직접 문제 정의부터 실행까지 주도해요.
- 각 연구자가 자신의 역량을 가장 효과적으로 발휘할 수 있는 환경에서 일해요.

자격요건

• 컴퓨터 공학, 기계공학, 수학, 물리 또는 기타 관련된 전공의 석사 이상의 학위를 소지하고 계신 분
• 인공지능 프로젝트를 주도적으로 기획 및 수행한 경험이 3년 이상 있으신 분
• 기계 학습 관련 소프트웨어 개발 및 엔지니어링 실무 경험이 있으신 분
• Vision Language Model (비전 언어 모델) 기술 관련 전문적인 지식 및 프로젝트 경험이 있으신 분
• Python 및 주요 데이터 분석/머신러닝 패키지, PyTorch 프레임워크 활용에 능숙하신 분
• Git 기반 협업 경험을 보유하신 분
• 주도적으로 업무를 이끌고, 논리적인 커뮤니케이션 역량을 갖추신 분
• 지원일로부터 4개월 내 온보딩이 가능하신 분

기술 스택 • 툴

태그

마감일

상시채용

근무지역

서울특별시 강남구 강남대로 374 케이스퀘어 강남2 3층
본 채용정보는 원티드랩의 동의없이 무단전재, 재배포, 재가공할 수 없으며, 구직활동 이외의 용도로 사용할 수 없습니다.
본 채용 정보는 에서 제공한 자료를 바탕으로 원티드랩에서 표현을 수정하고 이의 배열 및 구성을 편집하여 완성한 원티드랩의 저작자산이자 영업자산입니다. 본 정보 및 데이터베이스의 일부 내지는 전부에 대하여 원티드랩의 동의 없이 무단전재 또는 재배포, 재가공 및 크롤링할 수 없으며, 게재된 채용기업의 정보는 구직자의 구직활동 이외의 용도로 사용될 수 없습니다. 원티드랩은 에서 게재한 자료에 대한 오류나 그 밖에 원티드랩이 가공하지 않은 정보의 내용상 문제에 대하여 어떠한 보장도 하지 않으며, 사용자가 이를 신뢰하여 취한 조치에 대해 책임을 지지 않습니다.
<저작권자 (주)원티드랩. 무단전재-재배포금지>
ai-agent
아무리 찾아도 없던 포지션, 이제 에이전트로 바로 찾으세요!