노타(Nota)-[NetsPresso] AI Engineer
노타(Nota)-[NetsPresso] AI Engineer
노타(Nota)-[NetsPresso] AI Engineer
노타(Nota)-[NetsPresso] AI Engineer
노타(Nota)-[NetsPresso] AI Engineer
노타(Nota)-[NetsPresso] AI Engineer
노타(Nota)-[NetsPresso] AI Engineer
노타(Nota)-[NetsPresso] AI Engineer
1/8
노타(Nota)서울 강남구신입 이상

[NetsPresso] AI Engineer

포지션 상세

👋 우리 ​팀을 ​소개합니다.
NetsPresso ​Platform 팀은 ​Nota AI의 AI 모델 ​경량화 ​및 최적화 ​기술을 기반으로, 연구/개발한 ​기술을 실제 ​제품으로 ​구현하여 사용자에게 ​제공하는 ​NetsPresso ​제품 전반의 핵심 ​플랫폼과 ​소프트웨어를 설계·구현하는 조직입니다.
Model ​Representation, ​Quantization, ​Graph Optimization, SW ​Engineering 파트와 ​함께 ​Model Engineering ​파트는 NetsPresso의 ​최적화 ​기술이 실제 다양한 ​AI 모델과 ​디바이스 환경에서 안정적으로 활용될 수 있도록 연결하는 역할을 담당합니다.
• 다양한 AI 모델을 실제 디바이스에 맞게 최적화하고
• 이를 반복적·자동화된 방식으로 수행할 수 있도록 Agent 기반 실험 및 시나리오 자동화를 구축하며
• 고객사 및 신규 기술 요구를 분석해 NetsPresso Core 기술 발전 방향을 제안합니다.
• 연구와 엔지니어링의 중간 지점에서, 기술을 실전으로 연결하는 팀입니다.


📌 해당 포지션으로 합류하신다면
‘이 LLM을 모바일에서 돌릴 수 있을까?’
’수백 개 모델 최적화, 매번 수작업 말고 자동으로 빠르게 할 순 없을까?’
NetsPresso Model Engineering 파트는 이런 질문에 직접 답을 만듭니다. NetsPresso IR, Graph Optimization, Quantization 등 최적화 엔진을 사용하여 논문 속의 모델 또는 고객이 만든 모델을 고객의 디바이스에서 실제로 돌아가는 모델로 만듭니다.


🤓 팀의 메세지
새로운 AI 모델과 디바이스 환경에 대한 높은 관심과, 아이디어를 실제로 동작하는 결과물로 구현해내는 실행력이 중요합니다. 단순한 실험이나 분석에 그치지 않고, NetsPresso 서비스와 직접 연결되는 모델 최적화·엔지니어링 기술을 구현하는 포지션입니다. 다양한 모델과 디바이스, 자동화 시나리오가 유기적으로 연결되어 있는 만큼, 팀 내에서의 활발한 소통과 주도적인 문제 해결 태도를 무엇보다 중요하게 생각합니다. 다양한 모델과 디바이스의 제약을 깊이 있게 파고들고, 협업을 통해 함께 성장하며 실제 사용 가능한 기술을 만들어가고 싶은 분이라면 이 팀에서 분명 의미 있는 성과를 낼 수 있을 것입니다.

주요업무

• AI 모델 디바이스 최적화 및 관리
- NetsPresso의 경량화·최적화 모듈을 활용하여 다양한 AI 모델을 타겟 디바이스에 맞게 최적화
- Computer Vision, Generative AI(LLM, VLM 등) 모델 대상 성능·정확도·메모리 중심 튜닝
- 디바이스별 최적화 모델 관리 및 실험 결과 정리

• Agent 기반 최적화 자동화 및 시나리오 구축
- 수동 설정에 의존하지 않는 Agent 기반 모델 최적화 실험 구조 설계
- 디바이스 특성에 맞는 자동화된 최적화 시나리오 구현 및 개선

• 고객사 모델 지원 및 기술 조사
- 고객사 디바이스 환경에 맞춘 모델 최적화 및 기술 지원
- 신규 AI 모델, 디바이스, 최적화 기법에 대한 기술 조사
- 실전 적용 관점에서 NetsPresso 기술의 개선 방향 도출 및 제안

자격요건

• AI/ML 등 관련 분야 석사 학위 이상 (또는 이에 준하는 실무 경력)
• Python 기반 소프트웨어 개발 능력 및 협업 경험
- 가독성 있는 코드 작성, Git 기반 버전 관리
• PyTorch 등 딥러닝 프레임워크 기반 모델 개발/디버깅 경험
• AI 모델의 Inference & Deployment & Optimization 실무 경험
- 추론 엔진(e.g. ONNX Runtime 등), 서빙(e.g. TorchServe 등),
- 최적화(e.g. Quantization 등) 도구 중 1개 이상 실사용
• Inference 파이프라인 설계 및 성능(정확도/지연/메모리) 분석 역량
• 반복 가능한 작업을 자동화 가능한 구조로 전환하려는 문제 해결 마인드
• 해외 여행에 결격 사유가 없는 분

기술 스택 • 툴

태그

마감일

상시채용

근무지역

서울 강남구 테헤란로 521, 파르나스타워 16층 Nota
본 채용정보는 원티드랩의 동의없이 무단전재, 재배포, 재가공할 수 없으며, 구직활동 이외의 용도로 사용할 수 없습니다.
본 채용 정보는 에서 제공한 자료를 바탕으로 원티드랩에서 표현을 수정하고 이의 배열 및 구성을 편집하여 완성한 원티드랩의 저작자산이자 영업자산입니다. 본 정보 및 데이터베이스의 일부 내지는 전부에 대하여 원티드랩의 동의 없이 무단전재 또는 재배포, 재가공 및 크롤링할 수 없으며, 게재된 채용기업의 정보는 구직자의 구직활동 이외의 용도로 사용될 수 없습니다. 원티드랩은 에서 게재한 자료에 대한 오류나 그 밖에 원티드랩이 가공하지 않은 정보의 내용상 문제에 대하여 어떠한 보장도 하지 않으며, 사용자가 이를 신뢰하여 취한 조치에 대해 책임을 지지 않습니다.
<저작권자 (주)원티드랩. 무단전재-재배포금지>