노타(Nota)-[NetsPresso] Quantization Research Engineer
노타(Nota)-[NetsPresso] Quantization Research Engineer
노타(Nota)-[NetsPresso] Quantization Research Engineer
노타(Nota)-[NetsPresso] Quantization Research Engineer
노타(Nota)-[NetsPresso] Quantization Research Engineer
노타(Nota)-[NetsPresso] Quantization Research Engineer
노타(Nota)-[NetsPresso] Quantization Research Engineer
노타(Nota)-[NetsPresso] Quantization Research Engineer
1/8
노타(Nota)서울 강남구경력 5년 이상

[NetsPresso] Quantization Research Engineer

포지션 상세

AI for everyone, everywhere
AI를 누구에게나, 어디에서나

노타는 AI 최적화 기술을 통해 AI의 일상화를 선도하는 기업입니다.
우리는 다양한 디바이스와 산업 전반에 걸쳐, 누구나 어디서나 AI를 사용할 수 있는 세상을 만들고자 합니다.

노타의 핵심 제품인 넷츠프레소(NetsPresso)는 하드웨어의 특성을 이해하는 AI 모델 최적화 플랫폼입니다. 또한, 차세대 영상 관제 솔루션 (NVA: Nota Vision Agent), 지능형 교통 시스템(ITS) 등 온디바이스 생성형 AI 솔루션을 통해 실제 산업 현장에서의 AI 실현 가능성을 넓히고 있습니다.

국내 스타트업으로는 최초로 삼성과 LG의 투자 유치 기록을 보유하고 있으며, 네이버 DS2F의 첫 투자 기업이기도 합니다. 최근에는 두바이 교통국과의 AI 솔루션 공급 계약을 체결하고, CB Insights AI 100에도 선정되는 등 글로벌 무대에서의 성과를 이어가고 있습니다.

노타는 빠르게 성장하는 조직과 함께할 다양한 직군의 노타 크루를 찾고 있습니다. 직급과 경력에 관계없이 누구나 동등한 입장에서 의견을 나눌 수 있는 수평적인 문화 속에서, 공동의 목표를 향해 자율적으로 일할 수 있는 분과 함께하고 싶습니다.

누구나, 어디에서나 AI의 가치를 경험할 수 있도록 하는 여정, 지금 노타에서 함께하세요.


[우리 ​팀을 ​소개합니다.]
NetsPresso Platform 팀은 Nota AI의 AI 모델 경량화 및 최적화 기술을 바탕으로, 연구·개발된 기술을 실제 제품으로 구현하여 사용자에게 제공하는 핵심 플랫폼과 소프트웨어를 설계·구현하는 조직입니다.
Model Representation, Quantization, Graph Optimization, Model Engineering, SW Engineering 파트로 구성되어 있으며, 그중 Quantization 파트는 NetsPresso의 핵심 최적화 기술인 양자화를 연구하고, 자체 기술을 제품에 탑재하여 다양한 HW에서 딥러닝 모델 추론을 가속화합니다.
• 양자화로 인한 성능 저하를 최소화하는 알고리즘을 연구하며
• 다양한 HW 및 Backend의 제약사항에 맞는 양자화를 지원하고
• 실제 HW에서 가속 가능한 형태로 모델을 변환합니다.


[해당 포지션으로 합류하신다면]
NetsPresso의 핵심 역할을 수행하는 양자화 기술을 연구하고 제품화합니다. 최신 양자화 알고리즘을 연구하고, 다양한 모델과 HW의 특성에 맞게 최적화하는 노타만의 고유한 양자화 기법을 설계합니다. On-device AI를 위한 다양한 최적화 기술과 최신 모델을 경험할 수 있습니다.


[팀의 메세지]
새로운 기술에 대한 높은 관심과 아이디어를 실제로 구현해내는 실행력이 중요합니다. 단순한 연구에 그치지 않고, NetsPresso 서비스와 직접 연결되는 독자적인 양자화 기술을 개발하는 포지션입니다. 각 모듈이 유기적으로 연결되어 있는 만큼, 팀 내 활발한 소통과 주도적인 태도를 무엇보다 중요하게 생각합니다. 복잡한 기술적 문제를 깊이 있게 파고들고, 협업을 통해 함께 성장하고 싶은 분이라면 이 팀에서 분명 좋은 성과를 낼 수 있을 것입니다.

주요업무

• Quantization 기술 연구 및 제품화
- 차세대 Post-Training Quantization(PTQ), Quantization-Aware Training(QAT), Compression 알고리즘 연구 및 개발
- 모델 아키텍처 및 타겟 HW 특성을 고려한 Quantization 전략 수립 및 프레임워크 설계
- Generative AI(LLM, VLM, Diffusion 등), Computer Vision(Classification, Detection, Segmentation 등) 및 다양한 AI 모델에 대한 최적화 방법론 연구
- 연구 결과의 논문 발표 및 특허 출원을 통한 기술 리더십 확보
• On-device AI 모델 최적화
- 다양한 On-device HW로의 배포를 위한 quantization 파이프라인 설계 및 고도화
- AI 모델 최적화 프로젝트 수행
- Quantization으로 인한 정확도 저하 원인 분석 및 체계적인 해결 방안 수립

자격요건

• 컴퓨터공학, 전자공학 등 관련 전공 학위 소지자
• 학사 5년 이상, 석사 후 3년 이상, 박사 졸업 및 졸업 예정자
• Quantization, 모델 압축, 또는 딥러닝 최적화 분야에서의 심도 있는 연구/개발 경험
• PyTorch, ExecuTorch, ONNX 기반 딥러닝 모델 최적화에 대한 깊은 이해
• 소규모 이상의 프로젝트 리드 및 관리 경험
• 기술 문서 작성 및 영어 커뮤니케이션 능력
• 해외 여행에 결격 사유가 없는 분

기술 스택 • 툴

태그

마감일

상시채용

근무지역

서울 강남구 테헤란로 521, 파르나스타워 16층 Nota
본 채용정보는 원티드랩의 동의없이 무단전재, 재배포, 재가공할 수 없으며, 구직활동 이외의 용도로 사용할 수 없습니다.
본 채용 정보는 에서 제공한 자료를 바탕으로 원티드랩에서 표현을 수정하고 이의 배열 및 구성을 편집하여 완성한 원티드랩의 저작자산이자 영업자산입니다. 본 정보 및 데이터베이스의 일부 내지는 전부에 대하여 원티드랩의 동의 없이 무단전재 또는 재배포, 재가공 및 크롤링할 수 없으며, 게재된 채용기업의 정보는 구직자의 구직활동 이외의 용도로 사용될 수 없습니다. 원티드랩은 에서 게재한 자료에 대한 오류나 그 밖에 원티드랩이 가공하지 않은 정보의 내용상 문제에 대하여 어떠한 보장도 하지 않으며, 사용자가 이를 신뢰하여 취한 조치에 대해 책임을 지지 않습니다.
<저작권자 (주)원티드랩. 무단전재-재배포금지>