포지션 상세
모레에서는 대규모 인공신경망 모델, 클러스터 시스템, 클라우드 인프라를 위한 AI 소프트웨어 스택을 함께 개발할 엔지니어를 모집하고 있습니다.
모레의 시스템 소프트웨어 엔지니어는 AI 애플리케이션을 병렬화/최적화하고 클러스터에서 분산 실행하는 데 필요한 소프트웨어 구성 요소들을 개발합니다.
• 계산 작업을 클러스터의 여러 노드에서 분산 실행하고 계산 자원(GPU/NPU)을 가상화하기 위한 런타임 시스템 개발
• AI 애플리케이션과 GPU 간의 고속 통신 기술(RDMA, RoCE 등) 및 저수준 라이브러리(Verbs, UCX 등)를 분산 런타임 시스템에 통합하고 최적화
• 기존 AI 애플리케이션들을 위한 PyTorch, TensorFlow, Triton Inference Server 호환 레이어 개발
• AI 애플리케이션의 실제 연산과 무관한 오버헤드를 줄이기 위한 전체 소프트웨어 스택의 최적화
• C++ 및 Python 개발 가능하신 분
• 컴퓨터 시스템에 대한 이해가 있으신 분
모레의 시스템 소프트웨어 엔지니어는 AI 애플리케이션을 병렬화/최적화하고 클러스터에서 분산 실행하는 데 필요한 소프트웨어 구성 요소들을 개발합니다.
주요업무
• AI 애플리케이션의 의미를 실행 시간에 그래프 꼴의 IR로 표현하는 on-the-fly IR constructor 개발• 계산 작업을 클러스터의 여러 노드에서 분산 실행하고 계산 자원(GPU/NPU)을 가상화하기 위한 런타임 시스템 개발
• AI 애플리케이션과 GPU 간의 고속 통신 기술(RDMA, RoCE 등) 및 저수준 라이브러리(Verbs, UCX 등)를 분산 런타임 시스템에 통합하고 최적화
• 기존 AI 애플리케이션들을 위한 PyTorch, TensorFlow, Triton Inference Server 호환 레이어 개발
• AI 애플리케이션의 실제 연산과 무관한 오버헤드를 줄이기 위한 전체 소프트웨어 스택의 최적화
자격요건
• 컴퓨터공학 혹은 관련 전공 학부 졸업, 혹은 이와 동등한 경력이 있으신 분• C++ 및 Python 개발 가능하신 분
• 컴퓨터 시스템에 대한 이해가 있으신 분