페블스퀘어-AI Model Compiler Engineer
1/1
페블스퀘어경기 성남시경력 3년 이상

AI Model Compiler Engineer

포지션 상세

페블스퀘어는 PIM아키텍처를 기반으로 AI 반도체 설계와 AI 솔루션을 개발하는 팹리스 기업입니다. 폰 노이만(Von Neumann)구조의 한계를 극복하기 위해 고성능/초저전력의 PIM기반 AI 반도체 를 성공적으로 양산하고, 멀티 코어 AI 반도체를 개발하여 국내외에서 실증 중이며 AI 반도체 상용화와 활용 촉진을 위해 다양한 AI 솔루션을 개발 중입니다.

주요업무

We are seeking an experienced AI Model Compiler Engineer to develop and optimize model compilation pipelines for deep learning frameworks. You will work on converting AI models (e.g., ONNX, TensorFlow, PyTorch) into efficient, hardware-optimized code for edge and cloud-based AI processors. Your role will involve compiler optimizations, graph transformations, and hardware-specific acceleration techniques.

• Model Compilation Pipeline: Design and implement compilers that translate AI models (ONNX, TensorFlow, PyTorch, etc.) into executable formats for AI accelerators and edge devices.
• Graph Optimization: Apply operator fusion, pruning, quantization, and memory optimizations to improve model performance.
• Hardware Acceleration: Optimize AI model execution on CPU, GPU, DSP, TPU, or custom AI chips (e.g., NPU, FPGA).
• Intermediate Representations (IRs): Work with MLIR, TVM, XLA, Glow, or custom IRs for model transformation.
• Performance Tuning: Profile and analyze models using LLVM, Halide, CUDA, OpenCL, or Metal.
• Kernel Optimization: Develop low-level math libraries (SIMD, vectorized ops, matrix multiplications, tensor ops) for efficient AI inference.
• Custom Operator Support: Implement new AI operators and optimize execution on target hardware.
• Cross-Platform Deployment: Enable model portability across multiple architectures and backends.
• AI/ML Framework Integration: Extend compiler functionality for PyTorch, TensorFlow, ONNX Runtime, and other ML frameworks.
• Debugging & Benchmarking

자격요건

• Education: Bachelor's, Master's, or Ph.D. in Computer Science, Electrical Engineering, or related fields.
• Experience: 2+ years in model compilation, AI frameworks, or deep learning accelerators.
• Programming Languages: C, C++, Python, and LLVM IR or MLIR.
• Compiler Development: Experience with LLVM, TVM, XLA, Halide, Glow, or custom ML compilers.
• Graph Transformations: Knowledge of operator fusion, loop unrolling, constant folding, quantization, and tiling techniques.
• Hardware Optimization: Experience with SIMD, CUDA, OpenCL, ROCm, or low-level tensor operations.
• AI Frameworks: Hands-on with TensorFlow, PyTorch, ONNX, TensorRT, TFLite, or OpenVINO.
• Parallel Computing: Experience with multi-threading, vectorization (SSE/AVX), and heterogeneous computing.

기술 스택 • 툴

태그

마감일

2026.02.18

근무지역

경기 성남시 분당구 판교로 331, ABN타워 402호
본 채용정보는 원티드랩의 동의없이 무단전재, 재배포, 재가공할 수 없으며, 구직활동 이외의 용도로 사용할 수 없습니다.
본 채용 정보는 에서 제공한 자료를 바탕으로 원티드랩에서 표현을 수정하고 이의 배열 및 구성을 편집하여 완성한 원티드랩의 저작자산이자 영업자산입니다. 본 정보 및 데이터베이스의 일부 내지는 전부에 대하여 원티드랩의 동의 없이 무단전재 또는 재배포, 재가공 및 크롤링할 수 없으며, 게재된 채용기업의 정보는 구직자의 구직활동 이외의 용도로 사용될 수 없습니다. 원티드랩은 에서 게재한 자료에 대한 오류나 그 밖에 원티드랩이 가공하지 않은 정보의 내용상 문제에 대하여 어떠한 보장도 하지 않으며, 사용자가 이를 신뢰하여 취한 조치에 대해 책임을 지지 않습니다.
<저작권자 (주)원티드랩. 무단전재-재배포금지>