포지션 상세
스타버스랩 홈페이지 : www.starverselab.com
콘텐츠, 헬스케어 관련 AI를 개발 중이며, 핵심 기술 개발을 담당할 AI/ML 개발자를 모집합니다.
특히, 음성 워터마킹 시스템을 중점으로 하며, 88가지 음향 특징(eGeMAPS 기반 독립변수)을 활용한 머신러닝/딥러닝 모델을 구축합니다. 이 모델은 음성(종속변수)을 예측/분석하며, 중간 계층에서 1차 변수(예: 파형, 주파수 특징)와 2차 변수(예: 감정, 멜로디, 억양)를 처리하여 강성/연성 워터마킹, 디지털 핑거프린팅, 스테가노그래피 등을 구현합니다.
PM(프로젝트 매니저)와 협력하여 MVP(Minimum Viable Product) 개발부터 글로벌 확장까지 참여할 수 있는 기회입니다.
근무지 : 경기 고양시 덕양구
:
• 음성 워터마킹 시스템 개발 : eGeMAPS 88종 음향 특징(독립변수)을 기반으로 음성(종속변수) 분석 모델 구축.
• 1차 변수(파형, 주파수 스펙트럼 등)와 2차 변수(감정 표현, 멜로디 패턴, 억양 변화 등)를 중간 레이어에서 처리하여 워터마킹 삽입/검출 알고리즘 구현
• 머신러닝/딥러닝 모델 설계 및 최적화 : CNN/RNN 기반 모델(LCGRNN 등)로 성문 추출 및 유사도 계산(SimSequence, SimWave, BreathGap 등) 개발. 데이터 전처리부터 학습/튜닝
등, 지속적인 R&D.
• 컴퓨터공학, AI/ML 관련 전공 학사 이상 (또는 데이터사이언스 등 동등한 실무 경험).
• 경력 무관
(우대)기술 스택:
• 프로그래밍 : Python, NumPy, SciPy, Pandas.
• ML/DL 프레임워크 : TensorFlow 또는 PyTorch (음성 모델 경험 우대, 예: Wav2Vec2.0, HuBERT, XLS-R).
• 음성 처리 라이브러리 : Librosa (음향 특징 추출 필수), PyAudio 또는 SoundFile (음성 입력/출력).
• 모델링 : CNN, RNN/LSTM (오디오 시퀀스 처리), eGeMAPS 또는 MFCC(Mel-Frequency Cepstral Coefficients) 기반 특징 추출 경험.
• 기타: Git (버전 관리), Docker (컨테이너화), AWS/GCP (클라우드 배포).
콘텐츠, 헬스케어 관련 AI를 개발 중이며, 핵심 기술 개발을 담당할 AI/ML 개발자를 모집합니다.
특히, 음성 워터마킹 시스템을 중점으로 하며, 88가지 음향 특징(eGeMAPS 기반 독립변수)을 활용한 머신러닝/딥러닝 모델을 구축합니다. 이 모델은 음성(종속변수)을 예측/분석하며, 중간 계층에서 1차 변수(예: 파형, 주파수 특징)와 2차 변수(예: 감정, 멜로디, 억양)를 처리하여 강성/연성 워터마킹, 디지털 핑거프린팅, 스테가노그래피 등을 구현합니다.
PM(프로젝트 매니저)와 협력하여 MVP(Minimum Viable Product) 개발부터 글로벌 확장까지 참여할 수 있는 기회입니다.
근무지 : 경기 고양시 덕양구
주요업무
주요 예정 업무:
• 음성 워터마킹 시스템 개발 : eGeMAPS 88종 음향 특징(독립변수)을 기반으로 음성(종속변수) 분석 모델 구축.
• 1차 변수(파형, 주파수 스펙트럼 등)와 2차 변수(감정 표현, 멜로디 패턴, 억양 변화 등)를 중간 레이어에서 처리하여 워터마킹 삽입/검출 알고리즘 구현
• 머신러닝/딥러닝 모델 설계 및 최적화 : CNN/RNN 기반 모델(LCGRNN 등)로 성문 추출 및 유사도 계산(SimSequence, SimWave, BreathGap 등) 개발. 데이터 전처리부터 학습/튜닝
등, 지속적인 R&D.
자격요건
필수 요건• 컴퓨터공학, AI/ML 관련 전공 학사 이상 (또는 데이터사이언스 등 동등한 실무 경험).
• 경력 무관
(우대)기술 스택:
• 프로그래밍 : Python, NumPy, SciPy, Pandas.
• ML/DL 프레임워크 : TensorFlow 또는 PyTorch (음성 모델 경험 우대, 예: Wav2Vec2.0, HuBERT, XLS-R).
• 음성 처리 라이브러리 : Librosa (음향 특징 추출 필수), PyAudio 또는 SoundFile (음성 입력/출력).
• 모델링 : CNN, RNN/LSTM (오디오 시퀀스 처리), eGeMAPS 또는 MFCC(Mel-Frequency Cepstral Coefficients) 기반 특징 추출 경험.
• 기타: Git (버전 관리), Docker (컨테이너화), AWS/GCP (클라우드 배포).


