포지션 상세

# TTS AI Research Engineer
# 정규직
# 전문연구요원 현역 신규 가능
# 전직 및 산업기능요원은 채용하지 않습니다.#

함께 더 이야기 하고 싶은 AI를 만드는 사람들, 마인드로직입니다.

[마인드로직이 만들어낸 성과]
• 국내외 유수의 투자자들로부터 누적 투자 150억, 탄탄한 재무구조
• 6년 이상 딥러닝 기반 챗봇 상용 서비스 제공 중
• 독창적인 페르소나 그라운딩 및 장기기억 기술에 기반한 세계 최고 수준의 페르소나 챗봇 엔진 보유
• 서울대학교, 서강대학교, 숙명여자대학교 등 다수의 대학에 AI서비스 제공 중
• 포브스 선정 한국인이 사랑한 모바일앱 17위, 소셜부문 6위 달성
• 구글 어시스턴트 트래픽 글로벌 Top 5 달성

주요업무

## 현재 해결해야 할 핵심 과제
• 자연스러운 인토네이션 개선: 페르소나별 말투와 억양을 정확히 재현하는 TTS 모델 개발
• 감정 표현 고도화: 웃음소리, 한숨, 감탄사 등 자연스러운 감정 표현이 가능한 TTS 구현
• 첫 토큰 지연 최소화: 실시간 대화를 위한 ultra-low latency TTS 시스템 구축

## 핵심 연구개발 영역
• Realtime Conversational Voice Cloning: 대화 상황에 최적화된 실시간 음성 복제 기술 개발
• 페르소나 기반 Expressive TTS: 캐릭터별 고유한 음성 스타일과 감정을 반영한 개인화 음성합성 엔진
• Neural Audio Codec 최적화
• TTS 데이터 파이프라인: 음성 데이터 전처리, 정제, 증강을 통한 모델 성능 향상

자격요건

• 컴퓨터 공학, 전기전자공학, 또는 관련 분야 석사 이상 또는 이에 준하는 실무 경험 보유
• TTS/음성합성 연구개발 경험 3년 이상
• PyTorch, TensorFlow 등 딥러닝 프레임워크에 대한 깊은 이해와 활용 경험
• 최신 딥러닝 기반 TTS 알고리즘 (FastSpeech, VITS, XTTS 등) 구현 및 커스터마이징 경험
• 음성신호처리 기초 지식: FFT, STFT, Mel-spectrogram, MFCC 등의 이해와 활용
• TTS 모델 학습 파이프라인 구축 경험: 데이터 전처리, 학습, 추론 및 튜닝 전반
• Python 및 관련 오디오 처리 라이브러리 (librosa, torchaudio 등) 숙련도
• 영어 기술 문서 이해 및 작성 가능한 수준의 언어 능력

TTS AI Research Engineer

포지션 상세

주요업무

자격요건

기술 스택 • 툴

태그

마감일

근무지역