【AI/音声合成】TTSモデル開発・最適化案件

業務委託

~ 780,000円/月額※平均単価を表示実際はスキルによります

※平均単価を表示実際はスキルによります

募集状況を聞く（無料）

人気案件は申し込みが集中いたしますため、お早めに募集状況をお聞きください。
具体的な報酬単価・企業名・労働条件につきましては、お問い合わせ後に説明いたします。

案件詳細: TTS/音声合成モデルの開発・学習・カスタマイズ・サービス化。 GPU上での推論最適化、推論基盤の選定・導入・最適化。 REST API/WebSocket/gRPC設計、ストリーミング音声配信の実装。推論サービスのレプリカ構成、オートスケーリング、監視・可観測性基盤の構築。
開発言語: PyTorch 生成AI AI ファインチューニング研究開発
必須スキル・経験: TTSモデル（Qwen-TTS、Orpheus、VITS、Fish-Speech等）のFine-tuning・追加学習の実務経験話者適応・感情/プロソディ制御・多言語対応などのカスタマイズ経験音声データセットの構築・前処理パイプライン（音声/テキストアライメント等）の開発経験 PyTorchでのモデル学習、LoRA等の効率的Fine-tuning手法の実装経験 GPU上での推論最適化（バッチング、KV cache管理、量子化、ストリーミング生成）の実務経験推論基盤（vLLM、TensorRT-LLM、SGLang等）の選定・導入・最適化経験同時実行数（concurrency）のチューニング、レイテンシ（TTFS等）改善の実務経験 CUDA最適化、メモリ効率化に関する深い理解 REST API/WebSocket/gRPC設計、ストリーミング音声配信の実装経験推論サービスのレプリカ構成、オートスケーリング、監視・可観測性基盤の構築経験
尚可スキル・経験: 音素タイムライン（phoneme timestamp）生成をTTSに統合した経験 ※優先採用リアルタイム音声対話・AIアバターのリップシンク等の開発経験言語：日本語能力検定1級、英語ビジネス会話レベル BigTech、音声AI特化企業でのTTS/音声生成モデルの開発・運用経験
職種・ポジション: AIエンジニア機械学習エンジニアモバイルアプリエンジニア LLMエンジニア MLエンジニアプロンプトエンジニア AIコンサルタント
業界: Saas
募集背景: 独自データや事業領域に強い関心を持ち、新たな価値創造に貢献したいという強い意欲のある方を募集しております。非常に困難な課題に対しても、粘り強く研究開発を推進できる方。自律的に行動し、未知の領域にも積極的に挑戦できる方。チーム内外との円滑なコミュニケーションを通じて、プロジェクトを推進できる方。
開発環境: PyTorch, vLLM, TensorRT-LLM, SGLang, CUDA
案件公開日時: 2026/06/16 20:40:31

おすすめポイント

音声合成技術は、多様なコミュニケーションチャネルの構築や、よりパーソナルなユーザー体験の提供に不可欠な要素となっています。本案件は、最先端のTTSモデル開発と推論最適化を通じて、音声技術の可能性を広げ、新たなサービス創出に貢献するプロジェクトです。最先端のAI技術に触れ、音声技術の進化を牽引する貴重な経験が得られるでしょう。

案件について、詳しく聞いてみませんか？

フリーランスジョブでは、
あなたのご希望とご経歴に最適な案件を
エージェントが直接ご紹介します

募集状況を聞く（無料）