【AI/音声合成】音声合成モデル開発・推論最適化案件

業務委託

東京都六本木駅

6,800,000 ~ 10,800,000円/月額

募集状況を聞く（無料）

人気案件は申し込みが集中いたしますため、お早めに募集状況をお聞きください。
具体的な報酬単価・企業名・労働条件につきましては、お問い合わせ後に説明いたします。

案件詳細: DMM.comの音声生成（TTS）技術の中核エンジニアとして、モデルのFine-tuning・推論最適化からサービス統合まで一気通貫で推進していただきます。日本最大級のエンタメプラットフォームで、世界に通用する音声AIを創り上げる挑戦的なポジションです。 TTSモデル（Qwen-TTS、Orpheus等）のFine-tuning・話者/感情制御の実装 GPU上での推論効率化（バッチング、KV cache、量子化、同時実行数チューニング）音素タイムライン生成のTTSパイプラインへの統合（アバターのリップシンク等への応用）推論基盤の構築・運用、レイテンシ（TTFS）とサービス品質の管理
開発言語: AWS Azure GCP PyTorch 生成AI AIエージェント AI ファインチューニング AI開発
必須スキル・経験: TTS/音声合成モデル TTSモデル（Qwen-TTS、Orpheus、VITS、Fish-Speech等）のFine-tuning・追加学習の実務経験話者適応・感情/プロソディ制御・多言語対応などのカスタマイズ経験音声データセットの構築・前処理パイプライン（音声/テキストアライメント等）の開発経験 PyTorchでのモデル学習、LoRA等の効率的Fine-tuning手法の実装経験推論効率化 GPU上での推論最適化（バッチング、KV cache管理、量子化、ストリーミング生成）の実務経験推論基盤（vLLM、TensorRT-LLM、SGLang等）の選定・導入・最適化経験同時実行数（concurrency）のチューニング、レイテンシ（TTFS等）改善の実務経験 CUDA最適化、メモリ効率化に関する深い理解サービス化技術 REST API/WebSocket/gRPC設計、ストリーミング音声配信の実装経験推論サービスのレプリカ構成、オートスケーリング、監視・可観測性基盤の構築経験
尚可スキル・経験: 音素タイムライン（phoneme timestamp）生成をTTSに統合した経験 ※優先採用リアルタイム音声対話・AIアバターのリップシンク等の開発経験言語：日本語能力検定1級、英語ビジネス会話レベル BigTech、音声AI特化企業でのTTS/音声生成モデルの開発・運用経験
職種・ポジション: AIエンジニア機械学習エンジニアシステムエンジニア(SE)プログラマー(PG)フルスタックエンジニアモバイルアプリエンジニア LLMエンジニア MLエンジニアプロンプトエンジニア
業界: ゲーム
募集背景: DMMでは、CTO直下のミッションクリティカルなプロジェクトとして、DMM独自のデータ・ドメインに特化した音声生成（TTS）技術の研究開発・サービス化をリードする高度AI人材を募集します。 DMMならではの強みを活かし、競合他社には真似できないAIサービスを共に創り上げていく意欲のある方を求めています。現在、DMMのAI開発は主に既存のLLMを活用したAIチャットやAIエージェントなどのサービス開発が中心ですが、これに高品質な音声合成を組み合わせることで、AIアバターや対話型キャラクターといった新たなユーザー体験を生み出すことを目指しています。この戦略的な取り組みを推進するため、TTSモデルのコア技術を熟知し、Qwen等のオープンモデルをDMMのデータでFine-tuningでき、かつ推論を効率化できる音声AIエンジニアを求めています。
参画時期: 2026/09
勤務時間: フレックスタイム制（コアタイム等、詳細は部署による）
PC貸与: あり
服装規定: なし
案件公開日時: 2026/06/18 18:00:45

おすすめポイント

音声合成技術は、エンターテイメント分野におけるユーザー体験を革新する可能性を秘めています。本案件は、最先端の音声合成モデル開発を通じて、新たな対話型キャラクターやAIアバターといった革新的なサービス創出に貢献できる機会を提供します。高度なAI技術とエンターテイメントを融合させることで、将来性の高い分野でのキャリアを築くことができるでしょう。

案件について、詳しく聞いてみませんか？

フリーランスジョブでは、
あなたのご希望とご経歴に最適な案件を
エージェントが直接ご紹介します

募集状況を聞く（無料）