業務委託
東京都 六本木駅
6,800,000 ~ 10,800,000円/月額
DMM.comの音声生成(TTS)技術の中核エンジニアとして、モデルのFine-tuning・推論最適化からサービス統合まで一気通貫で推進していただきます。 日本最大級のエンタメプラットフォームで、世界に通用する音声AIを創り上げる挑戦的なポジションです。 TTSモデル(Qwen-TTS、Orpheus等)のFine-tuning・話者/感情制御の実装 GPU上での推論効率化(バッチング、KV cache、量子化、同時実行数チューニング) 音素タイムライン生成のTTSパイプラインへの統合(アバターのリップシンク等への応用) 推論基盤の構築・運用、レイテンシ(TTFS)とサービス品質の管理
TTS/音声合成モデル TTSモデル(Qwen-TTS、Orpheus、VITS、Fish-Speech等)のFine-tuning・追加学習の実務経験 話者適応・感情/プロソディ制御・多言語対応などのカスタマイズ経験 音声データセットの構築・前処理パイプライン(音声/テキストアライメント等)の開発経験 PyTorchでのモデル学習、LoRA等の効率的Fine-tuning手法の実装経験 推論効率化 GPU上での推論最適化(バッチング、KV cache管理、量子化、ストリーミング生成)の実務経験 推論基盤(vLLM、TensorRT-LLM、SGLang等)の選定・導入・最適化経験 同時実行数(concurrency)のチューニング、レイテンシ(TTFS等)改善の実務経験 CUDA最適化、メモリ効率化に関する深い理解 サービス化技術 REST API/WebSocket/gRPC設計、ストリーミング音声配信の実装経験 推論サービスのレプリカ構成、オートスケーリング、監視・可観測性基盤の構築経験
音素タイムライン(phoneme timestamp)生成をTTSに統合した経験 ※優先採用 リアルタイム音声対話・AIアバターのリップシンク等の開発経験 言語:日本語能力検定1級、英語ビジネス会話レベル BigTech、音声AI特化企業でのTTS/音声生成モデルの開発・運用経験
ゲーム
DMMでは、CTO直下のミッションクリティカルなプロジェクトとして、DMM独自のデータ・ドメインに特化した音声生成(TTS)技術の研究開発・サービス化をリードする高度AI人材を募集します。 DMMならではの強みを活かし、競合他社には真似できないAIサービスを共に創り上げていく意欲のある方を求めています。 現在、DMMのAI開発は主に既存のLLMを活用したAIチャットやAIエージェントなどのサービス開発が中心ですが、これに高品質な音声合成を組み合わせることで、AIアバターや対話型キャラクターといった新たなユーザー体験を生み出すことを目指しています。 この戦略的な取り組みを推進するため、TTSモデルのコア技術を熟知し、Qwen等のオープンモデルをDMMのデータでFine-tuningでき、かつ推論を効率化できる音声AIエンジニアを求めています。
2026/09
フレックスタイム制(コアタイム等、詳細は部署による)
あり
なし
2026/06/18 18:00:45
音声合成技術は、エンターテイメント分野におけるユーザー体験を革新する可能性を秘めています。 本案件は、最先端の音声合成モデル開発を通じて、新たな対話型キャラクターやAIアバターといった革新的なサービス創出に貢献できる機会を提供します。 高度なAI技術とエンターテイメントを融合させることで、将来性の高い分野でのキャリアを築くことができるでしょう。
業務委託
東京都 品川駅
~ 770,000円/月額
業務委託
大阪府 渡辺橋駅
1,300,000 ~ 1,600,000円/月額
業務委託
東京都 東京駅
1,800,000 ~ 2,500,000円/月額

フリーランスエンジニア向けIT案件・求人検索サイト【フリーランスジョブ】
株式会社Hajimari 東京都渋谷区道玄坂一丁目16番10号渋谷DTビル9F
©︎ Hajimari Inc. All Rights Reserved