業務委託
~ 780,000円/月額※平均単価を表示 実際はスキルによります
※平均単価を表示 実際はスキルによりますTTS/音声合成モデルの開発・学習・カスタマイズ・サービス化。 GPU上での推論最適化、推論基盤の選定・導入・最適化。 REST API/WebSocket/gRPC設計、ストリーミング音声配信の実装。 推論サービスのレプリカ構成、オートスケーリング、監視・可観測性基盤の構築。
TTSモデル(Qwen-TTS、Orpheus、VITS、Fish-Speech等)のFine-tuning・追加学習の実務経験 話者適応・感情/プロソディ制御・多言語対応などのカスタマイズ経験 音声データセットの構築・前処理パイプライン(音声/テキストアライメント等)の開発経験 PyTorchでのモデル学習、LoRA等の効率的Fine-tuning手法の実装経験 GPU上での推論最適化(バッチング、KV cache管理、量子化、ストリーミング生成)の実務経験 推論基盤(vLLM、TensorRT-LLM、SGLang等)の選定・導入・最適化経験 同時実行数(concurrency)のチューニング、レイテンシ(TTFS等)改善の実務経験 CUDA最適化、メモリ効率化に関する深い理解 REST API/WebSocket/gRPC設計、ストリーミング音声配信の実装経験 推論サービスのレプリカ構成、オートスケーリング、監視・可観測性基盤の構築経験
音素タイムライン(phoneme timestamp)生成をTTSに統合した経験 ※優先採用 リアルタイム音声対話・AIアバターのリップシンク等の開発経験 言語:日本語能力検定1級、英語ビジネス会話レベル BigTech、音声AI特化企業でのTTS/音声生成モデルの開発・運用経験
Saas
独自データや事業領域に強い関心を持ち、新たな価値創造に貢献したいという強い意欲のある方を募集しております。 非常に困難な課題に対しても、粘り強く研究開発を推進できる方。 自律的に行動し、未知の領域にも積極的に挑戦できる方。 チーム内外との円滑なコミュニケーションを通じて、プロジェクトを推進できる方。
PyTorch, vLLM, TensorRT-LLM, SGLang, CUDA
2026/06/16 20:40:31
音声合成技術は、多様なコミュニケーションチャネルの構築や、よりパーソナルなユーザー体験の提供に不可欠な要素となっています。 本案件は、最先端のTTSモデル開発と推論最適化を通じて、音声技術の可能性を広げ、新たなサービス創出に貢献するプロジェクトです。 最先端のAI技術に触れ、音声技術の進化を牽引する貴重な経験が得られるでしょう。
業務委託
東京都 日比谷駅
~ 1,100,000円/月額
業務委託
東京都 浜松町駅
~ 800,000円/月額
業務委託
大阪府 千里中央駅
~ 850,000円/月額

フリーランスエンジニア向けIT案件・求人検索サイト【フリーランスジョブ】
株式会社Hajimari 東京都渋谷区道玄坂一丁目16番10号渋谷DTビル9F
©︎ Hajimari Inc. All Rights Reserved