業務委託
~ 680,000円/月額※平均単価を表示 実際はスキルによります
※平均単価を表示 実際はスキルによりますエンタープライズ向けPoCプロジェクトが増加する中、テキスト情報だけでなく図面・図表を含むドキュメントの活用ニーズ(Visual RAG)が急増しています。VLM(Vision-Language Model)の活用が鍵となりますが、実運用に向けては「精度・コスト・速度・信頼性」の面で多くの課題があります。 VLM等の最新技術を活用し、ドキュメント構造化の信頼性や機能を向上させるための研究開発および検証をリードいただきます。 単なるPoCにとどまらず、実運用を見据えた「使える技術」への昇華を担っていただきます。 ■具体的な業務内容 VLMを活用したドキュメント構造化パイプラインの構築・改善 プロンプトチューニングなどによるVLM出力精度の向上と、バリデーション機能の開発 図面解析など、顧客課題に応じたPoCの技術検証・実施
LLMまたはVLMを活用したアプリケーション開発、またはPoCの実施経験 Pythonを用いたR&Dまたはサービス開発経験 RAG(Retrieval-Augmented Generation)の基本的な仕組みの理解 未知の技術領域(特にマルチモーダルモデル)に対する調査・検証能力
画像処理・Computer Visionに関する知識(OCR、レイアウト解析、物体検出等) 複数のVLMモデルの比較検証やパイプライン構成の経験 論文調査(ArXiv等)を行い、実装に落とし込める能力 顧客課題を技術課題に翻訳し、解決策を提案した経験
Saas
エンタープライズ向けのPoCプロジェクトが増加する中、テキスト情報だけでなく図面・図表を含むドキュメントの活用ニーズ(Visual RAG)が急増しています。VLM(Vision-Language Model)の活用が鍵となりますが、実運用に向けては「精度・コスト・速度・信頼性」の面で多くの課題があります。 VLM等の最新技術を活用し、ドキュメント構造化の信頼性や機能を向上させるための研究開発および検証をリードいただきます。 単なるPoCにとどまらず、実運用を見据えた「使える技術」への昇華を担っていただきます。
Python、TypeScript、Vue.js 、Node.js Docker Terraform AWS, Azure
2027/01
PaaS Unitには事業責任者(CEO)1名、開発責任者 1名、プロダクトエンジニア 7名、RAGエンジニア 5名、機械学習エンジニア 3名、プロダクトマネージャー 1名、リサーチャー 1名、CS 1名、Biz 3名、新規事業企画 5名が所属しています。
フルリモート
オンライン
あり
なし
2026/04/02 15:25:26
エンタープライズ向けのドキュメント活用ニーズは、テキスト情報だけでなく図面や図表を含む複雑な情報処理へと拡大しています。 本案件は、VLM(Vision-Language Model)を活用し、これらのドキュメント構造化における精度、コスト、速度、信頼性の課題解決を目指す研究開発プロジェクトです。 最先端のマルチモーダルAI技術を実運用レベルに引き上げるための環境整備・開発に携わることで、市場でもまだ確立されていないソリューション開発に貢献できる貴重な機会となります。
業務委託
東京都 本郷三丁目駅
670,000 ~ 720,000円/月額
業務委託
670,000 ~ 1,100,000円/月額

フリーランスエンジニア向けIT案件・求人検索サイト【フリーランスジョブ】
株式会社Hajimari 東京都渋谷区道玄坂一丁目16番10号渋谷DTビル9F
©︎ Hajimari Inc. All Rights Reserved