Facebook 社内資料RAG検索 PoC
Logo

社内資料RAG検索 PoC

クレジット
Avatar
Dify連携
RAG API設計・実装
動作検証
社内資料RAG検索 PoC-1
シェア
制作ノート
社内資料RAG検索 PoC

GitHub:https://github.com/junxshiratori/internal-rag-poc

概要:社内資料を対象にしたRAG検索APIのPoCを実装しました。
PDF、Markdown、CSV形式の資料を読み込み、質問に対して関連情報を検索し、回答とあわせて根拠ファイル・行番号・類似度を返す構成にしています。
FastAPIで /ask エンドポイントを作成し、Dify WorkflowのHTTP Requestノードから呼び出すところまで実装しました。

使用技術:Python / FastAPI / Chroma / sentence-transformers / local embedding / pandas / pypdf / Dify Workflow / ngrok / Git

実装内容:PDF / Markdown / CSVの読み込み、Document形式への正規化、チャンク分割、local embeddingによるベクトル化、Chromaへの保存、類似チャンク検索、根拠付き回答生成、資料内に根拠がない場合の回答制御、FastAPIによるAPI化、Dify WorkflowからのHTTP Request連携、Dify側でのレスポンス整形・回答表示

工夫した点:OpenAI APIの課金やクォータに依存しないよう、Embeddingはlocal embeddingで実装しました。これにより、APIキーなしでもRAG検索の基本構成をローカルで検証できるようにしています。
また、DifyにRAGロジックを直接持たせず、FastAPIのRAG APIを呼び出す構成にしました。Dify側は質問入力・API呼び出し・レスポンス整形・回答表示を担当し、検索処理やEmbedding、回答生成ロジックはPython側に分離しています。
回答には、ファイル名、行番号、類似度、該当テキストを含め、回答根拠を確認できる構成にしています。

AWS構成案:AWS展開案として、S3、Knowledge Bases for Amazon Bedrock、Lambda、API Gatewayを用いたクラウド構成案も整理しています。現時点ではAWS上の実装ではなく、企業導入時にクラウド構成へ拡張するための設計案です。

シェア
foriio

あなたのforiioを無料で作成

fori.io/
Logo
foriio

あなたのforiioを無料で作成

fori.io/