llm-graph-builder

llm-graph-builder: それが何か、解決する問題、そして注目を集めている理由

解決する課題

このプロジェクトは、PDF、Word 文書、テキストファイル、YouTube 動画、ウェブページなどの非構造化データを、Neo4j に保存された構造化ナレッジグラフへ変換する方法を提供します。生のテキストからエンティティやリレーションシップを抽出して構造化データベースを構築する手作業を不要にします。

仕組み

アプリケーションは Large Language Models (LLMs) と LangChain フレームワークを利用して非構造化入力を解析します。ノード(エンティティ)・リレーションシップ・それらのプロパティを抽出し、Neo4j グラフデータベースへマッピングします。ユーザーは抽出プロセスを導くカスタムスキーマを定義できるほか、既存のスキーマも利用できます。また、データのベクトル埋め込みもサポートしており、ハイブリッド検索機能を実現します。

対象ユーザー

生のドキュメントを下流の AI アプリケーション(RAG(Retrieval‑Augmented Generation)や高度なデータ分析など)でクエリ可能なナレッジグラフに変換したい開発者やデータエンジニア向けに設計されています。

ハイライト

  • マルチソース対応: ローカルファイル、GCS、S3 バケット、YouTube、ウェブページからデータをインポート可能。
  • 幅広い LLM 互換性: OpenAI、Gemini、Anthropic、Groq、Ollama(ローカル LLM 用)など多数のプロバイダーをサポート。
  • 対話型インターフェース: ベクトル、グラフ、ハイブリッドの各チャットモードで生成されたグラフデータとやり取りできる組み込みチャットボットを搭載。
  • 可視化: Neo4j Bloom と統合し、生成されたナレッジグラフを視覚化。
  • 使用量トラッキング: ユーザーとデータベース接続のトークン使用量を自動でモニタリング。

Sources