LEANN: それが何か、解決する問題、そして注目を集めている理由

LEANN: それが何か、解決する問題、そして注目を集めている理由

解決する課題

LEANN は、個人向け AI システム用に設計された軽量ベクトルデータベースです。従来のベクトルデータベースに伴う大容量ストレージ要件という問題を解決し、ユーザーが高価なクラウドインフラを必要とせず、検索精度を犠牲にすることなく、ノートパソコン上で数百万件のドキュメントをインデックス化・検索できるようにします。

仕組み

LEANN は graph-based selective recomputation(グラフベースの選択的再計算)と high-degree preserving pruning(高次数保持プルーニング)という手法を使用します。テキストの数値表現である埋め込みをすべて保存する代わりに、必要に応じてオンデマンドで計算し、プルーニングされたグラフ構造を利用してストレージ負荷を最小化します。HNSW や DiskANN など複数のバックエンドをサポートし、OpenAI 互換 API を介してさまざまな LLM や埋め込みプロバイダーと統合できます。

対象ユーザー

プライベートでローカルな RAG(Retrieval‑Augmented Generation)システムを構築し、個人データ(ファイルシステム、メール、ブラウザ履歴、チャットログ(WeChat、iMessage)、エージェントメモリ(ChatGPT、Claude)など)をセマンティック検索したい個人向けに作られています。完全なプライバシーと低いハードウェア要件を維持しながら利用できます。

ハイライト

  • 極端なストレージ効率: 従来のソリューションと比べて最大 97% のストレージ削減を実現(例: 6 GB で 6000 万チャンクをインデックス化、従来は 201 GB 必要)。
  • プライバシー優先: データはユーザーのノートパソコンにローカルで保持され、クラウド依存がありません。
  • 幅広いデータ統合: PDF、テキストファイル、Apple Mail、ブラウザ履歴、そして Model Context Protocol(MCP)を介したライブデータをサポート。
  • Claude Code 互換: Claude Code 用のセマンティック検索 MCP サービスとして機能。
  • マルチモーダル対応: PDF からのビジュアルおよびテキスト検索を可能にする ColQwen を含む。

要約

LEANN は、グラフベースの選択的再計算を活用してストレージ必要量を最大 97% 削減する高効率ベクトルデータベースで、数百万件の個人ドキュメントに対するローカル RAG を実現します。

タイトル

LEANN: それが何か、解決する問題、そして注目を集めている理由

Sources