LEANN: それが何か、解決する問題、そして注目を集めている理由
LEANN: それが何か、解決する問題、そして注目を集めている理由
解決する課題
LEANN は、個人向け AI システム用に設計された軽量ベクトルデータベースです。従来のベクトルデータベースに伴う大容量ストレージ要件という問題を解決し、ユーザーが高価なクラウドインフラを必要とせず、検索精度を犠牲にすることなく、ノートパソコン上で数百万件のドキュメントをインデックス化・検索できるようにします。
仕組み
LEANN は graph-based selective recomputation(グラフベースの選択的再計算)と high-degree preserving pruning(高次数保持プルーニング)という手法を使用します。テキストの数値表現である埋め込みをすべて保存する代わりに、必要に応じてオンデマンドで計算し、プルーニングされたグラフ構造を利用してストレージ負荷を最小化します。HNSW や DiskANN など複数のバックエンドをサポートし、OpenAI 互換 API を介してさまざまな LLM や埋め込みプロバイダーと統合できます。
対象ユーザー
プライベートでローカルな RAG(Retrieval‑Augmented Generation)システムを構築し、個人データ(ファイルシステム、メール、ブラウザ履歴、チャットログ(WeChat、iMessage)、エージェントメモリ(ChatGPT、Claude)など)をセマンティック検索したい個人向けに作られています。完全なプライバシーと低いハードウェア要件を維持しながら利用できます。
ハイライト
- 極端なストレージ効率: 従来のソリューションと比べて最大 97% のストレージ削減を実現(例: 6 GB で 6000 万チャンクをインデックス化、従来は 201 GB 必要)。
- プライバシー優先: データはユーザーのノートパソコンにローカルで保持され、クラウド依存がありません。
- 幅広いデータ統合: PDF、テキストファイル、Apple Mail、ブラウザ履歴、そして Model Context Protocol(MCP)を介したライブデータをサポート。
- Claude Code 互換: Claude Code 用のセマンティック検索 MCP サービスとして機能。
- マルチモーダル対応: PDF からのビジュアルおよびテキスト検索を可能にする ColQwen を含む。
要約
LEANN は、グラフベースの選択的再計算を活用してストレージ必要量を最大 97% 削減する高効率ベクトルデータベースで、数百万件の個人ドキュメントに対するローカル RAG を実現します。
タイトル
LEANN: それが何か、解決する問題、そして注目を集めている理由
Sources
- undefinedStarTrail-org/LEANN