OpenKB

OpenKB: 무엇이며, 어떤 문제를 해결하고, 왜 주목받고 있는가

해결하는 문제

OpenKB는 원시적이고 파편화된 문서를 구조화되고 상호 연결된 위키 스타일의 지식 베이스로 변환합니다. 전통적인 RAG가 각 질의마다 처음부터 정보를 검색하는 것과 달리, OpenKB는 지식을 지속적이고 진화하는 위키에 축적하여 시간이 지남에 따라 정보가 누적되도록 하여 원시 데이터에서 통찰을 반복적으로 재도출할 필요성을 줄입니다.

작동 원리

OpenKB는 위키 기반제너레이터라는 두 층 구조를 사용합니다.

  1. 위키 기반: PDF, Word, PowerPoint 등 다양한 파일 형식을 Markdown으로 변환합니다. 20페이지 이상과 같은 긴 문서의 경우 전체 텍스트를 읽는 대신 PageIndex를 활용해 계층적 트리 인덱스를 생성합니다. 이후 LLM이 이러한 문서를 요약, 개념 페이지, 엔터티 페이지(인물, 조직, 장소, 제품) 등으로 정리하고 교차 링크를 삽입합니다.
  2. 제너레이터: 이 도구들은 구축된 위키를 기반으로 질의에 대한 근거 있는 답변, 인터랙티브 채팅, 3D 지식 그래프, HTML 슬라이드 덱 등 다양한 출력을 생성합니다.

대상 사용자

대량의 복잡한 문서를 관리하고, Obsidian과 같은 도구와 통합하거나 특화된 AI 에이전트를 구동할 수 있는 지속적이고 구조화된 지식 베이스가 필요한 사용자들을 위해 설계되었습니다.

주요 특징

  • 벡터리스 검색: 긴 문서에 대해 벡터 데이터베이스 대신 PageIndex를 이용한 추론 기반 트리 인덱싱을 사용합니다.
  • 인용 및 종합: 여러 문서에 걸친 요약과 교차 참조를 자동으로 생성합니다.
  • 스킬 팩토리: 위키에서 지식을 추출해 Claude Code, Codex, Gemini CLI 등에서 활용 가능한 휴대용 에이전트 스킬로 전환합니다.
  • Obsidian 호환성: 위키를 일반 Markdown 파일과 위키링크 형태로 저장해 Obsidian의 그래프 뷰와 자연스럽게 연동됩니다.
  • 멀티모달리티: 그림, 표, 이미지 등을 검색하고 이해할 수 있습니다.

요약

OpenKB는 원시 문서를 LLM을 활용해 구조화되고 상호 연결된 위키 스타일의 지식 베이스로 컴파일하는 오픈소스 CLI 시스템으로, 지속적인 지식 축적과 추론 기반 검색을 가능하게 합니다.

제목

OpenKB: 무엇이며, 어떤 문제를 해결하고, 왜 주목받고 있는가

Sources