smile: 통합 LLM 추론 및 에이전트형 데이터 과학 IDE를 갖춘 고성능 JVM 머신러닝 프레임워크

smile: 통합 LLM 추론 및 에이전트형 데이터 과학 IDE를 갖춘 고성능 JVM 머신러닝 프레임워크

해결하는 문제

SMILE은 JVM을 위한 고성능의 포괄적인 머신러닝 프레임워크를 제공하여, 개발자가 Java, Scala 또는 Kotlin 생태계를 벗어나지 않고도 광범위한 통계 및 AI 알고리즘을 구현할 수 있도록 합니다. 이는 고수준의 데이터 과학 요구사항과 JVM 기반 프로덕션 환경의 성능 요구사항 사이의 간극을 메워줍니다.

작동 방식

SMILE은 여러 전문화된 모듈로 구성됩니다:

  • Core ML: 분류, 회귀, 클러스터링, 매니폴드 학습 및 이상 탐지를 위한 표준 알고리즘을 구현합니다.
  • Deep Learning & LLMs: GPU/CPU 텐서 연산을 위해 LibTorch 백엔드를 사용하며, BPE tokenizer와 OpenAI 호환 REST 서버를 포함한 전체 LLaMA-3 추론 스택을 제공합니다.
  • NLP: 텍스트 정규화, POS tagging, stemming 및 관련성 순위 산정 도구를 제공합니다.
  • Base: ML에 필요한 기초 수학, 선형 대수 및 데이터 구조(예: DataFrames)를 제공합니다.
  • Visualization: Swing 기반의 대화형 플롯과 선언적 Vega-Lite 차트를 포함합니다.
  • SMILE Studio: 사용자가 Python, Java 또는 Scala를 통해 자연어로 데이터와 상호작용할 수 있도록 하는 에이전트형 IDE입니다.

대상 사용자

통합 딥러닝 및 LLM 기능을 갖춘 강력하고 프로덕션 준비가 된 머신러닝 라이브러리가 필요한 JVM 생태계(Java, Scala, Kotlin) 내의 데이터 과학자 및 소프트웨어 엔지니어.

주요 특징

  • 포괄적인 알고리즘 제품군: Random Forests와 SVM부터 t-SNE 및 UMAP까지 모든 것을 지원합니다.
  • LLM Integration: 네이티브 LLaMA-3 추론 및 채팅 스트리밍을 위한 OpenAI 호환 서버를 제공합니다.
  • JVM Native: Java, Scala, Kotlin을 위한 관용적인 API를 갖춘 고성능 구현체입니다.
  • Agentic IDE: 자연어 데이터 상호작용을 위한 SMILE Studio를 포함합니다.
  • Enterprise Ready: 모델 직렬화 및 Apache Spark ML 파이프라인과의 통합을 지원합니다.

Sources