Chinese-LLaMA-Alpaca: それは何であり、どのような問題を解決し、なぜ注目を集めているのか

Chinese-LLaMA-Alpaca: それは何であり、どのような問題を解決し、なぜ注目を集めているのか

解決する問題

このプロジェクトは、オリジナルの LLaMA モデルにおける高品質でオープンソースな中国語能力の不足に対処します。中国語の意味理解と中国語の指示に従う能力が向上したモデルを提供することで、中国語でのチャット、執筆、質疑応答などのタスクに適したモデルを実現します。

仕組み

このプロジェクトは、以下の3つのステップを通じてオリジナルの LLaMA モデルを強化します：

語彙の拡張: オリジナルの LLaMA の語彙を拡張して中国語のトークンを含めることで、エンコーディングとデコーディングの効率を向上させます。
二次的な事前学習: モデルは大規模な中国語テキストデータでさらに学習を行い、基本的な意味理解を向上させます。
指示による微調整 (Instruction Fine-tuning): Alpaca バージョンについては、ラベル付きの中国語指示データを使用してモデルを微調整し、特定のコマンドを理解し実行する能力を向上させます。

ライセンスの制限により、このプロジェクトは LoRA weights (パッチ) を配布しており、ユーザーはフルモデルを作成するために、これらをオリジナルの LLaMA weights とマージする必要があります。

対象者

研究者および開発者: オープンソースの中国語 LLM を必要とする中国語 NLP コミュニティの研究者や開発者。
エンドユーザー: 自身のハードウェア (CPU または GPU) で ChatGPT のような体験をローカルで実行したいユーザー。
開発者: LangChain や privateGPT などのフレームワークを介して、アプリケーションに中国語 LLM の機能を統合したい開発者。

ハイライト

複数のモデルバリエーション: テキスト補完用のベースモデル (Chinese-LLaMA) と、対話用の指示調整済みモデル (Chinese-Alpaca) を提供し、7B、13B、33B のサイズが利用可能です。
ローカル展開: llama.cpp、transformers、およびその他のツールを介して、個人用コンピュータで効率的に実行するための量子化をサポートしています。
幅広いエコシステムへの対応: text-generation-webui、LlamaChat、LangChain、および privateGPT と互換性があります。
オープンな学習ツール: 事前学習と指示による微調整のためのスクリプトを提供しており、ユーザーがモデルをさらにカスタマイズできるようにしています。

Sources

undefinedymcui/Chinese-LLaMA-Alpaca