koharu: 自動インペインティングとプロフェッショナルなPSDエクスポートを備えたローカルファーストのMLマンガ翻訳ツール
koharu: 自動インペインティングとプロフェッショナルなPSDエクスポートを備えたローカルファーストのMLマンガ翻訳ツール
何を解決するか
Koharuは、マンガのページを翻訳する退屈なプロセスを自動化する、ローカルファーストのマンガ翻訳ツールです。テキストの検出、元の文字の除去、そして翻訳されたテキストをページに戻すという手動のワークフローを置き換えます。
仕組み
Koharuは、機械学習モデルの段階的なパイプラインを使用してページを処理します:
- Detection: YOLOやその他のビジョンモデルを使用して、テキスト領域と吹き出しを特定します。
- OCR: 多言語OCRモデルを使用して、ソーステキストを認識します。
- Inpainting: FLUX.2やLaMaなどのモデルを使用して、画像から元のテキストを削除し、クリーンな背景を作成します。
- Translation: ローカルLLM(llama.cpp経由)またはリモートAPI(OpenAI, Claude, Gemini, DeepSeek)を使用してテキストを翻訳します。
- Rendering: 専用のテキストレンダラーが、垂直方向のCJKレイアウトや右から左へのスクリプトを含む、複雑なマンガのレタリングを処理します。
対象ユーザー
ほとんどのパイプラインを自身のハードウェア上でローカルに実行できる、高性能でプライバシー重視のデスクトップアプリケーションを求めるマンガ翻訳者やスキャネレーター向けに設計されています。
ハイライト
- Local-First Privacy: データを安全に保つため、ビジョンモデルとLLMをローカルで実行します。
- GPU Acceleration: 高速処理のために、CUDA, Metal, Vulkan, および実験的なZLUDAをサポートしています。
- Professional Export: レイヤー化されたPSDファイルにエクスポートし、Photoshopで翻訳テキストレイヤーを手動で微調整することを可能にします。
- Agent Integration: ローカルエージェントによる自動化のための、組み込みのMCPサーバーとヘッドレスモードが含まれています。
- Advanced Typesetting: Google Fontsのサポートを備えた、垂直方向のCJKおよびRTLスクリプトに特化化したレンダリングを提供します。
Sources
- undefinedmayocream/koharu