koharu: 一个具有自动修补和专业 PSD 导出的本地优先 ML 漫画翻译工具
koharu: 一个具有自动修补和专业 PSD 导出的本地优先 ML 漫画翻译工具
它解决了什么问题
Koharu 是一个本地优先的漫画翻译工具,它将漫画页面翻译的繁琐过程自动化。它取代了检测文本、移除原始文字以及将翻译后的文本重新排版回页面的手动工作流程。
工作原理
Koharu 使用分阶段的机器学习模型流水线来处理页面:
- 检测:使用 YOLO 和其他视觉模型来识别文本区域和对话框。
- OCR:使用多语言 OCR 模型识别源文本。
- 修补 (Inpainting):使用 FLUX.2 或 LaMa 等模型从图像中移除原始文本,以创建干净的背景。
- 翻译:使用本地 LLM(通过 llama.cpp)或远程 API(OpenAI, Claude, Gemini, DeepSeek)进行文本翻译。
- 渲染:专门的文本渲染器处理复杂的漫画文字,包括垂直 CJK 布局和从右向左的脚本。
适用人群
它专为漫画翻译者和汉化组(scanlators)设计,他们需要高性能、注重隐私的桌面应用程序,并且大部分流水线可以在自己的硬件上本地运行。
亮点
- 本地优先隐私:在本地运行视觉模型和 LLM 以确保数据安全。
- GPU 加速:支持 CUDA, Metal, Vulkan, 和实验性的 ZLUDA 以实现高速处理。
- 专业导出:导出为分层 PSD 文件,允许在 Photoshop 中手动精细化翻译后的文本图层。
- Agent 集成:包含内置的 MCP server 和无头模式(headless mode),可通过本地 agent 进行自动化。
- 高级排版:针对垂直 CJK 和 RTL 脚本的专门渲染,并支持 Google Fonts。
Sources
- undefinedmayocream/koharu