pykeen: 一个用于训练和评估知识图谱嵌入模型的 Python 框架

pykeen: 一个用于训练和评估知识图谱嵌入模型的 Python 框架

它解决了什么问题

PyKEEN 简化了训练和评估知识图谱嵌入模型的过程。它为研究人员和开发人员提供了一个标准化的框架,用于实验各种嵌入技术,包括那些结合了多模态信息的模型,而无需从头开始实现模型或数据集。

它是如何工作的

PyKEEN 使用一个高级的 pipeline 函数,允许用户指定一个模型和一个数据集来快速开始训练和评估。该库旨在具有可扩展性,在不同的模型和训练循环(例如随机局部封闭世界假设)中具有一致的 API,并提供像 TriplesFactory 这样的工具来处理自定义数据集。

它是面向谁的

它专为从事知识图谱和嵌入模型工作的 AI 研究人员和开发人员设计,这些人员需要一个强大的、可扩展的 Python 包来进行模型训练和评估。

亮点

  • 包含 37 个内置数据集和 5 个归纳数据集。
  • 支持 40 种不同的嵌入模型。
  • 集成了 Optuna 用于超参数优化,以及 PyTorch Lightning 用于可扩展训练。
  • 提供了一个高级的 pipeline 用于快速原型设计和评估。

Sources