• 近日,Oracle 开源了一个用 Java 编写的机器学习库,名为 Tribuo。它提供了用于分类、回归、聚类、模型开发等的工具。也为许多流行的第三方机器学习库提供了统一的接口。

    Tribuo 是 Java 编写的机器学习库,可提供多类分类、回归、聚类、异常检测和多标签分类。Tribuo 提供了流行的机器学习算法的实现,还包装了其他库以提供统一的接口。Tribuo 包含加载、特性化和转换数据所需的所有代码。此外,它包括所有受支持的预测类型的评估类。

    Tribuo可在 Java 8+上运行。它本身是一个纯 Java 库,并且在所有 Java 平台上都受支持。但是,某些接口需要本机代码,因此仅在有本机库支持的情况下才受支持。该库在 Windows 10、macOS 和 Linux(RHEL / OL / CentOS 7+)上的 x86_64 架构上进行过测试,因为这些是 Tribuo 与之交互的本机库的受支持平台。

    该机器学习库的开发工作由 Oracle Labs 的机器学习研究小组领导。从编程语言上来看,大多数流行的机器学习库都用 Python 和 R 等动态语言编写,而多数企业系统是基于 Java 等静态类型语言的。这就要求企业同时使用不同语言来编写代码,并确保其运行,也会因此产生更多的代码维护成本和系统开销。

    此次开源的 Tribuo 则能够妥善处理这些问题。Tribuo 具有数据加载管道、文本处理管道和功能级别转换,可在数据加载后对其进行操作。它知道自己输入/输出了什么,并可以描述每个输入/输出的范围和类型。

    使用 Tribuo 从其他系统和语言部署模型也很方便,它提供了指向 ONNX Runtime、TensorFlow 和 XGBoost 的接口。其中,对 onnx 模型的支持允许在 Java 中部署一些 Python 软件包(例如 pytorch)训练的模型。

    项目地址: https://tribuo.org/

    e39439c8-c333-4429-9098-4d9338051109-image.png