ANNdotNET是一个提供机器学习项目全生命周期管理的应用程序,从定义原始数据集、数据清洗和特征工程,到模型的训练和评估。用户可以在同一个项目中创建多个机器学习配置文件,选择最佳的配置文件后,完成训练和评估过程,下一步就是模型的部署/导出。目前,ANNdotNET定义了三种导出选项:导出模型结果到CSV文件、导出模型和模型结果到Excel,以及导出模型到CNTK文件格式。通过这三种导出选项,可以满足多种机器学习场景的需求。
导出到CSV的功能是将测试数据集的实际值和预测值导出到逗号分隔的文本文件中。如果没有提供测试数据集,将导出验证数据集的结果。如果既没有测试数据集也没有验证数据集,导出过程将终止。导出过程首先选择适当的机器学习配置文件,网络模型必须在导出前训练完成。一旦导出过程完成,CSV文件将被创建在磁盘上。可以将导出的结果导入到Excel中,显示的内容如下所示:
导出的结果在两列中显示:实际值和预测值。如果是导出分类结果,在标题中将导出关于类别值的信息。
导出到Excel的选项不仅仅是导出结果,实际上是将模型部署到Excel环境中。除了导出所有定义的数据集(训练、验证和测试),模型本身也被导出。预测值是通过使用ANNdotNET Excel插件计算的,模型评估看起来就像是调用普通的Excel公式。更多关于其工作原理的信息可以在这里找到。导出的xlsx文件可以打开,可以继续进行模型和相关数据集的进一步分析。以下图片显示了混凝土裂缝测试示例导出的模型。由于只定义了两个数据集(训练和验证),因此导出了这些数据集。可以看到,预测列没有填充,只有行填充了必须通过在公式前面插入等号“=”来评估的公式。
一旦为第一行评估了公式,可以使用Excel技巧将其复制到其他行。其他在Excel工作表中分隔的数据集也是如此。
最后一个选项允许将训练好的CNTK模型导出为CNTK格式。一旦CNTK对C#库支持ONNX格式,也将支持ONNX格式。这个选项在需要在其他解决方案中评估训练好的CNTK模型的情况下非常有用。
# 示例代码:导出模型到CSV
# 假设已经有一个训练好的模型
model = anndotnet.load_model("your_model_path")
model.export_to_csv("your_csv_path")
# 示例代码:导出模型到Excel
# 假设已经有一个训练好的模型
model = anndotnet.load_model("your_model_path")
model.export_to_excel("your_excel_path")
# 示例代码:导出模型到CNTK
# 假设已经有一个训练好的模型
model = anndotnet.load_model("your_model_path")
model.export_to_cntk("your_cntk_path")