数据可视化API使用指南

数据可视化API的核心特性是它允许用户进行快速绘图和视觉调整，而无需重新计算。提供了一系列的展示类（Display classes），这些类通过两种方法来创建图表：from_estimator和from_predictions。from_estimator方法接受一个拟合过的估计器（estimator）和一些数据（X和y），然后创建一个展示对象。有时候，可能希望只计算一次预测结果，这时就应该使用from_predictions方法。以下是一个使用支持向量机绘制ROC曲线的例子：


from sklearn.model_selection import train_test_split
from sklearn.svm import SVC
from sklearn.metrics import RocCurveDisplay
from sklearn.datasets import load_wine

X, y = load_wine(return_X_y=True)
y = y == 2  # 将标签转换为二分类

X_train, X_test, y_train, y_test = train_test_split(X, y, random_state=42)
svc = SVC(random_state=42)
svc.fit(X_train, y_train)

svc_disp = RocCurveDisplay.from_estimator(svc, X_test, y_test)

返回的svc_disp对象允许在未来的图表中继续使用已经计算过的SVC的ROC曲线。在这种情况下，svc_disp是一个RocCurveDisplay对象，它将计算得到的值存储在名为roc_auc、fpr和tpr的属性中。需要注意的是，也可以从支持向量机获取预测结果，然后使用from_predictions代替from_estimator。接下来，训练一个随机森林分类器，并再次绘制之前计算过的ROC曲线，通过使用展示对象的plot方法。


import matplotlib.pyplot as plt
from sklearn.ensemble import RandomForestClassifier

rfc = RandomForestClassifier(n_estimators=10, random_state=42)
rfc.fit(X_train, y_train)
ax = plt.gca()

rfc_disp = RocCurveDisplay.from_estimator(rfc, X_test, y_test, ax=ax, alpha=0.8)
svc_disp.plot(ax=ax, alpha=0.8)

请注意，传递了alpha=0.8到plot函数中，以调整曲线的透明度。

可视化API的例子

以下是一些使用可视化API的例子，包括ROC曲线的可视化、高级绘图与部分依赖图、展示对象的可视化以及分类器校准的比较。

5.1 显示对象

以下是一些可用的显示对象，用于不同类型的数据可视化：

calibration.CalibrationDisplay(prob_true, ...): 校准曲线（也称为可靠性图）的可视化。
inspection.PartialDependenceDisplay(..., ...): 部分依赖图（PDP）的可视化。
inspection.DecisionBoundaryDisplay(*, xx0, ...): 决策边界的可视化。
metrics.ConfusionMatrixDisplay(..., ...): 混淆矩阵的可视化。
metrics.DetCurveDisplay(*, fpr, fnr, ...): DET曲线的可视化。
metrics.PrecisionRecallDisplay(precision, ...): 精确度召回率的可视化。
metrics.PredictionErrorDisplay(*, y_true, y_pred): 回归模型预测误差的可视化。
metrics.RocCurveDisplay(*, fpr, tpr, ...): ROC曲线的可视化。
model_selection.LearningCurveDisplay(*, ...): 学习曲线的可视化。
model_selection.ValidationCurveDisplay(*, ...): 验证曲线的可视化。

数据科学中的无监督学习技术

本文介绍了数据科学中无监督学习的各种技术，包括降维、聚类、双聚类、信号分解、协方差估计、异常检测和密度估计等。

scikit-learn版本更新通知

关注scikit-learn的版本更新，获取最新的机器学习库信息。

数据可视化API使用指南

可视化API的例子

数据科学中的无监督学习技术

scikit-learn版本更新通知

沪ICP备2024098111号-1

上海秋旦网络科技中心：上海市奉贤区金大公路8218号1幢联系电话：17898875485

数据可视化API使用指南

可视化API的例子

数据科学中的无监督学习技术

scikit-learn版本更新通知

沪ICP备2024098111号-1

上海秋旦网络科技中心：上海市奉贤区金大公路8218号1幢 联系电话：17898875485

上海秋旦网络科技中心：上海市奉贤区金大公路8218号1幢联系电话：17898875485