梯度提升树的OOB估计

本文介绍了梯度提升树中OOB估计的概念、计算方法以及如何使用OOB估计来确定模型的最佳迭代次数。

加权样本的决策函数图

本文介绍了如何使用Python的scikit-learn库来绘制加权样本的决策函数图。通过调整样本权重,观察模型决策边界的变化。

线性回归与多项式特征:拟合不足与过拟合

本文介绍了线性回归模型在拟合非线性函数时可能遇到的拟合不足和过拟合问题,并通过多项式特征来展示如何近似非线性函数。

岭回归系数分析

本页面介绍了岭回归中系数的变化情况,并展示了如何通过调整正则化参数来平衡模型的偏差和方差。

逻辑回归正则化路径分析

本文介绍了使用Iris数据集进行二分类问题的逻辑回归正则化路径分析,包括数据加载、模型训练、正则化路径的计算和可视化。

自定义评估器和模型拟合状态检查

本文介绍了如何使用scikit-learn框架来创建自定义评估器,并检查模型是否已经拟合。

多项式核近似与线性分类器训练

本文介绍了如何使用PolynomialCountSketch高效生成多项式核特征空间近似,以训练近似核化分类器的线性分类器,并在Covtype数据集上进行实验。

独立成分分析与主成分分析对比

本文对比了独立成分分析(ICA)与主成分分析(PCA)两种不同的特征空间分析技术,并通过模拟数据展示了它们在提取信号时的不同表现。

谱聚类共簇算法演示

本页面展示了如何使用谱聚类共簇算法生成数据集并进行双聚类分析。

单类SVM与随机梯度下降单类SVM的比较

本网页展示了如何在RBF核的情况下,使用随机梯度下降版本的单类SVM来近似sklearn.svm.OneClassSVM的解决方案。

文本数据加载与处理

本文介绍了如何加载和处理文本数据,以便用于分类或聚类算法。

层次聚类方法的比较

本网页介绍了不同层次聚类方法在二维数据集上的表现,包括单链接、平均链接、完全链接和Ward方法,并提供了相应的Python代码实现。

线性回归与岭回归方差比较

本文探讨了在数据点较少时,线性回归和岭回归在预测方差上的差异,并提供了相应的Python代码示例。

加州房屋数据集分析

本文介绍了加州房屋数据集的基本信息,包括数据维度、特征描述以及如何使用scikit-learn库加载和操作该数据集。

使用scikit-learn的set_output方法

本文介绍了如何在scikit-learn库中使用set_output方法来配置模型输出为pandas DataFrame格式,并提供了详细的代码示例。

线性回归模型分析

本网页旨在通过线性回归模型分析,比较不同特征对目标变量的影响,并展示模型的可视化效果。

稀疏不相关设计回归问题生成

本页面介绍了如何使用sklearn库生成一个具有稀疏不相关设计和少量信息特征的回归问题数据集。

随机投影降维技术

本文介绍了随机投影降维技术,包括其理论基础Johnson-Lindenstrauss引理,以及如何通过高斯随机投影和稀疏随机投影来减少数据维度,同时保持数据间距离的近似不变。

数组对称性检查工具

本工具用于检查和转换数组的对称性,确保输入的矩阵是二维、方阵且对称。

BIRCH与MiniBatchKMeans算法比较

本网页旨在比较BIRCH和MiniBatchKMeans两种聚类算法在处理大规模数据集时的性能差异。

手写数字识别数据集使用指南

本文介绍了如何使用scikit-learn库中的手写数字数据集进行机器学习任务,包括数据加载、图像展示以及相关参数说明。

局部线性嵌入分析

局部线性嵌入(Locally Linear Embedding, LLE)是一种非线性降维技术,用于数据的可视化和分析。本文介绍了LLE的基本概念、参数设置以及如何在Python中使用。

交叉验证生成器工具

本页面介绍了一个用于构建交叉验证生成器的工具,包括参数说明、使用方法以及示例代码。

交叉验证预测误差可视化

本网页展示了如何使用scikit-learn库中的cross_val_predict函数与PredictionErrorDisplay工具来可视化预测误差。

图像分割的谱聚类技术

本文介绍了如何使用谱聚类技术对图像进行分割,包括kmeans、离散化和QR分解等方法。

岭回归系数与L2正则化的关系

本文介绍了岭回归中L2正则化如何影响模型系数,并展示了不同正则化强度下系数的变化。

逻辑回归决策边界可视化

本页面展示了如何使用Python的scikit-learn库来绘制多类别逻辑回归和One-vs-Rest逻辑回归的决策边界。

使用类似NumPy的API进行数组操作库

本网页介绍了如何使用类似NumPy的API进行数组操作,并展示了如何在scikit-learn中使用CuPy和PyTorch等库进行数据操作。

随机森林与直方图梯度提升模型比较

本文比较了随机森林(RF)和直方图梯度提升(HGBT)模型在回归数据集上的得分和计算时间。

高斯过程分类器示例

本页面展示了如何使用高斯过程分类器对数据进行分类,并预测分类的概率。

沪ICP备2024098111号-1
上海秋旦网络科技中心:上海市奉贤区金大公路8218号1幢 联系电话:17898875485