目标编码器与交叉拟合

本文介绍了目标编码器的内部交叉拟合机制,以及它如何帮助防止机器学习模型过拟合。通过构建合成数据集,展示了目标编码器在有无交叉拟合时对模型性能的影响。

生成棋盘状数组以进行双聚类分析

本页面提供了一个用于生成棋盘状结构数组的函数,该数组可用于双聚类分析。

岭回归系数分析

本页面介绍了岭回归中系数的变化情况,并展示了如何通过调整正则化参数来平衡模型的偏差和方差。

Tweedie回归评分函数

本文介绍了Tweedie回归评分函数的计算方法和应用示例,包括参数说明和代码实现。

数据科学中的无监督学习技术

本文介绍了数据科学中无监督学习的各种技术,包括降维、聚类、双聚类、信号分解、协方差估计、异常检测和密度估计等。

半监督分类器与SVM在Iris数据集上的决策边界比较

本文比较了在Iris数据集上使用半监督分类器Label Spreading、Self-training和SVM生成的决策边界。

鸢尾花数据集的因子分析

本文介绍了如何使用因子分析和主成分分析(PCA)来探索鸢尾花数据集中的潜在模式,并展示了如何通过旋转来优化数据的可视化效果。

多类别稀疏逻辑回归在20newsgroups数据集上的比较

本文比较了在20newsgroups数据集上,使用L1正则化的多类别逻辑回归与一对一逻辑回归的性能。

多类别分类器的使用指南

本文介绍了如何在scikit-learn中使用多类别分类器,包括元估计器的概念、预测概率的计算以及多类策略的实现。

构建标签关系矩阵

本文介绍了如何使用sklearn.metrics.cluster中的contingency_matrix函数来构建描述真实标签与预测标签之间关系的矩阵。

层次聚类分析:结构化与非结构化

本网页介绍了层次聚类分析中结构化与非结构化的区别,并通过瑞士卷数据集的实例演示了两种方法的应用。

非负最小二乘法与普通最小二乘法比较

本文介绍了非负最小二乘法与普通最小二乘法在回归系数估计上的比较,并提供了相应的Python代码示例。

递归特征消除(RFE)在手写数字识别中的应用

本页面介绍了如何使用递归特征消除(RFE)技术来评估手写数字识别中各个像素的重要性,并展示了如何通过颜色和注释清晰地可视化特征的重要性排名。

单调约束对梯度提升估计器的影响

本网页通过构建人工数据集,展示了单调约束在梯度提升估计器中的应用及其对模型预测的影响。

多项式与样条插值示例

本网页展示了如何使用岭回归来近似一个函数,通过多项式和样条插值方法。

构建机器学习流水线

本文介绍了如何使用scikit-learn库中的make_pipeline函数来构建一个包含多个步骤的机器学习流水线。

人脸数据集加载与处理

本页面介绍了如何加载和处理Labeled Faces in the Wild (LFW)人脸数据集,包括数据集的参数设置、数据结构和使用示例。

稀疏编码方法比较

本网页通过SparseCoder估计器比较了不同的稀疏编码方法,并探讨了使用不同宽度原子的重要性以及学习字典以适应特定信号类型的必要性。

特征重要性评估

本文介绍了如何使用随机森林模型来评估特征在分类任务中的重要性,并比较了基于不纯度减少和排列重要性两种方法。

瑞士卷数据集生成器

本页面介绍了如何使用瑞士卷数据集生成器来创建三维数据点,并提供了代码示例和相关参考。

支持向量机中的正则化参数调整

本文探讨了在使用支持向量机进行分类时,如何根据样本数量调整正则化参数C,以达到最佳的分类效果。

数据降维与分类示例

本页面展示了如何使用随机森林和贝叶斯分类器在高维稀疏数据上进行降维和分类。

岭回归系数与L2正则化的关系

本文介绍了岭回归中L2正则化如何影响模型系数,并展示了不同正则化强度下系数的变化。

近邻分类与邻域成分分析比较

本文比较了使用和不使用邻域成分分析的最近邻分类方法,并展示了通过欧几里得距离在原始特征上以及在邻域成分分析学习到的变换后进行分类时的类决策边界。

支持向量机中的RBF核参数优化

本文探讨了支持向量机(SVM)中径向基函数(RBF)核的参数gamma和C对模型性能的影响,并提供了代码示例。

聚类完整性度量

聚类完整性度量是一种评估聚类结果的方法,用于判断同一类别的数据点是否被分配到同一个聚类中。

模型评估指标指南

本指南提供了模型评估中使用的各类指标的详细说明,包括分类、回归、聚类和双聚类评估指标。

图像量化处理示例

本网页展示了如何使用K-Means聚类算法对夏宫图像进行颜色量化处理,将颜色数量从96,615种减少到64种,同时保持图像的整体外观质量。

线性回归分析示例

本页面展示了如何使用线性回归模型对数据进行分析和预测,包括模型的构建、训练、预测以及评估过程。

多类分类策略比较

本文探讨了在目标变量包含多于两个类别时的分类问题,即多类分类问题,并比较了不同的多类分类策略。

沪ICP备2024098111号-1
上海秋旦网络科技中心:上海市奉贤区金大公路8218号1幢 联系电话:15216758379