特征选择与聚合的比较

本文比较了两种降维策略:单变量特征选择与方差分析和特征聚合与Ward层次聚类。这两种方法在回归问题中使用贝叶斯岭作为监督估计器进行比较。

K均值与二分K均值聚类算法比较

本网页介绍了K均值算法和二分K均值算法的区别,并提供了Python代码示例,用于生成样本数据并比较两种算法的聚类效果。

中位数绝对误差回归损失计算

本页面介绍了中位数绝对误差回归损失的计算方法,包括参数定义、计算公式和示例代码。

多项式特征与线性回归拟合非线性函数

本文介绍了如何使用带有多项式特征的线性回归来近似非线性函数,并通过交叉验证来评估模型的过拟合或欠拟合。

梯度提升中的早停技术

本文介绍了梯度提升中的早停技术,通过加州房价数据集的案例,展示了如何使用早停技术来优化模型性能和提高训练效率。

数据集去噪与特征选择

本文介绍了如何在包含噪声的数据集上提高分类模型的精度,通过添加非信息性特征到鸢尾花数据集,并使用支持向量机(SVM)进行分类,对比了单变量特征选择前后模型的精度和权重变化。

流形学习技术比较

本文探讨了t-SNE和LLE两种流形学习技术在Swiss Roll数据集上的表现,并分析了它们在数据中添加空洞时的处理方式。

调整兰德指数(ARI)在聚类评估中的应用

本文介绍了调整兰德指数(Adjusted Rand Index, ARI)的概念、计算方法和在聚类评估中的应用。

支持向量机(SVM)中的正则化参数C

本文介绍了支持向量机(SVM)中正则化参数C的作用,并通过代码示例展示了不同C值对模型的影响。

数据类型识别

本页面解释了如何根据目标数据识别数据类型,包括连续型、二进制、多类、多输出和多标签等类型。

构建标签关系矩阵

本文介绍了如何使用sklearn.metrics.cluster中的contingency_matrix函数来构建描述真实标签与预测标签之间关系的矩阵。

Scikit-learn 全局配置指南

本文介绍了如何设置scikit-learn库的全局配置,包括参数验证、内存使用、输出格式等,旨在提高机器学习任务的效率和性能。

层次聚类分析示例

本网页展示了层次聚类分析在不同距离度量下的效果,并通过代码示例说明了如何使用Python进行层次聚类分析。

降维技术:邻域成分分析

本文介绍了使用邻域成分分析(NCA)进行降维的方法,并与PCA和LDA进行了比较。

高斯过程分类器(GPC)在XOR数据集上的应用

本文介绍了高斯过程分类器(GPC)在XOR数据集上的应用,比较了RBF核和DotProduct核的性能,并提供了详细的代码实现。

流形学习方法比较

本网页介绍了流形学习方法在S曲线数据集上的应用,包括局部线性嵌入、等距映射、多维尺度分析等算法的比较。

文件下载与校验

本页面介绍了如何从网络下载文件,并进行SHA256校验以确保文件的完整性。

稀疏数据集加载指南

本文介绍了如何使用Python加载SVMLight/LibSVM格式的稀疏数据集,并提供了代码示例。

谱聚类算法在数据子集分析中的应用

本文介绍了谱聚类算法在数据分析中的应用,特别是如何通过同时考虑数据矩阵的行和列来识别数据中的局部结构。

投票分类器决策边界可视化

本文介绍了如何使用Python的scikit-learn库来可视化投票分类器的决策边界,并展示了如何计算并绘制Iris数据集中两个特征的决策边界。

等值回归算法演示

本页面展示了等值回归算法和线性回归算法在处理具有均匀同质噪声的数据时的效果对比。

协方差估计与正则化

本网页介绍了在统计学中如何使用最大似然估计来计算协方差,并通过正则化来减少其方差,同时介绍了几种不同的正则化参数设置方法。

计算加法卡方核

本文介绍了加法卡方核的计算方法,这是一种在机器学习中用于特征数组比较的核方法。

特征重要性评估:排列重要性方法

本文介绍了如何使用排列重要性方法来评估机器学习模型中各个特征的重要性。

Calinski-Harabasz 分数计算方法

本文介绍了Calinski-Harabasz分数的定义、参数、返回值以及如何使用Python中的sklearn库进行计算。

非负矩阵分解(NMF)技术介绍

本文介绍了非负矩阵分解(NMF)技术,这是一种用于数据降维、源分离或主题提取的数学方法。

线性回归与决策树模型的比较

本文比较了线性回归模型和决策树模型在有无数据离散化情况下的表现,并提供了相应的Python代码实现。

弹性网络回归模型

本页面介绍了弹性网络回归模型的计算方法和参数配置,包括单输出和多输出任务的优化函数,以及如何使用坐标下降法来计算模型。

偏最小二乘回归分析

本网页介绍了偏最小二乘回归分析的基本概念,包括PLS1和PLS2的区别,以及如何使用Python进行CCA分析。

多类分类策略比较

本文探讨了在目标变量包含多于两个类别时的分类问题,即多类分类问题,并比较了不同的多类分类策略。

沪ICP备2024098111号-1
上海秋旦网络科技中心:上海市奉贤区金大公路8218号1幢 联系电话:15216758379