K均值聚类与轮廓分析

本网页通过轮廓分析方法来评估K均值聚类算法中不同聚类数量的优劣。

数据科学中的无监督学习技术

本文介绍了数据科学中无监督学习的各种技术,包括降维、聚类、双聚类、信号分解、协方差估计、异常检测和密度估计等。

多类别稀疏逻辑回归在20newsgroups数据集上的比较

本文比较了在20newsgroups数据集上,使用L1正则化的多类别逻辑回归与一对一逻辑回归的性能。

k-最近邻回归模型演示

本文通过k-最近邻回归模型演示了如何使用barycenter和常数权重对目标进行插值。

数据类型识别

本页面解释了如何根据目标数据识别数据类型,包括连续型、二进制、多类、多输出和多标签等类型。

逻辑回归中的L1惩罚与稀疏性

本文比较了在不同C值下,使用L1、L2和Elastic-Net惩罚的逻辑回归模型的稀疏性。

决策阈值调整与模型评估

本文介绍了如何使用TunedThresholdClassifierCV调整分类模型的决策阈值,并使用糖尿病数据集进行示例演示。

稀疏不相关设计回归问题生成

本页面介绍了如何使用sklearn库生成一个具有稀疏不相关设计和少量信息特征的回归问题数据集。

集成学习算法概览

本文介绍了多种集成学习算法,包括AdaBoost、Bagging、ExtraTrees、Gradient Boosting、Isolation Forest、Random Forest、Stacking和Voting等。

梯度提升回归模型的应用实例

本文介绍了如何使用梯度提升回归模型来处理糖尿病数据集的回归问题,并展示了模型的训练过程、误差计算以及特征重要性的可视化。

模型选择与交叉验证策略

本文讨论了在模型选择过程中使用嵌套交叉验证和非嵌套交叉验证的策略,以及它们在优化模型参数时的差异。

归一化折扣累积增益(NDCG)计算方法

本文介绍了归一化折扣累积增益(NDCG)的概念、计算方法以及在机器学习中的应用。

机器学习模型验证工具

本页面介绍了一个用于验证机器学习模型是否遵循scikit-learn框架约定的工具,包括API兼容性、输入验证和形状检查等。

参数优化比较:HalvingGridSearchCV vs GridSearchCV

本文介绍了如何使用HalvingGridSearchCV和GridSearchCV进行参数优化,并比较了两者的性能。

支持向量机在不平衡数据集上的应用

本网页介绍了如何在不平衡数据集上使用支持向量机(SVM)进行分类,并展示了如何绘制决策边界。

特征选择与F统计量计算

本页面介绍了特征选择的概念,F统计量的计算方法,以及如何在Python中使用sklearn库进行特征选择和F统计量的计算。

支持向量机:处理不平衡类别的超平面

本页面介绍了如何使用支持向量机(SVM)来处理不平衡数据集中的分类问题,并展示了如何找到最优的分离超平面。

基于局部异常因子的异常检测

本文介绍了一种基于局部异常因子(LOF)的无监督异常检测方法,该方法通过计算给定数据点与其邻居的局部密度偏差来识别异常值。

学习曲线与模型可扩展性分析

本文通过学习曲线分析了朴素贝叶斯和SVM分类器的模型性能,并探讨了它们的计算成本和统计准确性。

高斯过程回归中的噪声水平估计

本文介绍了如何使用高斯过程回归(GPR)来估计数据中的噪声水平,并强调了核函数超参数初始化的重要性。

L1距离计算示例

本页面介绍了如何使用sklearn库中的函数计算两个样本集之间的L1距离,即曼哈顿距离,并提供了代码示例。

加载SVMlight格式数据集

本页面介绍了如何使用Python函数加载SVMlight格式的数据集,并提供了详细的参数说明和使用示例。

稀疏矩阵的行缩放操作

本文介绍了如何在Python中使用CSR或CSC格式的稀疏矩阵进行行缩放操作。

距离矩阵计算方法

本页面介绍了如何计算距离矩阵,包括输入参数、计算方法以及多线程计算的应用。

解释方差回归评分函数

本文介绍了解释方差回归评分函数,这是一种用于评估预测模型性能的指标。

双聚类相似度计算

本文介绍了如何计算两组双聚类之间的相似度,并使用修改后的Jonker-Volgenant算法找到最佳匹配,最终得分是相似度之和除以较大集合的大小。

非负矩阵分解(NMF)技术介绍

本文介绍了非负矩阵分解(NMF)技术,这是一种用于数据降维、源分离或主题提取的数学方法。

单类SVM异常检测示例

本页面展示了如何使用单类SVM进行异常检测,包括数据生成、模型训练、预测及结果可视化。

梯度提升技术与集成学习模型比较

本网页探讨了梯度提升技术在不同集成学习模型中的应用,包括随机森林、直方图梯度提升树和AdaBoost等,以及它们在特征重要性、模型比较、早期停止等方面的应用。

随机抽样算法详解

本文详细介绍了随机抽样算法的实现方式,包括无替换抽样的概念、参数设置、不同抽样方法的适用场景以及代码示例。

沪ICP备2024098111号-1
上海秋旦网络科技中心:上海市奉贤区金大公路8218号1幢 联系电话:15216758379