迭代插补方法比较

本网页介绍了使用IterativeImputer类进行缺失值插补的几种不同估计器的比较。

高斯过程分类的概率预测

本文介绍了高斯过程分类(GPC)的概率预测,通过RBF核函数的不同超参数选择,展示了优化对数边际似然(LML)对模型性能的影响。

交叉验证与排列测试

本文介绍了如何使用排列测试来评估交叉验证分数的统计显著性,以及如何解释得到的p值。

SVMlight文件格式导出工具

本页面介绍如何使用SVMlight文件格式导出工具,将数据集导出为SVMlight或libsvm格式,适用于稀疏数据集。

Lasso回归路径计算

本文介绍了使用坐标下降法计算Lasso回归路径的过程,包括参数设置、优化函数、以及如何使用Python实现。

谱聚类算法在文档双聚类中的应用

本文介绍了如何使用谱聚类算法对文档进行双聚类处理,并比较了该方法与传统的MiniBatchKMeans聚类算法的效果。

岭回归系数与正则化参数的关系

本网页展示了岭回归系数如何随着正则化参数的变化而变化,以及在处理高度病态矩阵时岭回归的实用性。

核岭回归与支持向量回归比较

本文比较了核岭回归(Kernel Ridge Regression, KRR)和支持向量回归(Support Vector Regression, SVR)两种方法,它们都利用核技巧学习非线性函数。这两种方法在损失函数上有差异,KRR通常在中等规模数据集上训练速度更快,但预测时速度较慢。

Python 切片生成器

本文介绍了如何使用Python的sklearn库中的gen_even_slices函数来生成等间隔的切片。

数据预处理:列选择器的使用

本文介绍了如何使用sklearn库中的ColumnTransformer和make_column_selector函数来选择数据集中的特定列进行预处理。

梯度提升回归模型的应用实例

本文介绍了如何使用梯度提升回归模型来处理糖尿病数据集的回归问题,并展示了模型的训练过程、误差计算以及特征重要性的可视化。

归一化折扣累积增益(NDCG)计算方法

本文介绍了归一化折扣累积增益(NDCG)的概念、计算方法以及在机器学习中的应用。

数据可视化示例

本页面展示了使用matplotlib和sklearn库生成的多种数据可视化图表,包括不同特征数量和类别的数据点分布图。

Lasso模型选择:AIC与BIC标准

本网页介绍了如何使用AIC和BIC标准来选择最佳的Lasso回归模型,并提供了相应的Python代码示例。

贝叶斯高斯混合模型分析

本网页介绍了如何使用贝叶斯高斯混合模型对玩具数据集进行拟合,并分析了不同权重浓度先验对模型的影响。

精确度-召回率曲线计算

本文介绍了如何计算精确度和召回率,以及如何为二分类任务绘制精确度-召回率曲线。

数据变换与正态分布映射

本文介绍了如何使用PowerTransformer和QuantileTransformer将不同分布的数据映射到正态分布,并分析了变换前后的数据可视化效果。

模型验证与参数调优指南

本网页介绍了模型验证和参数调优的基本概念、方法以及相关工具的使用,旨在帮助用户更好地评估和优化机器学习模型。

Scikit-learn 数据目录设置

本文介绍了如何设置和使用Scikit-learn的数据目录,包括默认路径、环境变量设置、程序设置以及示例代码。

混淆矩阵在分类器评估中的应用

本文介绍了混淆矩阵在评估分类器性能中的应用,特别是在iris数据集上。混淆矩阵的对角线元素表示预测标签与真实标签相等的点数,而非对角线元素表示分类器错误标记的点数。

核岭回归与支持向量回归的比较

本文比较了核岭回归(Kernel Ridge Regression)和支持向量回归(Support Vector Regression)在不同数据集上的表现,包括它们的模型形式、损失函数、训练和预测时间。

高斯过程分类的超参数优化分析

本文探讨了高斯过程分类(GPC)在不同超参数选择下的预测概率,以及优化对数边缘似然(LML)对模型性能的影响。

数据局部结构的图连接性分析

本文探讨了在数据聚类中使用图连接性来捕捉数据的局部结构,并分析了稀疏连接矩阵的优势和不同链接方法的稳定性。

交叉验证评分方法

本页面介绍了如何使用交叉验证方法来评估机器学习模型的性能。

KBinsDiscretizer策略演示

本页面展示了KBinsDiscretizer中实现的不同离散化策略,包括均匀离散化、分位数离散化和K均值离散化,并提供了相应的Python代码示例。

随机森林与直方图梯度提升模型比较

本文比较了随机森林(RF)和直方图梯度提升(HGBT)模型在回归数据集上的得分和计算时间。

Matthews相关系数计算

本文介绍了Matthews相关系数(MCC),这是一种在机器学习中用于衡量二元和多类分类质量的指标。它考虑了真正例、假正例、真负例和假负例,并且被认为是一种平衡的度量,即使在类别大小差异很大的情况下也可以使用。

嵌套与非嵌套交叉验证比较

本文比较了在鸢尾花数据集上的分类器上嵌套与非嵌套交叉验证策略。嵌套交叉验证通常用于训练需要优化超参数的模型。

弹性网络回归模型

本页面介绍了弹性网络回归模型的计算方法和参数配置,包括单输出和多输出任务的优化函数,以及如何使用坐标下降法来计算模型。

随机化SVD算法介绍

本页面介绍了随机化SVD算法的原理、参数和应用示例。

沪ICP备2024098111号-1
上海秋旦网络科技中心:上海市奉贤区金大公路8218号1幢 联系电话:15216758379