稳健协方差估计与马氏距离的相关性

本文介绍了在高斯分布数据中使用稳健协方差估计和马氏距离来识别异常值和进行数据聚类。

稳健回归估计器:Theil-Sen与OLS和RANSAC的比较

本文比较了Theil-Sen估计器与OLS和RANSAC估计器在处理异常值时的性能,并提供了Python代码示例。

SVMlight文件格式导出工具

本页面介绍如何使用SVMlight文件格式导出工具,将数据集导出为SVMlight或libsvm格式,适用于稀疏数据集。

高斯混合模型(GMM)与信息论标准

本文介绍了如何使用信息论标准,如AIC和BIC,来选择高斯混合模型(GMM)的最佳参数,包括协方差类型和模型中的组分数量。

异常检测算法比较

本文比较了不同异常检测算法在2D数据集上的表现,包括OneClassSVM、SGDOneClassSVM、EllipticEnvelope、IsolationForest和LocalOutlierFactor等。

梯度提升中的早停技术

本文介绍了梯度提升中的早停技术,通过加州房价数据集的案例,展示了如何使用早停技术来优化模型性能和提高训练效率。

数字分类练习教程

本教程介绍了如何使用分类技术对数字数据集进行分类,包括KNN和逻辑回归方法的应用。

数据标准化变换示例

本页面展示了如何使用Box-Cox和Yeo-Johnson变换将不同分布的数据映射到正态分布,并通过QuantileTransformer进行比较。

Tweedie偏差回归损失计算

本文介绍了Tweedie偏差回归损失的计算方法,包括参数设置和不同分布类型下的计算公式。

scikit-learn新特性介绍

本文介绍了scikit-learn库的最新版本中引入的一些关键特性,包括对分类数据的支持、改进的内存和运行时间效率等。

数据随机打乱方法

本页面介绍了如何使用Python中的shuffle函数对数组或稀疏矩阵进行随机打乱,包括参数说明和示例代码。

Scikit-learn 混合类概览

本文介绍了Scikit-learn库中使用的各种混合类,包括分类器、回归器、聚类器等,并提供了如何克隆估计器和判断其类型的方法。

异常检测与数据结构理解

本文介绍了使用葡萄酒数据集进行异常检测和数据结构理解的分析方法,包括经验协方差估计、稳健协方差估计和单类支持向量机的应用。

集成树模型在鸢尾花数据集上的决策面

本文介绍了如何在鸢尾花数据集上使用集成树模型绘制决策面。

获取评分器名称

本文介绍了如何使用get_scorer_names函数来获取所有可用评分器的名称,并提供了详细的参数说明、返回值以及示例代码。

机器学习模型验证工具

本页面介绍了一个用于验证机器学习模型是否遵循scikit-learn框架约定的工具,包括API兼容性、输入验证和形状检查等。

L1正则化与稀疏性在MNIST数字分类中的应用

本文介绍了使用SAGA算法在MNIST数字分类任务中应用L1正则化,以达到模型的稀疏性,提高模型的可解释性。

稀疏编码方法比较

本网页通过SparseCoder估计器比较了不同的稀疏编码方法,并探讨了使用不同宽度原子的重要性以及学习字典以适应特定信号类型的必要性。

批量生成器示例

本页面提供了一个使用Python的sklearn库中的gen_batches函数来生成批量数据的示例。

贝叶斯岭回归分析

本文介绍了贝叶斯岭回归在多项式曲线拟合中的应用,探讨了正则化参数的初始值选择对模型拟合的影响,并展示了如何通过迭代过程确定最优参数。

机器学习中的决策边界可视化

本文介绍了如何使用Python和机器学习库sklearn来可视化决策边界,特别是针对Iris数据集的多类SGD分类器。

生成随机回归问题

本页面介绍了如何使用scikit-learn库生成随机回归问题,包括参数设置和示例代码。

梯度提升回归模型实例

本网页介绍了使用梯度提升方法构建回归预测模型的过程,包括数据加载、预处理、模型训练、结果评估和特征重要性分析。

鸢尾花数据集的PCA与LDA分析

本文介绍了如何使用PCA和LDA对鸢尾花数据集进行分析,包括数据的预处理、模型的建立和结果的可视化。

协方差估计与正则化

本网页介绍了在统计学中如何使用最大似然估计来计算协方差,并通过正则化来减少其方差,同时介绍了几种不同的正则化参数设置方法。

均方根对数误差回归损失计算

本文介绍了均方根对数误差回归损失的概念、计算方法以及在机器学习中的重要性。

计算加法卡方核

本文介绍了加法卡方核的计算方法,这是一种在机器学习中用于特征数组比较的核方法。

支持向量机异常检测

本网页介绍了使用支持向量机进行异常检测的方法,包括基于RBF核的OneClassSVM和基于随机梯度下降的SGDOneClassSVM。

准确率分类评分

本页面介绍了在多标签分类中计算准确率的方法,包括参数说明、返回值以及示例代码。

ColumnTransformer的使用和参数详解

本文详细介绍了ColumnTransformer的使用方法和参数配置,帮助理解如何在数据预处理中应用这一工具。

沪ICP备2024098111号-1
上海秋旦网络科技中心:上海市奉贤区金大公路8218号1幢 联系电话:15216758379