scikit-learn交流与支持指南

本页面提供scikit-learn社区交流和获取支持的指南,包括邮件列表、Stack Overflow、GitHub Discussions、问题报告等。

OPTICS聚类算法详解

本文详细介绍了OPTICS聚类算法的工作原理和参数设置,包括算法的输入参数、核心概念以及如何使用Python进行实现。

梯度提升树的OOB估计

本文介绍了梯度提升树中OOB估计的概念、计算方法以及如何使用OOB估计来确定模型的最佳迭代次数。

鲁棒协方差估计与异常检测

本文通过葡萄酒数据集的实例,探讨了在实际数据集中进行鲁棒协方差估计的必要性,以及如何使用不同的异常检测工具来理解数据结构。

随机状态对象的使用

本文介绍了如何使用numpy中的RandomState对象来控制随机数生成,以及其在机器学习中的应用示例。

机器学习中的预测与决策问题

本文探讨了机器学习中的两个基本问题:预测模型的建立和基于概率预测的决策制定。

计算点与点集之间的最小距离

本文介绍了如何使用一个函数来计算一个点与一组点之间的最小距离,包括参数设置和代码示例。

支持向量机(SVM)分类器决策边界可视化

本页面展示了如何使用Python和matplotlib库来可视化支持向量机(SVM)分类器在鸢尾花数据集上的决策边界。

高斯混合模型(GMM)在鸢尾花数据集上的应用

本文介绍了高斯混合模型(GMM)在鸢尾花数据集上的应用,包括不同协方差类型的表现比较和代码实现。

决策阈值调整与模型评估

本文介绍了如何使用TunedThresholdClassifierCV调整分类模型的决策阈值,并使用糖尿病数据集进行示例演示。

目标变换在回归分析中的应用

本文通过合成数据和艾姆斯房价数据集,探讨了在回归分析中对目标变量进行变换以提高模型预测精度的方法。

递归特征消除(RFE)在手写数字识别中的应用

本页面介绍了如何使用递归特征消除(RFE)技术来评估手写数字识别中各个像素的重要性,并展示了如何通过颜色和注释清晰地可视化特征的重要性排名。

Scikit-learn 估计器概览

本文介绍了如何使用Scikit-learn库中的函数来检索所有继承自BaseEstimator的估计器类。

聚类相似度评估指标

本文介绍了一种用于衡量两个聚类结果相似度的指标,即Rand指数。通过比较真实类别标签与预测聚类标签之间的一致性来计算相似度得分。

加法卡方核函数介绍

本页面介绍了加法卡方核函数的计算方法,应用场景,以及如何在Python中使用sklearn库进行计算。

参数优化比较:HalvingGridSearchCV vs GridSearchCV

本文介绍了如何使用HalvingGridSearchCV和GridSearchCV进行参数优化,并比较了两者的性能。

互信息估计方法

本页面介绍了互信息的概念、计算方法以及在特征选择中的应用。

数据投影:PCA与KernelPCA的比较

本文比较了PCA和KernelPCA在数据投影上的差异,展示了KernelPCA在非线性数据分离上的优势。

构建机器学习流水线

本文介绍了如何使用scikit-learn库中的make_pipeline函数来构建一个包含多个步骤的机器学习流水线。

平均精度(AP)计算方法

本页面介绍了如何计算平均精度(AP),包括其公式、参数和在机器学习中的应用示例。

均值漂移聚类算法演示

本页面介绍了均值漂移算法的基本概念和实现,包括算法的数学原理、Python代码示例和可视化结果。

数据降维与分类示例

本页面展示了如何使用随机森林和贝叶斯分类器在高维稀疏数据上进行降维和分类。

多类别分类的标签二值化

本文介绍了如何使用scikit-learn库中的函数将多类别标签转换为二值化形式,以便用于机器学习算法中。

主题提取技术:NMF与LDA

本网页介绍了如何使用非负矩阵分解(NMF)和潜在狄利克雷分配(LDA)对文档集合进行主题提取,并展示了使用Python和scikit-learn库实现的代码示例。

支持向量机中的样本权重调整

本文探讨了在支持向量机中如何通过调整样本权重来影响决策边界的形状,特别是对异常值的影响。

梯度提升回归模型实例

本网页介绍了使用梯度提升方法构建回归预测模型的过程,包括数据加载、预处理、模型训练、结果评估和特征重要性分析。

图像去噪:使用核主成分分析

本文介绍了如何使用核主成分分析(KernelPCA)对图像进行去噪处理,并通过比较精确重建和核PCA重建的结果,展示了去噪效果。

高斯过程回归:基础入门示例

本文介绍了高斯过程回归(Gaussian Process Regression)的基本概念,包括无噪声和有噪声情况下的模型拟合和预测。

梯度提升技术与集成学习模型比较

本网页探讨了梯度提升技术在不同集成学习模型中的应用,包括随机森林、直方图梯度提升树和AdaBoost等,以及它们在特征重要性、模型比较、早期停止等方面的应用。

K-Means与MiniBatchKMeans聚类算法性能比较

本文对比了K-Means和MiniBatchKMeans两种聚类算法的性能,并展示了如何生成数据集、执行聚类以及结果的可视化。

沪ICP备2024098111号-1
上海秋旦网络科技中心:上海市奉贤区金大公路8218号1幢 联系电话:15216758379