scikit-learn交流与支持指南

本页面提供scikit-learn社区交流和获取支持的指南,包括邮件列表、Stack Overflow、GitHub Discussions、问题报告等。

scikit-learn 1.4版本发布亮点

本文介绍了scikit-learn 1.4版本的新特性、改进和bug修复。

密度不同的聚类分析

本文通过生成不同密度的数据集,使用OPTICS算法的Xi聚类检测方法和设置特定的可达性阈值来模拟DBSCAN算法,展示了不同阈值下DBSCAN算法的聚类效果。

高斯过程模型

本页面介绍高斯过程模型,包括分类器、回归器以及多种核函数。

图形Lasso算法介绍

本文介绍了图形Lasso算法,这是一种用于估计稀疏协方差矩阵的L1惩罚估计器。

文本数据加载与处理

本文介绍了如何加载和处理文本数据,以便用于分类或聚类算法。

集成学习在鸢尾花数据集上的应用

本文介绍了如何使用集成学习中的投票分类器对鸢尾花数据集进行分类,并展示了不同分类器预测结果的对比。

聚类算法性能比较

本网页旨在比较MiniBatchKMeans和BIRCH两种聚类算法在合成数据集上的性能。

聚类标签的同质性度量

本文介绍了如何使用同质性度量来评估聚类标签的质量,确保聚类结果中的数据点仅属于单一类别。

线性回归模型分析

本网页旨在通过线性回归模型分析,比较不同特征对目标变量的影响,并展示模型的可视化效果。

分类得分的置换测试

本网页通过置换测试评估分类得分的重要性,使用iris数据集进行演示。

决策阈值调整与模型评估

本文介绍了如何使用TunedThresholdClassifierCV调整分类模型的决策阈值,并使用糖尿病数据集进行示例演示。

聚类相似度评估指标

本文介绍了一种用于衡量两个聚类结果相似度的指标,即Rand指数。通过比较真实类别标签与预测聚类标签之间的一致性来计算相似度得分。

生成Friedman #2回归问题数据集

本页面介绍了如何使用Python的sklearn库生成Friedman #2回归问题的数据集,包括数据的生成方法和参数说明。

机器学习与因果效应推断的局限性

本文探讨了机器学习模型在统计关联和因果效应推断中的局限性,并通过模拟数据集来说明遗漏变量偏差对因果效应估计的影响。

神经网络学习行为分析

本文通过分析神经网络的权重,探讨学习行为,使用MNIST数据集训练MLP分类器,并通过可视化权重矩阵来理解学习过程。

层次聚类方法比较

本网页通过生成的2D数据集,比较了不同的层次聚类方法在处理噪声和非球形数据集时的表现。

机器学习在Iris数据集上的应用

本文通过Iris数据集演示了标签传播、自我训练和支持向量机(SVM)在决策边界生成上的应用。

人脸特征的在线学习

本网页展示了如何使用scikit-learn的在线API来通过分块处理大型数据集,以学习一组构成人脸的图像块。

决策树规则报告生成器

本网页提供了一个工具,用于生成决策树的规则文本报告。用户可以通过输入决策树模型和特征名称,生成易于阅读的决策树规则文本。

偏最小二乘法及其在回归分析中的应用

本文介绍了偏最小二乘法(PLS)的基本原理、算法实现及其在回归分析中的应用。PLS是一种有效的数据降维技术,特别适用于变量数量多于观测值的情况。

最短路径算法示例

本页面提供了一个最短路径算法的示例,展示了如何使用Python和sklearn库来计算从单一源点到所有可达节点的最短路径长度。

支持向量机(SVM)核函数练习

本教程旨在通过使用不同的SVM核函数来分类鸢尾花数据集,提供了详细的代码实现和结果展示。

增量计算均值和方差

本页面介绍了如何在CSR或CSC矩阵上沿指定轴增量计算均值和方差。

非负矩阵分解(NMF)技术介绍

本文介绍了非负矩阵分解(NMF)技术,这是一种用于数据降维、源分离或主题提取的数学方法。

皮尔逊相关系数计算

本文介绍了如何使用皮尔逊相关系数来评估特征与目标变量之间的线性关系,并提供了相应的Python代码示例。

多标签文本分类问题模拟

本文介绍了如何使用PCA和CCA进行多标签文本分类问题的模拟和可视化。

决策树回归分析

本文介绍了如何使用决策树进行回归分析,并通过调整树的最大深度来控制模型的复杂度,避免过拟合。

多输出决策树回归示例

本文介绍了如何使用决策树进行多输出回归,并通过调整树的最大深度来控制模型的复杂度。

新闻组数据集文本分类

本网页介绍了使用不同机器学习模型对新闻组数据集进行文本分类的实验结果。

沪ICP备2024098111号-1
上海秋旦网络科技中心:上海市奉贤区金大公路8218号1幢 联系电话:15216758379