scikit-learn交流与支持指南

本页面提供scikit-learn社区交流和获取支持的指南,包括邮件列表、Stack Overflow、GitHub Discussions、问题报告等。

计算折扣累积增益(Discounted Cumulative Gain)

本文介绍了如何使用折扣累积增益(Discounted Cumulative Gain, DCG)来评估多标签分类或实体排序任务的性能。

Top-k 准确率评分

本页面介绍了Top-k准确率评分的概念、参数、返回值以及示例代码。

稳健回归估计器:Theil-Sen与OLS和RANSAC的比较

本文比较了Theil-Sen估计器与OLS和RANSAC估计器在处理异常值时的性能,并提供了Python代码示例。

模型复杂度与交叉验证得分的平衡

本网页探讨了如何在模型复杂度和交叉验证得分之间找到平衡,通过调整PCA组件的数量来实现。

缺失值处理技术

本文探讨了在构建估计器前如何处理缺失值,包括使用常数、均值、中位数或众数等方法。

RBF核函数与SVM分类器的近似特征映射

本网页介绍了如何使用RBFSampler和Nystroem近似RBF核函数的特征映射,并在手写数字数据集上使用SVM进行分类。比较了在原始空间中使用线性SVM、使用近似映射的线性SVM以及核化SVM的结果。

V-Measure聚类评估指标

V-Measure是一种用于评估聚类效果的外部指标,它综合了同质性和完备性两个维度,提供了一个介于0到1之间的评分,以衡量聚类的质量。

模型特征重要性分析

本文介绍了如何通过随机排列特征值的方法来评估模型中各个特征的重要性,并探讨了该方法的优势和局限性。

Python 切片生成器

本文介绍了如何使用Python的sklearn库中的gen_even_slices函数来生成等间隔的切片。

逻辑回归中的L1惩罚与稀疏性

本文比较了在不同C值下,使用L1、L2和Elastic-Net惩罚的逻辑回归模型的稀疏性。

多任务Lasso回归分析

本文介绍了多任务Lasso回归在特征选择中的应用,通过模拟数据生成和模型拟合,展示了Lasso回归在不同时间点上对特征选择的稳定性。

目标变换在回归分析中的应用

本文通过合成数据和艾姆斯房价数据集,探讨了在回归分析中对目标变量进行变换以提高模型预测精度的方法。

图像去噪与字典学习

本网页介绍了使用在线字典学习和不同的变换方法对浣熊脸部图像碎片进行去噪的过程。

线性与二次判别分析比较

本文介绍了线性判别分析(LDA)和二次判别分析(QDA)在不同数据集上的表现比较,并通过数据可视化展示了两种算法的决策边界和分类效果。

互信息估计方法

本页面介绍了互信息的概念、计算方法以及在特征选择中的应用。

人脸数据集加载与处理

本页面介绍了如何加载和处理Labeled Faces in the Wild (LFW)人脸数据集,包括数据集的参数设置、数据结构和使用示例。

数组对称性检查工具

本工具用于检查和转换数组的对称性,确保输入的矩阵是二维、方阵且对称。

基于局部异常因子的异常检测

本文介绍了一种基于局部异常因子(LOF)的无监督异常检测方法,该方法通过计算给定数据点与其邻居的局部密度偏差来识别异常值。

数据子集选择工具

本页面介绍了一个用于选择数据子集的工具,它支持多种数据类型和索引方式,适用于数据分析和处理。

支持向量机(SVM)在鸢尾花数据集上的应用

本文介绍了如何使用支持向量机(SVM)在鸢尾花数据集上进行分类,并展示了不同核函数下的决策边界。

在线字典学习矩阵分解问题求解

本页面介绍了在线字典学习矩阵分解问题的求解方法,包括算法参数详解和示例代码。

轮廓系数计算方法

本文介绍了轮廓系数的计算方法,这是一种衡量样本聚类质量的指标,包括其定义、计算公式和应用实例。

数据集生成:圆形数据集

本页面介绍了如何生成一个包含内圈和外圈的圆形数据集,用于可视化聚类和分类算法的效果。

加载SVMlight格式数据集

本页面介绍了如何使用Python函数加载SVMlight格式的数据集,并提供了详细的参数说明和使用示例。

生成随机回归问题

本页面介绍了如何使用scikit-learn库生成随机回归问题,包括参数设置和示例代码。

线性与二次判别分析比较

本文介绍了线性判别分析(LDA)和二次判别分析(QDA)在不同数据集上的表现,并通过可视化展示了两种方法的决策边界和协方差椭球。

图像分类中像素重要性评估

本文介绍了如何使用随机森林算法在人脸数据集中评估像素的重要性,并展示了如何进行并行计算以提高效率。

多标签数据集可视化

本页面展示了如何使用Python和matplotlib库来生成并可视化一个随机的多标签数据集。

Scikit-learn 全局配置管理器

本文介绍了如何使用Scikit-learn的全局配置管理器来优化机器学习模型的性能和内存使用。

沪ICP备2024098111号-1
上海秋旦网络科技中心:上海市奉贤区金大公路8218号1幢 联系电话:17898875485