本页面提供scikit-learn社区交流和获取支持的指南,包括邮件列表、Stack Overflow、GitHub Discussions、问题报告等。
本指南详细介绍了如何使用雅卡尔相似系数来评估分类模型的性能,包括参数设置、代码示例和不同情况下的计算方法。
本文介绍了约翰逊-林登斯特劳斯引理在随机投影中的应用,解释了如何通过随机投影来降低数据维度,同时保持数据点间距离的相对不变性。
本文介绍了如何加载和使用Linnerud数据集,适用于多输出回归任务,提供了详细的参数说明和使用示例。
本文通过模拟数据来探讨教育经济学中的一个重要问题:大学学位对小时工资的因果效应。
本文介绍了多种机器学习中的分类器和回归器,包括线性分类器、回归器、变量选择模型、鲁棒回归器以及广义线性模型等。
本页面展示了如何在使用线性支持向量机(LinearSVC)时获取支持向量。通过matplotlib和sklearn库,我们能够可视化分类边界和支持向量。
本文介绍了使用坐标下降法计算Lasso回归路径的过程,包括参数设置、优化函数、以及如何使用Python实现。
本文介绍了使用Iris数据集进行二分类问题的逻辑回归正则化路径分析,包括数据加载、模型训练、正则化路径的计算和可视化。
本网页旨在比较两种流行的非线性降维技术:t-SNE和LLE,并探讨它们在添加数据空洞时的表现。
本文探讨了数据权重在模型训练中的作用,并通过Python代码示例展示了权重如何影响决策边界。
本网页介绍了梯度提升算法的基本概念和实现,包括正则化、随机梯度下降和特征采样等策略,以及如何使用Python进行梯度提升分类模型的训练和评估。
本文介绍了scikit-learn 1.2版本的新特性、改进和bug修复。
本文探讨了在数据点较少时,线性回归和岭回归在预测方差上的差异,并提供了相应的Python代码示例。
本文介绍了如何使用sklearn库中的make_classification函数生成一个随机的多类分类问题,包括参数设置和示例代码。
本文介绍了如何使用sklearn库中的tree模块来可视化决策树模型,包括参数设置和代码示例。
本文介绍了如何生成多标签数据集,并使用PCA和CCA进行降维,最后通过SVM进行分类。
本文介绍了基于特征矩阵的Ward聚类算法,这是一种递归合并聚类方法,旨在最小化簇内方差。
本文介绍了Fowlkes-Mallows指数的计算方法,这是一种衡量两个聚类结果相似度的指标。
本网页介绍了在使用ElasticNet模型时,如何对加权样本进行预处理以计算Gram矩阵。
本页面展示了如何在使用支持向量分类器(SVC)之前进行单变量特征选择以提高分类分数。我们使用鸢尾花数据集,并添加了36个非信息性特征。
本文介绍了如何使用标签传播模型在只有少量标签的情况下对手写数字数据集进行分类。
本文介绍了各种数据生成器的用途和特点,包括分类、聚类、回归、流形学习和分解等类型的数据生成器。
本页面介绍了如何使用Python函数加载SVMlight格式的数据集,并提供了详细的参数说明和使用示例。
本网页介绍了如何使用随机森林分类器处理具有多重共线性特征的数据集,并计算特征的重要性。
本文介绍了谱聚类算法在数据分析中的应用,特别是如何通过同时考虑数据矩阵的行和列来识别数据中的局部结构。
本文探讨了在数据聚类中使用图连接性来捕捉数据的局部结构,并分析了稀疏连接矩阵的优势和不同链接方法的稳定性。
本网页介绍了著名的鸢尾花数据集,包括数据集的基本信息、参数、返回值以及如何在Python中加载和使用该数据集。
本页面展示了一维核密度估计的原理和实现,包括直方图的局限性和不同核函数的应用。
本文通过模拟数据对比了独立成分分析(ICA)和主成分分析(PCA)在二维点云上的应用效果。