scikit-learn交流与支持指南

本页面提供scikit-learn社区交流和获取支持的指南,包括邮件列表、Stack Overflow、GitHub Discussions、问题报告等。

雅卡尔相似系数计算指南

本指南详细介绍了如何使用雅卡尔相似系数来评估分类模型的性能,包括参数设置、代码示例和不同情况下的计算方法。

约翰逊-林登斯特劳斯引理与随机投影

本文介绍了约翰逊-林登斯特劳斯引理在随机投影中的应用,解释了如何通过随机投影来降低数据维度,同时保持数据点间距离的相对不变性。

Linnerud 数据集加载与返回

本文介绍了如何加载和使用Linnerud数据集,适用于多输出回归任务,提供了详细的参数说明和使用示例。

教育经济学中的因果效应分析

本文通过模拟数据来探讨教育经济学中的一个重要问题:大学学位对小时工资的因果效应。

机器学习分类器与回归器概览

本文介绍了多种机器学习中的分类器和回归器,包括线性分类器、回归器、变量选择模型、鲁棒回归器以及广义线性模型等。

线性支持向量机(LinearSVC)示例

本页面展示了如何在使用线性支持向量机(LinearSVC)时获取支持向量。通过matplotlib和sklearn库,我们能够可视化分类边界和支持向量。

Lasso回归路径计算

本文介绍了使用坐标下降法计算Lasso回归路径的过程,包括参数设置、优化函数、以及如何使用Python实现。

逻辑回归正则化路径分析

本文介绍了使用Iris数据集进行二分类问题的逻辑回归正则化路径分析,包括数据加载、模型训练、正则化路径的计算和可视化。

非线性降维技术比较

本网页旨在比较两种流行的非线性降维技术:t-SNE和LLE,并探讨它们在添加数据空洞时的表现。

数据权重对模型的影响

本文探讨了数据权重在模型训练中的作用,并通过Python代码示例展示了权重如何影响决策边界。

梯度提升算法演示

本网页介绍了梯度提升算法的基本概念和实现,包括正则化、随机梯度下降和特征采样等策略,以及如何使用Python进行梯度提升分类模型的训练和评估。

scikit-learn 1.2版本发布亮点

本文介绍了scikit-learn 1.2版本的新特性、改进和bug修复。

线性回归与岭回归方差比较

本文探讨了在数据点较少时,线性回归和岭回归在预测方差上的差异,并提供了相应的Python代码示例。

生成随机分类问题

本文介绍了如何使用sklearn库中的make_classification函数生成一个随机的多类分类问题,包括参数设置和示例代码。

决策树可视化指南

本文介绍了如何使用sklearn库中的tree模块来可视化决策树模型,包括参数设置和代码示例。

多标签数据集的生成与分类

本文介绍了如何生成多标签数据集,并使用PCA和CCA进行降维,最后通过SVM进行分类。

基于特征矩阵的Ward聚类算法

本文介绍了基于特征矩阵的Ward聚类算法,这是一种递归合并聚类方法,旨在最小化簇内方差。

Fowlkes-Mallows指数计算

本文介绍了Fowlkes-Mallows指数的计算方法,这是一种衡量两个聚类结果相似度的指标。

使用加权样本计算Gram矩阵

本网页介绍了在使用ElasticNet模型时,如何对加权样本进行预处理以计算Gram矩阵。

SVM-Anova特征选择示例

本页面展示了如何在使用支持向量分类器(SVC)之前进行单变量特征选择以提高分类分数。我们使用鸢尾花数据集,并添加了36个非信息性特征。

半监督学习:标签传播模型在手写数字分类中的应用

本文介绍了如何使用标签传播模型在只有少量标签的情况下对手写数字数据集进行分类。

数据生成器概览

本文介绍了各种数据生成器的用途和特点,包括分类、聚类、回归、流形学习和分解等类型的数据生成器。

加载SVMlight格式数据集

本页面介绍了如何使用Python函数加载SVMlight格式的数据集,并提供了详细的参数说明和使用示例。

处理多重共线性特征的重要性评估

本网页介绍了如何使用随机森林分类器处理具有多重共线性特征的数据集,并计算特征的重要性。

谱聚类算法在数据子集分析中的应用

本文介绍了谱聚类算法在数据分析中的应用,特别是如何通过同时考虑数据矩阵的行和列来识别数据中的局部结构。

数据局部结构的图连接性分析

本文探讨了在数据聚类中使用图连接性来捕捉数据的局部结构,并分析了稀疏连接矩阵的优势和不同链接方法的稳定性。

鸢尾花数据集介绍

本网页介绍了著名的鸢尾花数据集,包括数据集的基本信息、参数、返回值以及如何在Python中加载和使用该数据集。

一维核密度估计示例

本页面展示了一维核密度估计的原理和实现,包括直方图的局限性和不同核函数的应用。

ICA与PCA在二维点云上的应用对比

本文通过模拟数据对比了独立成分分析(ICA)和主成分分析(PCA)在二维点云上的应用效果。

沪ICP备2024098111号-1
上海秋旦网络科技中心:上海市奉贤区金大公路8218号1幢 联系电话:15216758379