鸢尾花数据集分类分析

本文通过鸢尾花数据集,使用SVM分类器进行分类,并分析了混淆矩阵,探讨了模型参数调优对分类结果的影响。

Linnerud 数据集加载与返回

本文介绍了如何加载和使用Linnerud数据集,适用于多输出回归任务,提供了详细的参数说明和使用示例。

目标编码器与交叉拟合

本文介绍了目标编码器的内部交叉拟合机制,以及它如何帮助防止机器学习模型过拟合。通过构建合成数据集,展示了目标编码器在有无交叉拟合时对模型性能的影响。

DBSCAN聚类算法演示

本页面展示了DBSCAN聚类算法的实现和评估,包括数据生成、算法应用、结果可视化和性能评估。

谱聚类共簇算法演示

本页面展示了如何使用谱聚类共簇算法生成数据集并进行双聚类分析。

Scikit-learn 估计器概览

本文介绍了如何使用Scikit-learn库中的函数来检索所有继承自BaseEstimator的估计器类。

随机化奇异值分解(SVD)算法详解

本文介绍了随机化奇异值分解(SVD)的算法及其在大规模数据集上的快速应用。

参数优化比较:HalvingGridSearchCV vs GridSearchCV

本文介绍了如何使用HalvingGridSearchCV和GridSearchCV进行参数优化,并比较了两者的性能。

神经网络学习行为分析

本文通过分析神经网络的权重,探讨学习行为,使用MNIST数据集训练MLP分类器,并通过可视化权重矩阵来理解学习过程。

最小角回归(LARS)算法与Lasso路径

本页面介绍了最小角回归(LARS)算法及其在Lasso路径计算中的应用,包括参数设置、优化目标、算法特点以及实际代码示例。

人脸数据集加载与处理

本页面介绍了如何加载和处理Labeled Faces in the Wild (LFW)人脸数据集,包括数据集的参数设置、数据结构和使用示例。

多标签分类问题的解决策略

本文介绍了解决多标签分类问题的几种策略,包括独立模型、分类器链和集成模型,并使用酵母数据集进行实验比较。

使用set_output API配置Transformer输出Pandas DataFrame

本文介绍了如何使用set_output API来配置scikit-learn中的Transformer,使其输出Pandas DataFrame,便于数据分析和可视化。

精确度-召回率曲线计算

本文介绍了如何计算精确度和召回率,以及如何为二分类任务绘制精确度-召回率曲线。

文本数据加载与处理

本文介绍了如何使用Python中的scikit-learn库来加载和处理文本数据集,包括设置文件编码、随机打乱数据、选择特定文件扩展名等。

SVM-Anova特征选择示例

本页面展示了如何在使用支持向量分类器(SVC)之前进行单变量特征选择以提高分类分数。我们使用鸢尾花数据集,并添加了36个非信息性特征。

层次聚类分析

本文介绍了如何使用AgglomerativeClustering和scipy中的dendrogram方法进行层次聚类分析。

指数卡方核函数详解

本文详细介绍了指数卡方核函数的计算方法、参数设置以及在机器学习中的应用。

增量主成分分析(IPCA)示例

本页面介绍了增量主成分分析(IPCA)的概念和实现,以及如何使用IPCA处理大数据集。

文档语料库的主题模型提取

本页面展示了在文档语料库上应用非负矩阵分解(NMF)和潜在狄利克雷分配(LDA)来提取主题结构的加法模型,并使用基于权重的前几个词作为条形图表示每个主题。

高斯分布样本生成器

本网页介绍了一个用于生成多类分类数据集的高斯分布样本生成器,包括其参数设置、返回值和示例代码。

概率校准方法比较

本文比较了不同的概率校准方法,包括无校准、sigmoid校准和isotonic校准,并使用Brier分数评估了校准后的概率质量。

精确度、召回率和F-分数计算

本页面介绍了如何计算精确度、召回率、F-分数和支持度,这些是评估分类模型性能的关键指标。

物种地理分布建模

本文介绍了如何使用OneClassSVM模型来预测南美两种哺乳动物的地理分布,并展示了模型的ROC曲线下面积。

机器学习库新特性介绍

本文介绍了机器学习库scikit-learn的最新版本中新增的一些关键特性和改进,包括固定阈值分类器、阈值优化分类器、PCA性能提升等。

二元分类数据生成

本页面介绍了如何生成用于二元分类的样本数据,这些数据基于标准独立高斯分布,并根据特定的规则定义目标变量。

FastICA算法详解

本文介绍了独立成分分析(ICA)的FastICA算法实现,包括算法参数、原理和应用示例。

偏最小二乘回归分析

本网页介绍了偏最小二乘回归分析的基本概念,包括PLS1和PLS2的区别,以及如何使用Python进行CCA分析。

特征量化变换方法

本文介绍了一种基于分位数信息的特征变换方法,旨在将特征变换为均匀或正态分布,以减少异常值的影响并提高不同尺度变量的可比性。

偏差-方差分解与集成学习

本文探讨了回归分析中的偏差-方差分解,对比了单个决策树与集成学习中的Bagging方法在预测误差上的差异。

沪ICP备2024098111号-1
上海秋旦网络科技中心:上海市奉贤区金大公路8218号1幢 联系电话:15216758379