聚类算法演示与比较

本网页展示了多种聚类算法的演示和比较,包括K-Means、层次聚类、均值漂移等,并探讨了聚类性能评估和特征选择的方法。

scikit-learn库新特性介绍

本文介绍了scikit-learn库的新版本更新,包括bug修复、性能提升和新特性介绍,如元数据路由、HDBSCAN聚类算法、TargetEncoder编码策略等。

线性回归与多项式特征:拟合不足与过拟合

本文介绍了线性回归模型在拟合非线性函数时可能遇到的拟合不足和过拟合问题,并通过多项式特征来展示如何近似非线性函数。

岭回归系数分析

本页面介绍了岭回归中系数的变化情况,并展示了如何通过调整正则化参数来平衡模型的偏差和方差。

RBF核函数与SVM分类器的近似特征映射

本网页介绍了如何使用RBFSampler和Nystroem近似RBF核函数的特征映射,并在手写数字数据集上使用SVM进行分类。比较了在原始空间中使用线性SVM、使用近似映射的线性SVM以及核化SVM的结果。

密度不同的聚类分析

本文通过生成不同密度的数据集,使用OPTICS算法的Xi聚类检测方法和设置特定的可达性阈值来模拟DBSCAN算法,展示了不同阈值下DBSCAN算法的聚类效果。

层次聚类方法的比较

本网页介绍了不同层次聚类方法在二维数据集上的表现,包括单链接、平均链接、完全链接和Ward方法,并提供了相应的Python代码实现。

流形学习技术比较

本文探讨了t-SNE和LLE两种流形学习技术在Swiss Roll数据集上的表现,并分析了它们在数据中添加空洞时的处理方式。

随机森林的袋外误差分析

本文介绍了随机森林分类器在训练过程中如何利用袋外误差进行模型验证,并提供了Python代码示例。

手写数字数据集的流形学习技术比较

本文介绍了在手写数字数据集上应用多种流形学习技术,并通过可视化比较了它们的性能和特点。

非负最小二乘法与普通最小二乘法比较

本文介绍了非负最小二乘法与普通最小二乘法在回归系数估计上的比较,并提供了相应的Python代码示例。

Scikit-learn 估计器概览

本文介绍了如何使用Scikit-learn库中的函数来检索所有继承自BaseEstimator的估计器类。

机器学习算法比较

本文通过比较KNN和逻辑回归算法在Digits数据集上的性能,展示了两种算法在分类任务上的表现。

基于投票分类器的分类概率可视化

本文介绍了如何使用Python和sklearn库中的VotingClassifier进行软投票分类,并可视化不同分类器对单个样本的分类概率。

手写数字识别示例

本网页介绍了如何使用机器学习技术对手写数字图像进行识别,并提供了相应的代码示例。

神经网络学习行为分析

本文通过分析神经网络的权重,探讨学习行为,使用MNIST数据集训练MLP分类器,并通过可视化权重矩阵来理解学习过程。

亲和力传播聚类算法演示

本页面展示了亲和力传播聚类算法的实现过程,包括数据生成、算法应用、结果评估和可视化展示。

多类分类问题中的break_ties参数效果

本文通过代码示例和图表,探讨了在多类分类问题中,break_ties参数如何影响SVM模型的决策边界。

局部线性嵌入分析

局部线性嵌入(Locally Linear Embedding, LLE)是一种非线性降维技术,用于数据的可视化和分析。本文介绍了LLE的基本概念、参数设置以及如何在Python中使用。

数据预处理与特征提取

本网页介绍了数据预处理和特征提取的基本概念、方法和技术,包括标准化、归一化、编码分类特征、缺失值处理、多项式特征生成、无监督降维等。

无监督学习与降维技术

本文介绍了无监督学习中的降维技术,包括主成分分析(PCA)、随机投影和特征聚合等方法,并讨论了它们在数据预处理中的应用。

梯度提升树的早停技术

本文介绍了梯度提升树模型中早停技术的应用,包括防止过拟合、提高训练效率,并以加州房价数据集为例进行演示。

D²评分函数详解

本文详细介绍了D²评分函数,这是一种用于评估分类模型性能的指标,通过比较实际标签和预测概率来计算得分。

零一分类损失函数

本文介绍了零一分类损失函数的计算方法,包括参数说明、返回值以及在多标签分类中的应用。

单变量线性回归分析

本页面介绍了单变量线性回归分析的方法,包括F统计量和p值的计算,以及如何使用这些统计量进行特征选择。

模型正则化对误差的影响

本网页介绍了线性模型中正则化参数对训练和测试误差的影响,并展示了如何通过验证曲线确定最优正则化参数,以及如何比较真实系数和估计系数。

随机森林与多输出回归估计器的比较

本文通过一个实例比较了随机森林回归器和多输出回归估计器的性能。

SVM分类器在鸢尾花数据集上的应用

本页面展示了在鸢尾花数据集上使用不同SVM分类器的效果,包括线性和非线性模型的决策边界。

scikit-learn项目决策制定与社区互动指南

本文介绍了开源项目scikit-learn的决策制定过程,包括社区成员如何反馈、互动以及不同角色的职责和决策方式。

随机梯度下降的早期停止策略

本文介绍了随机梯度下降(SGD)的早期停止策略,这是一种在训练过程中,通过监控验证集的预测分数来提前结束训练,以防止过拟合并提高模型泛化能力的方法。

沪ICP备2024098111号-1
上海秋旦网络科技中心:上海市奉贤区金大公路8218号1幢 联系电话:15216758379