OPTICS聚类算法详解

本文详细介绍了OPTICS聚类算法的工作原理和参数设置,包括算法的输入参数、核心概念以及如何使用Python进行实现。

高斯过程分类的概率预测

本文介绍了高斯过程分类(GPC)的概率预测,通过RBF核函数的不同超参数选择,展示了优化对数边际似然(LML)对模型性能的影响。

正交匹配追踪算法在信号恢复中的应用

本文介绍了使用正交匹配追踪算法从带有噪声的测量中恢复稀疏信号的过程,包括算法的实现和结果展示。

scikit-learn库新特性介绍

本文介绍了scikit-learn库的新版本更新,包括bug修复、性能提升和新特性介绍,如元数据路由、HDBSCAN聚类算法、TargetEncoder编码策略等。

正则化参数优化与模型性能

本文通过Elastic-Net回归模型探讨了正则化参数对训练和测试数据集性能的影响,并使用解释方差R^2作为性能度量。

k-邻居图计算

本文介绍了如何使用k-邻居图计算方法来分析样本数据,包括参数设置和代码示例。

调整兰德指数(ARI)在聚类评估中的应用

本文介绍了调整兰德指数(Adjusted Rand Index, ARI)的概念、计算方法和在聚类评估中的应用。

降维技术指南

本网页介绍了多种降维技术,包括主成分分析(PCA)、独立成分分析(ICA)、字典学习等,并提供了相应的算法实现方法。

scikit-learn 1.2版本发布亮点

本文介绍了scikit-learn 1.2版本的新特性、改进和bug修复。

评分器选择指南

本文介绍了如何根据用户选项确定评分器,并提供了相应的代码示例。

参数优化与验证曲线

本文介绍了如何使用sklearn库中的validation_curve函数来分析不同参数值对模型训练和测试分数的影响。

数据随机打乱方法

本页面介绍了如何使用Python中的shuffle函数对数组或稀疏矩阵进行随机打乱,包括参数说明和示例代码。

机器学习管道与特征选择

本文介绍了如何使用机器学习管道进行特征选择和模型训练,并展示了如何预测新样本和检查管道步骤。

加权众数计算方法

本文介绍了一种计算加权众数的方法,通过给定的数组和权重,找到出现频率最高的值及其对应的加权计数。

机器学习评估与优化

本网页介绍了机器学习中模型评估与优化的多种方法,包括交叉验证、参数优化、ROC曲线等。

集成学习算法概览

本文介绍了多种集成学习算法,包括AdaBoost、Bagging、ExtraTrees、Gradient Boosting、Isolation Forest、Random Forest、Stacking和Voting等。

K-Means聚类算法可视化

本网页展示了使用K-Means聚类算法对Iris数据集进行分类的效果,包括不同聚类数量和初始化方式对结果的影响。

多指标参数搜索与评估

本文介绍了如何使用scikit-learn库中的GridSearchCV进行多指标参数搜索,并通过图形化展示评估结果。

协方差估计方法比较

本网页介绍了Ledoit-Wolf和OAS两种协方差估计方法,并比较了它们在高斯分布数据下的均方误差。

鲁棒协方差估计与经验协方差估计的比较

本文比较了在数据集中存在异常值时,使用鲁棒估计器和经验估计器对协方差矩阵进行估计的效果。

使用线性支持向量机的可分离数据集

本文介绍了如何使用随机梯度下降(SGD)训练的线性支持向量机(SVM)来处理一个可分离的数据集,并展示了如何绘制决策边界和数据点。

基于局部异常因子的异常检测

本文介绍了一种基于局部异常因子(LOF)的无监督异常检测方法,该方法通过计算给定数据点与其邻居的局部密度偏差来识别异常值。

支持向量回归模型比较

本文介绍了使用不同的核函数进行支持向量回归(SVR)的比较,包括线性核、多项式核和RBF核。

覆盖误差计算方法

本文介绍了覆盖误差这一评估多标签分类模型性能的指标,包括其计算方法、参数说明以及如何使用Python中的sklearn库来计算覆盖误差。

二元分类任务的错误率计算

本页面介绍了如何计算二元分类任务在不同概率阈值下的错误率,包括假阳性率(FPR)和假阴性率(FNR),并提供了相应的代码示例。

余弦相似度计算指南

本文介绍了余弦相似度的概念,以及如何在Python中使用sklearn库计算两个数据集之间的余弦相似度。

随机森林分类器的OOB误差分析

本网页介绍了随机森林分类器在训练过程中如何通过OOB误差进行模型验证,并提供了相应的Python代码示例。

线性模型Lasso在密集与稀疏数据上的应用

本文探讨了线性模型Lasso在处理密集与稀疏数据时的表现,并对比了两种数据格式下的运行速度。

ColumnTransformer的使用和参数详解

本文详细介绍了ColumnTransformer的使用方法和参数配置,帮助理解如何在数据预处理中应用这一工具。

多类分类策略比较

本文探讨了在目标变量包含多于两个类别时的分类问题,即多类分类问题,并比较了不同的多类分类策略。

沪ICP备2024098111号-1
上海秋旦网络科技中心:上海市奉贤区金大公路8218号1幢 联系电话:15216758379