稳健协方差估计与马氏距离的相关性

本文介绍了在高斯分布数据中使用稳健协方差估计和马氏距离来识别异常值和进行数据聚类。

梯度提升树的OOB估计

本文介绍了梯度提升树中OOB估计的概念、计算方法以及如何使用OOB估计来确定模型的最佳迭代次数。

校准曲线计算方法

本网页介绍了如何使用校准曲线来计算真实和预测概率,适用于二元分类问题。

随机森林与梯度提升树模型性能比较

本文比较了随机森林(RF)和直方图梯度提升树(HGBT)模型在回归数据集上的得分和计算时间。

模型验证与参数调优指南

本文详细介绍了模型验证和参数调优的方法,包括交叉验证、参数搜索、决策阈值调整和评估指标。

模型选择与交叉验证策略

本文讨论了在模型选择过程中使用嵌套交叉验证和非嵌套交叉验证的策略,以及它们在优化模型参数时的差异。

学习曲线分析

本文介绍了如何使用学习曲线分析来评估机器学习模型在不同训练集大小下的性能。

降维技术:邻域成分分析

本文介绍了使用邻域成分分析(NCA)进行降维的方法,并与PCA和LDA进行了比较。

手写数字识别示例

本网页介绍了如何使用机器学习技术对手写数字图像进行识别,并提供了相应的代码示例。

图像去噪与字典学习

本网页介绍了使用在线字典学习和不同的变换方法对浣熊脸部图像碎片进行去噪的过程。

Fowlkes-Mallows指数计算

本文介绍了Fowlkes-Mallows指数的计算方法,这是一种衡量两个聚类结果相似度的指标。

交叉验证与模型评估指南

本文介绍了如何使用交叉验证方法来评估机器学习模型的性能,并提供了详细的参数说明和示例代码。

scikit-learn 1.3版本新特性

本文详细介绍了scikit-learn 1.3版本的新特性,包括bug修复、性能提升以及新增的关键功能。

层次聚类在二维图像中的应用

本网页介绍了如何使用Ward层次聚类方法对二维图像进行空间约束的聚类处理,并展示了相应的Python代码实现。

机器学习算法概览

本文详细介绍了各种机器学习算法,包括线性模型、回归分析、分类器等,以及它们的应用和实现细节。

近邻分类与邻域成分分析比较

本文比较了使用和不使用邻域成分分析的最近邻分类方法,并展示了通过欧几里得距离在原始特征上以及在邻域成分分析学习到的变换后进行分类时的类决策边界。

投票分类器决策边界可视化

本文介绍了如何使用Python的scikit-learn库来可视化投票分类器的决策边界,并展示了如何计算并绘制Iris数据集中两个特征的决策边界。

鸢尾花数据集介绍

鸢尾花数据集是一个经典的多类分类数据集,用于机器学习教学和实践。

计算科恩卡帕系数

本文介绍了如何使用科恩卡帕系数来衡量两个标注者在分类问题上的一致性水平。

协方差估计的收缩算法比较

本网页比较了Ledoit-Wolf和OAS两种协方差估计的收缩算法,使用高斯分布数据进行模拟。

计算加法卡方核

本文介绍了加法卡方核的计算方法,这是一种在机器学习中用于特征数组比较的核方法。

线性与二次判别分析比较

本文介绍了线性判别分析(LDA)和二次判别分析(QDA)在不同数据集上的表现,并通过可视化展示了两种方法的决策边界和协方差椭球。

非负矩阵分解(NMF)技术介绍

本文介绍了非负矩阵分解(NMF)技术,这是一种用于数据降维、源分离或主题提取的数学方法。

随机投影技术在高维数据集中的应用

本网页介绍了随机投影技术在高维数据集中的应用,包括理论基础、代码实现和实验验证。

均方误差回归损失计算

本文介绍了均方误差回归损失的概念、计算方法和在机器学习中的应用。

弗里德曼回归问题 #1

本页面介绍了弗里德曼回归问题 #1 的数据生成方法和相关参数。

弹性网络回归模型

本页面介绍了弹性网络回归模型的计算方法和参数配置,包括单输出和多输出任务的优化函数,以及如何使用坐标下降法来计算模型。

聚类完整性度量

聚类完整性度量是一种评估聚类结果的方法,用于判断同一类别的数据点是否被分配到同一个聚类中。

随机抽样算法详解

本文详细介绍了随机抽样算法的实现方式,包括无替换抽样的概念、参数设置、不同抽样方法的适用场景以及代码示例。

多类分类策略比较

本文探讨了在目标变量包含多于两个类别时的分类问题,即多类分类问题,并比较了不同的多类分类策略。

沪ICP备2024098111号-1
上海秋旦网络科技中心:上海市奉贤区金大公路8218号1幢 联系电话:15216758379