机器学习算法概览

本文详细介绍了各种机器学习算法,包括线性模型、回归分析、分类器等,以及它们的应用和实现细节。

核岭回归与支持向量回归比较

本文比较了核岭回归(Kernel Ridge Regression, KRR)和支持向量回归(Support Vector Regression, SVR)两种方法,它们都利用核技巧学习非线性函数。这两种方法在损失函数上有差异,KRR通常在中等规模数据集上训练速度更快,但预测时速度较慢。

随机森林分类器的OOB误差分析

本网页介绍了随机森林分类器在训练过程中如何通过OOB误差进行模型验证,并提供了相应的Python代码示例。

贝叶斯高斯混合模型分析

本网页介绍了如何使用贝叶斯高斯混合模型对玩具数据集进行拟合,并分析了不同权重浓度先验对模型的影响。

数据标准化变换示例

本页面展示了如何使用Box-Cox和Yeo-Johnson变换将不同分布的数据映射到正态分布,并通过QuantileTransformer进行比较。

图的中心性分析:维基百科链接图谱

本文介绍了如何使用随机SVD算法分析维基百科内部链接图谱,以确定文章的相对重要性。

半监督文本数据分类

本网页介绍了半监督学习在文本数据集上的分类应用,包括SGD分类器、自我训练分类器和标签传播方法。

交叉分解方法比较

本文介绍了几种交叉分解方法,包括PLS典型分析、PLS回归以及典型相关分析(CCA),并通过Python代码示例展示了这些方法的应用。

数组转换为浮点数数组

介绍如何将数组转换为浮点数数组,包括参数说明、返回值和示例代码。

模型评估与解释性分析

本文探讨了模型评估中的常见问题,以及如何通过解释性分析来理解模型预测,并提供了一系列工具和方法来评估模型假设和偏差,设计更好的模型,诊断模型性能问题。

支持向量机在不平衡数据集上的应用

本网页介绍了如何在不平衡数据集上使用支持向量机(SVM)进行分类,并展示了如何绘制决策边界。

模型拟合验证

本文介绍了如何对机器学习模型进行拟合状态的验证,包括检查模型是否已经通过训练获得了必要的属性,并在未拟合时抛出异常。

SVM-Anova特征选择示例

本页面展示了如何在使用支持向量分类器(SVC)之前进行单变量特征选择以提高分类分数。我们使用鸢尾花数据集,并添加了36个非信息性特征。

支持向量机(SVM)最大边界超平面示例

本文介绍了如何使用支持向量机(SVM)分类器和线性核来绘制一个两类别可分离数据集中的最大边界超平面。

Huber回归与岭回归比较

本文通过生成包含异常值的数据集,比较了Huber回归和岭回归在处理异常值时的表现。

谱聚类共聚类算法演示

本文介绍了使用谱聚类共聚类算法对数据集进行分析的过程,包括数据集的生成、模型的训练以及结果的可视化展示。

F1分数计算方法

本页面介绍了F1分数的计算方法,包括其定义、公式、参数以及在不同情况下的应用。

多维尺度分析与非度量多维尺度分析

本文介绍了如何使用Python进行多维尺度分析(MDS)和非度量多维尺度分析(NMDS),并通过代码示例展示了两种方法在数据可视化中的应用。

层次聚类方法的比较

本网页介绍了不同层次聚类方法在二维数据集上的表现,包括单链接、平均链接、完全链接和Ward方法,并提供了相应的Python代码实现。

随机梯度下降与早停策略

本文介绍了一种在随机梯度下降中使用早停策略来优化线性模型的方法,并通过实验比较了不同停止准则对模型性能的影响。

局部异常因子(LOF)异常检测

局部异常因子(LOF)是一种无监督异常检测方法,用于计算给定数据点相对于其邻居的局部密度偏差。本文介绍了如何在scikit-learn中使用LOF进行异常检测,并展示了如何生成带有异常值的数据集,拟合模型并绘制结果。

正交匹配追踪算法(OMP)详解

本文详细介绍了正交匹配追踪(OMP)算法的原理、参数设置以及在机器学习中的应用示例。

递归特征消除(RFE)在手写数字识别中的应用

本文介绍了如何使用递归特征消除(RFE)方法来确定手写数字识别中各个像素的重要性,并展示了如何通过代码实现这一过程。

物种分布的核密度估计

本页面展示了如何使用基于邻居的查询(特别是核密度估计)来处理地理空间数据,使用基于Haversine距离度量的球面坐标。

图像分割的谱聚类算法示例

本网页介绍了如何使用谱聚类算法进行图像分割的示例,包括代码实现和结果展示。

Ledoit-Wolf协方差矩阵估计

本页面介绍如何使用Ledoit-Wolf方法来估计协方差矩阵,并提供Python代码示例。

数据离散化对线性回归和决策树的影响

本文探讨了数据离散化对线性回归和决策树模型预测结果的影响。通过使用KBinsDiscretizer对连续特征进行离散化处理,比较了处理前后模型的预测效果。

数据验证工具:确保数据有限性

本网页介绍了一个数据验证工具,用于确保输入数据不包含NaN或无穷大值,以保证数据处理的准确性和可靠性。

F-beta得分计算与应用

本页面介绍了F-beta得分的计算方法和参数,以及如何在不同情况下使用该得分来评估分类模型的性能。

调整互信息指标(AMI)

本页面介绍了调整互信息(AMI)指标,这是一种用于评估两个聚类结果相似度的指标,考虑了随机性的影响。

沪ICP备2024098111号-1
上海秋旦网络科技中心:上海市奉贤区金大公路8218号1幢 联系电话:17898875485