计算折扣累积增益(Discounted Cumulative Gain)

本文介绍了如何使用折扣累积增益(Discounted Cumulative Gain, DCG)来评估多标签分类或实体排序任务的性能。

概率模型的稀疏精度估计

本文讨论了如何从少量样本中估计概率模型的精度矩阵,包括高斯模型的参数化、数据采样、以及不同估计器的性能比较。

高斯过程分类(GPC)的等概率线示例

本页面展示了一个二维分类示例,其中预测概率的等概率线被清晰地描绘出来。通过学习核函数,我们能够预测分类结果,并展示出分类边界。

SVMlight文件格式导出工具

本页面介绍如何使用SVMlight文件格式导出工具,将数据集导出为SVMlight或libsvm格式,适用于稀疏数据集。

梯度提升树的OOB估计

本文介绍了梯度提升树中OOB估计的概念、计算方法以及如何使用OOB估计来确定模型的最佳迭代次数。

单变量特征选择与SVM分类

本网页介绍了如何使用单变量特征选择来提高含噪声数据集上的分类准确性,并通过SVM模型进行分类前后的比较。

特征选择与聚合的比较

本文比较了两种降维策略:单变量特征选择与方差分析和特征聚合与Ward层次聚类。这两种方法在回归问题中使用贝叶斯岭作为监督估计器进行比较。

局部异常因子(LOF)异常检测

局部异常因子(LOF)是一种无监督异常检测方法,用于计算给定数据点相对于其邻居的局部密度偏差。本文介绍了如何在scikit-learn中使用LOF进行异常检测,并展示了如何生成带有异常值的数据集,拟合模型并绘制结果。

鲁棒协方差估计与异常检测

本文通过葡萄酒数据集的实例,探讨了在实际数据集中进行鲁棒协方差估计的必要性,以及如何使用不同的异常检测工具来理解数据结构。

目标编码与交叉拟合在机器学习中的应用

本文探讨了目标编码和交叉拟合在机器学习数据预处理中的重要性,并通过实例演示了如何使用这些技术来提高模型的泛化能力。

调整互信息指标(AMI)

本页面介绍了调整互信息(AMI)指标,这是一种用于评估两个聚类结果相似度的指标,考虑了随机性的影响。

岭回归系数与正则化参数的关系

本网页展示了岭回归系数如何随着正则化参数的变化而变化,以及在处理高度病态矩阵时岭回归的实用性。

文本数据加载与处理

本文介绍了如何加载和处理文本数据,以便用于分类或聚类算法。

图像向量量化示例

本网页通过一个浣熊脸图像的例子,展示了如何使用KBinsDiscretizer进行图像的向量量化处理,并探讨了不同的压缩策略和内存占用情况。

支持向量机(SVM)分类器决策边界可视化

本页面展示了如何使用Python和matplotlib库来可视化支持向量机(SVM)分类器在鸢尾花数据集上的决策边界。

机器学习管道中的特征选择

本文介绍了如何在机器学习的管道中集成特征选择,并通过分类报告展示了模型的性能。

葡萄酒数据集介绍

葡萄酒数据集是一个经典的多类分类数据集,包含178个样本,每个样本有13个特征。

随机投影降维技术

本文介绍了随机投影降维技术,包括其理论基础Johnson-Lindenstrauss引理,以及如何通过高斯随机投影和稀疏随机投影来减少数据维度,同时保持数据间距离的近似不变。

生成稀疏对称正定矩阵

本页面介绍了如何生成一个稀疏对称正定矩阵,并提供了相应的代码示例。

Lasso模型选择:AIC与BIC标准

本网页介绍了如何使用AIC和BIC标准来选择最佳的Lasso回归模型,并提供了相应的Python代码示例。

在线学习算法处理图像数据集

本网页介绍了如何使用在线学习算法处理大型图像数据集,通过分块加载和提取图像块,使用MiniBatchKMeans进行聚类分析。

半监督学习:标签传播模型在手写数字分类中的应用

本文介绍了如何使用标签传播模型在只有少量标签的情况下对手写数字数据集进行分类。

数据集生成:圆形数据集

本页面介绍了如何生成一个包含内圈和外圈的圆形数据集,用于可视化聚类和分类算法的效果。

文件下载与校验

本页面介绍了如何从网络下载文件,并进行SHA256校验以确保文件的完整性。

AdaBoost分类器示例

本页面展示了如何使用AdaBoost分类器对非线性可分数据集进行分类,并绘制了决策边界和决策分数的分布图。

解释方差回归评分函数

本文介绍了解释方差回归评分函数,这是一种用于评估预测模型性能的指标。

多类分类策略比较与优化

本网页介绍了如何在机器学习中处理多类分类问题,包括使用scikit-learn库中的不同策略进行比较和优化。

交叉验证评分方法

本页面介绍了如何使用交叉验证方法来评估机器学习模型的性能。

精确度计算方法

本文介绍了精确度的计算方法,包括二分类和多分类情况下的计算公式和参数设置。

高斯过程回归中的噪声水平估计

本文探讨了高斯过程回归(GPR)在估计数据噪声水平方面的能力,并强调了核函数超参数初始化的重要性。

沪ICP备2024098111号-1
上海秋旦网络科技中心:上海市奉贤区金大公路8218号1幢 联系电话:15216758379