高斯过程回归(GPR)及其应用

本文介绍了高斯过程回归(GPR)在数据噪声水平估计、核岭回归比较、CO2水平预测以及分类问题中的应用。

校准曲线计算方法

本网页介绍了如何使用校准曲线来计算真实和预测概率,适用于二元分类问题。

数据集概览

本文介绍了机器学习中常用的数据集,包括玩具数据集、真实世界数据集、生成数据集以及其他数据集的加载方式。

缺失值处理技术

本文探讨了在构建估计器前如何处理缺失值,包括使用常数、均值、中位数或众数等方法。

20新闻组数据集加载与向量化

本文介绍了如何使用sklearn库加载和向量化20新闻组数据集,包括参数设置和数据预处理。

梯度提升中的早停技术

本文介绍了梯度提升中的早停技术,通过加州房价数据集的案例,展示了如何使用早停技术来优化模型性能和提高训练效率。

梯度提升算法演示

本网页介绍了梯度提升算法的基本概念和实现,包括正则化、随机梯度下降和特征采样等策略,以及如何使用Python进行梯度提升分类模型的训练和评估。

支持向量机(SVM)中的正则化参数C

本文介绍了支持向量机(SVM)中正则化参数C的作用,并通过代码示例展示了不同C值对模型的影响。

随机森林的袋外误差分析

本文介绍了随机森林分类器在训练过程中如何利用袋外误差进行模型验证,并提供了Python代码示例。

分类报告生成器

这个工具可以生成一个文本报告,展示主要的分类指标,包括精确度、召回率、F1分数和支持度。

递归特征消除(RFE)在手写数字识别中的应用

本页面介绍了如何使用递归特征消除(RFE)技术来评估手写数字识别中各个像素的重要性,并展示了如何通过颜色和注释清晰地可视化特征的重要性排名。

Scikit-learn 估计器概览

本文介绍了如何使用Scikit-learn库中的函数来检索所有继承自BaseEstimator的估计器类。

半监督学习在乳腺癌数据集上的应用

本文介绍了半监督学习中的自我训练分类器在乳腺癌数据集上的应用,分析了不同阈值对分类器性能的影响。

机器学习与因果效应推断的局限性

本文探讨了机器学习模型在统计关联和因果效应推断中的局限性,并通过模拟数据集来说明遗漏变量偏差对因果效应估计的影响。

Oracle Approximating Shrinkage算法详解

本文介绍了Oracle Approximating Shrinkage算法,这是一种用于估计协方差的技术,广泛应用于数据科学和机器学习领域。

基于局部异常因子的异常检测

本文介绍了一种基于局部异常因子(LOF)的无监督异常检测方法,该方法通过计算给定数据点与其邻居的局部密度偏差来识别异常值。

使用预计算的Gram矩阵和加权样本拟合ElasticNet

本教程展示了如何在使用加权样本的同时,预计算Gram矩阵来拟合ElasticNet模型。

MaxAbsScaler 数据标准化处理

本文介绍了MaxAbsScaler的作用、参数、使用注意事项以及示例代码。MaxAbsScaler是一种将数据特征缩放到[-1, 1]范围内的标准化方法,适用于机器学习和数据科学领域。

scikit-learn版本更新历史

scikit-learn是一个流行的Python机器学习库,本文记录了scikit-learn从0.4版本到最新版本的更新历史,包括每个版本的新特性和改进。

正交匹配追踪算法(OMP)详解

本文详细介绍了正交匹配追踪算法(OMP)的实现和应用,包括算法原理、参数说明、代码示例以及与其他算法的比较。

鸢尾花数据集的K最近邻分类器决策边界分析

本网页通过Python代码演示了在鸢尾花数据集上使用K最近邻分类器,并分析了不同参数权重对决策边界的影响。

增量主成分分析(IPCA)示例

本页面介绍了增量主成分分析(IPCA)的概念和实现,以及如何使用IPCA处理大数据集。

生成随机回归问题

本页面介绍了如何使用scikit-learn库生成随机回归问题,包括参数设置和示例代码。

距离矩阵计算指南

本页面提供了关于如何计算距离矩阵的详细指南,包括不同的距离度量方法和参数设置。

计算科恩卡帕系数

本文介绍了如何使用科恩卡帕系数来衡量两个标注者在分类问题上的一致性水平。

K-Means++聚类算法初始化种子生成

本页面介绍了K-Means++聚类算法的初始化种子生成过程,包括Python代码示例和结果展示。

欧几里得距离计算

本页面介绍了如何使用Python的sklearn库来计算两个向量数组之间的欧几里得距离矩阵,包括计算方法、参数说明以及示例代码。

K-Means聚类算法演示

本页面展示了K-Means聚类算法在手写数字数据集上的应用,包括不同初始化策略的比较、聚类质量评估以及结果的可视化展示。

层次聚类算法在数字数据集上的应用

本网页展示了层次聚类算法在数字数据集上的应用,包括不同链接策略的效果比较。

随机化SVD算法介绍

本页面介绍了随机化SVD算法的原理、参数和应用示例。

沪ICP备2024098111号-1
上海秋旦网络科技中心:上海市奉贤区金大公路8218号1幢 联系电话:15216758379