稳健协方差估计与马氏距离的相关性

本文介绍了在高斯分布数据中使用稳健协方差估计和马氏距离来识别异常值和进行数据聚类。

稳健协方差估计器:最小协方差行列式估计器

本文介绍了最小协方差行列式估计器(MCD),这是一种在数据集中存在异常值时,用于估计协方差矩阵的稳健方法。

KDDCup 99 数据集加载指南

本网页提供了关于如何加载KDDCup 99数据集的详细指南,包括参数设置和数据集特点。

正则化路径计算

本页面展示了如何使用Python中的sklearn库来计算Lasso和弹性网络的正则化路径,并比较了标准和正则化版本的效果。

不同层次聚类方法的可视化

本网页展示了在二维数字数据集上应用不同层次聚类方法的可视化效果,包括ward、average、complete和single等链接策略。

数据预处理:列选择器的使用

本文介绍了如何使用sklearn库中的ColumnTransformer和make_column_selector函数来选择数据集中的特定列进行预处理。

稀疏编码与Ricker小波变换

本网页介绍了稀疏编码技术,特别是使用Ricker小波变换对信号进行稀疏表示的方法。通过比较不同的稀疏编码方法,展示了如何使用不同的原子宽度来改善信号的稀疏表示。

随机化算法与主成分分析

本文介绍了随机化算法在主成分分析中的应用,包括算法原理、参数设置和代码示例。

决策阈值调整与模型评估

本文介绍了如何使用TunedThresholdClassifierCV调整分类模型的决策阈值,并使用糖尿病数据集进行示例演示。

葡萄酒数据集介绍

葡萄酒数据集是一个经典的多类分类数据集,包含178个样本,每个样本有13个特征。

高斯混合模型初始化方法比较

本文比较了四种高斯混合模型的初始化方法:kmeans、random、random_from_data和k-means++。通过生成样本数据并使用不同的初始化方法,展示了每种方法的收敛速度和初始化时间。

机器学习模型验证工具

本页面介绍了一个用于验证机器学习模型是否遵循scikit-learn框架约定的工具,包括API兼容性、输入验证和形状检查等。

特征提取工具介绍

本文介绍了多种特征提取工具,包括图像和文本数据的处理方法,以及如何将这些数据转换为机器学习模型可以处理的格式。

D²回归评分函数

本页介绍了D²回归评分函数,这是一种用于评估回归模型性能的度量方法。它通过比较模型预测值和实际值来计算分数,最佳得分为1.0,可能为负值。

聚类评估指标:同质性、完备性和V-度量

本文介绍了聚类评估中的三个关键指标:同质性、完备性和V-度量,这些指标用于衡量聚类结果的质量。

不同聚类算法的比较分析

本文通过生成的二维数据集,比较了多种聚类算法的特性和效果,包括参数敏感度和对不同数据结构的适应性。

使用set_output API配置Transformer输出Pandas DataFrame

本文介绍了如何使用set_output API来配置scikit-learn中的Transformer,使其输出Pandas DataFrame,便于数据分析和可视化。

独立成分分析(ICA)在噪声数据源分离中的应用

本文介绍了独立成分分析(ICA)技术在处理噪声数据源分离问题中的应用,通过模拟三个乐器同时演奏并被三个麦克风记录的场景,展示了如何使用FastICA算法来恢复每个乐器的原始信号。

使用L1正则化的逻辑回归进行MNIST数字分类

本网页介绍了如何使用L1正则化的逻辑回归模型对MNIST数据集中的手写数字进行分类,并展示了模型的稀疏性以及测试得分。

决策树回归与AdaBoost算法

本页面介绍了使用AdaBoost算法增强决策树回归模型的过程,包括数据准备、模型训练与预测以及结果可视化。

机器学习在Iris数据集上的应用

本文通过Iris数据集演示了标签传播、自我训练和支持向量机(SVM)在决策边界生成上的应用。

MaxAbsScaler 数据标准化处理

本文介绍了MaxAbsScaler的作用、参数、使用注意事项以及示例代码。MaxAbsScaler是一种将数据特征缩放到[-1, 1]范围内的标准化方法,适用于机器学习和数据科学领域。

多类别分类的标签二值化

本文介绍了如何使用scikit-learn库中的函数将多类别标签转换为二值化形式,以便用于机器学习算法中。

信任度评估与局部结构保留

本文介绍了一种评估降维后数据信任度的方法,该方法基于局部结构的保留程度,适用于多种降维技术。

计算科恩卡帕系数

本文介绍了如何使用科恩卡帕系数来衡量两个标注者在分类问题上的一致性水平。

协方差估计与正则化

本网页介绍了在统计学中如何使用最大似然估计来计算协方差,并通过正则化来减少其方差,同时介绍了几种不同的正则化参数设置方法。

k-means聚类算法的假设条件演示

本文通过生成不同类型的数据集来展示k-means聚类算法在不同情况下的表现,包括非最优聚类数量、各向异性分布、不等方差和大小不一的聚类。

部分依赖图和个体条件期望

本文介绍了如何使用部分依赖图和个体条件期望(ICE)来分析机器学习模型中特征对预测结果的影响。

图像分类中像素重要性评估

本文介绍了如何使用随机森林算法在人脸数据集中评估像素的重要性,并展示了如何进行并行计算以提高效率。

支持向量机(SVM)分类器与回归分析

本文介绍了支持向量机(SVM)在不同核函数下分类器的绘制方法,并探讨了SVM在回归分析中的应用。

沪ICP备2024098111号-1
上海秋旦网络科技中心:上海市奉贤区金大公路8218号1幢 联系电话:15216758379