数据集概览

本文介绍了机器学习中常用的数据集,包括玩具数据集、真实世界数据集、生成数据集以及其他数据集的加载方式。

鲁棒协方差估计与异常检测

本文通过葡萄酒数据集的实例,探讨了在实际数据集中进行鲁棒协方差估计的必要性,以及如何使用不同的异常检测工具来理解数据结构。

多维缩放分析示例

本页面展示了如何使用Python和scikit-learn库进行多维缩放分析(MDS)和非度量多维缩放(NMDS)的示例。

鸢尾花数据集的因子分析

本文介绍了如何使用因子分析和主成分分析(PCA)来探索鸢尾花数据集中的潜在模式,并展示了如何通过旋转来优化数据的可视化效果。

模型验证与参数调优指南

本文详细介绍了模型验证和参数调优的方法,包括交叉验证、参数搜索、决策阈值调整和评估指标。

目标变换在回归分析中的应用

本文通过合成数据和艾姆斯房价数据集,探讨了在回归分析中对目标变量进行变换以提高模型预测精度的方法。

孤立森林算法示例

本文介绍了孤立森林算法的基本概念,并通过Python代码示例展示了如何在玩具数据集上训练孤立森林模型,并可视化其决策边界。

半监督文本数据分类

本网页介绍了半监督学习在文本数据集上的分类应用,包括SGD分类器、自我训练分类器和标签传播方法。

半监督学习在乳腺癌数据集上的应用

本文介绍了半监督学习中的自我训练分类器在乳腺癌数据集上的应用,分析了不同阈值对分类器性能的影响。

随机化奇异值分解(SVD)算法详解

本文介绍了随机化奇异值分解(SVD)的算法及其在大规模数据集上的快速应用。

葡萄酒数据集介绍

葡萄酒数据集是一个经典的多类分类数据集,包含178个样本,每个样本有13个特征。

高斯混合模型初始化方法比较

本文比较了四种高斯混合模型的初始化方法:kmeans、random、random_from_data和k-means++。通过生成样本数据并使用不同的初始化方法,展示了每种方法的收敛速度和初始化时间。

特征联合构造器

本页面介绍了如何使用特征联合构造器来组合多个变换器,并通过并行处理提高效率。

多标签排序问题的平均精度计算

本文介绍了多标签排序问题中的评估指标——平均精度(LRAP),并提供了使用Python计算LRAP的示例代码。

层次聚类在二维图像中的应用

本网页介绍了如何使用Ward层次聚类方法对二维图像进行空间约束的聚类处理,并展示了相应的Python代码实现。

支持向量回归模型比较

本文介绍了使用不同的核函数进行支持向量回归(SVR)的比较,包括线性核、多项式核和RBF核。

基因序列的核函数分析

本文介绍了如何使用核函数对基因序列数据进行回归和分类任务的分析。

交叉验证预测误差可视化

本网页展示了如何使用scikit-learn库中的cross_val_predict函数与PredictionErrorDisplay工具来可视化预测误差。

OPTICS聚类算法演示

本页面展示了OPTICS聚类算法的工作原理,包括数据生成、算法应用以及结果的可视化展示。

岭回归系数与L2正则化的关系

本文介绍了岭回归中L2正则化如何影响模型系数,并展示了不同正则化强度下系数的变化。

稀疏矩阵的行缩放操作

本文介绍了如何在Python中使用CSR或CSC格式的稀疏矩阵进行行缩放操作。

零一分类损失函数

本文介绍了零一分类损失函数的计算方法,包括参数说明、返回值以及在多标签分类中的应用。

数据转换方法 - 幂变换

幂变换是一种参数化的数据转换方法,用于将数据转换为更接近正态分布的形式,以解决非恒定方差或需要正态分布的情况。

逻辑回归分类器与鸢尾花数据集

本文介绍了如何使用逻辑回归分类器处理鸢尾花数据集,并展示了决策边界的可视化。

稀疏逆协方差估计

本网页介绍了如何使用图形Lasso估计器从少量样本中学习协方差和稀疏精度矩阵。

数据缺失值处理技术

本文探讨了使用不同的数据填充技术来处理缺失值,包括使用常数0填充、均值填充、k最近邻填充和迭代填充。

最近质心分类法示例

本网页展示了如何使用最近质心分类法对iris数据集进行分类,并绘制了决策边界。

弗里德曼回归问题 #1

本页面介绍了弗里德曼回归问题 #1 的数据生成方法和相关参数。

特征量化变换方法

本文介绍了一种基于分位数信息的特征变换方法,旨在将特征变换为均匀或正态分布,以减少异常值的影响并提高不同尺度变量的可比性。

K近邻回归模型示例

本页面展示了使用K近邻算法进行回归预测的示例,包括如何生成样本数据、训练模型以及使用不同的权重方法来预测数据。

沪ICP备2024098111号-1
上海秋旦网络科技中心:上海市奉贤区金大公路8218号1幢 联系电话:15216758379