scikit-learn 1.4版本发布亮点

本文介绍了scikit-learn 1.4版本的新特性、改进和bug修复。

KDDCup 99 数据集加载指南

本网页提供了关于如何加载KDDCup 99数据集的详细指南,包括参数设置和数据集特点。

RANSAC算法处理异常值

本页面介绍了如何使用RANSAC算法来处理数据中的异常值,并通过Python代码展示了其在异常值存在时的线性回归拟合效果。

正则化参数优化与模型性能

本文通过Elastic-Net回归模型探讨了正则化参数对训练和测试数据集性能的影响,并使用解释方差R^2作为性能度量。

Linnerud 数据集加载与返回

本文介绍了如何加载和使用Linnerud数据集,适用于多输出回归任务,提供了详细的参数说明和使用示例。

Lasso回归路径计算

本文介绍了使用坐标下降法计算Lasso回归路径的过程,包括参数设置、优化函数、以及如何使用Python实现。

多项式特征与线性回归拟合非线性函数

本文介绍了如何使用带有多项式特征的线性回归来近似非线性函数,并通过交叉验证来评估模型的过拟合或欠拟合。

混淆矩阵计算与评估

本文介绍了混淆矩阵的概念、计算方法以及在机器学习分类任务中的应用,并通过代码示例展示了如何使用混淆矩阵来评估分类模型的准确度。

异常检测:孤立森林示例

本文介绍了如何使用孤立森林算法进行异常检测,并展示了如何在Python中生成数据、训练模型以及可视化决策边界。

不平衡数据集的样本权重估计

本文介绍了如何在不平衡数据集中估计样本权重,以帮助改善分类模型的性能。

数据预处理技术概览

本文介绍了多种数据预处理技术,包括二值化、特征缩放、编码器等,旨在帮助数据科学家和工程师更好地准备数据以进行机器学习。

机器学习策略对比

本文探讨了不同的机器学习策略,包括SGD和Adam,以及它们在不同数据集上的表现。

葡萄酒数据集介绍

葡萄酒数据集是一个经典的多类分类数据集,包含178个样本,每个样本有13个特征。

数据预处理工具类介绍

本文介绍了几种在机器学习中常用的数据预处理工具类,包括LabelBinarizer、MultiLabelBinarizer和LabelEncoder的使用方法和应用场景。

神经网络学习行为分析

本文通过分析神经网络的权重,探讨学习行为,使用MNIST数据集训练MLP分类器,并通过可视化权重矩阵来理解学习过程。

偏差-方差分解与集成学习

本文通过比较单个估计器与集成方法(如Bagging)在回归问题中的偏差-方差分解,探讨了模型的偏差、方差和噪声对预测误差的影响。

梯度提升正则化策略分析

本网页分析了梯度提升算法中不同的正则化策略,包括学习率调整、随机梯度提升以及特征采样等方法对模型性能的影响。

不同聚类算法的比较分析

本文通过生成的二维数据集,比较了多种聚类算法的特性和效果,包括参数敏感度和对不同数据结构的适应性。

K最近邻分类器与网格搜索优化

本文介绍了如何使用K最近邻分类器结合网格搜索进行参数优化,并利用缓存提高计算效率。

AdaBoost算法在多标签分类问题中的应用

本文介绍了AdaBoost算法在多标签分类问题上的应用,包括数据集的创建、模型训练、性能分析以及算法的收敛性。

KMeans与MiniBatchKMeans聚类算法比较

本文介绍了KMeans与MiniBatchKMeans两种聚类算法的比较,并通过生成数据集、执行聚类、比较结果和可视化差异来展示这两种算法的不同之处。

特征离散化与线性分类器的性能

本文探讨了特征离散化技术如何影响线性分类器在不同数据集上的性能表现。

交叉验证预测误差可视化

本网页展示了如何使用scikit-learn库中的cross_val_predict函数与PredictionErrorDisplay工具来可视化预测误差。

新闻组数据集加载指南

本页面提供了如何加载和使用20个新闻组数据集的详细指南,包括参数设置和示例代码。

机器学习中的模型拟合检查

本文介绍了在机器学习库scikit-learn中如何使用__sklearn_is_fitted__方法来检查模型是否已经拟合,以及如何自定义估计器类。

分类器决策边界的可视化

本文通过可视化不同分类器的决策边界,帮助理解各种机器学习算法在不同数据集上的表现。

列变换器与异构数据源

本网页介绍了如何使用列变换器处理包含不同类型特征的数据集,并通过20个新闻组数据集示例展示了具体的实现方法。

特征量化变换方法

本文介绍了一种基于分位数信息的特征变换方法,旨在将特征变换为均匀或正态分布,以减少异常值的影响并提高不同尺度变量的可比性。

K-Means与MiniBatchKMeans聚类算法性能比较

本文对比了K-Means和MiniBatchKMeans两种聚类算法的性能,并展示了如何生成数据集、执行聚类以及结果的可视化。

图像量化处理示例

本网页展示了如何使用K-Means聚类算法对夏宫图像进行颜色量化处理,将颜色数量从96,615种减少到64种,同时保持图像的整体外观质量。

沪ICP备2024098111号-1
上海秋旦网络科技中心:上海市奉贤区金大公路8218号1幢 联系电话:15216758379