生成双聚类结构数组

本文介绍了如何生成一个用于双聚类的常数块对角结构数组,包括参数说明、返回值以及示例代码。

稀疏编码信号生成示例

本页面展示了如何使用sklearn库中的make_sparse_coded_signal函数生成稀疏编码信号,包括数据集、字典和编码矩阵的生成过程。

多项式核近似与线性分类器训练

本文介绍了如何使用PolynomialCountSketch高效生成多项式核特征空间近似,以训练近似核化分类器的线性分类器,并在Covtype数据集上进行实验。

文本数据加载与处理

本文介绍了如何加载和处理文本数据,以便用于分类或聚类算法。

机器学习模型评估与优化

本文介绍了机器学习中模型评估和优化的多种方法,包括交叉验证、超参数优化、ROC曲线等关键概念和技术。

K-Means++ 聚类算法初始化

本页面介绍了K-Means++聚类算法的初始化过程,包括算法参数、原理和代码示例。

层次聚类分析:结构化与非结构化

本网页介绍了层次聚类分析中结构化与非结构化的区别,并通过瑞士卷数据集的实例演示了两种方法的应用。

目标变换在回归分析中的应用

本文通过合成数据和艾姆斯房价数据集,探讨了在回归分析中对目标变量进行变换以提高模型预测精度的方法。

高斯过程分类器(GPC)在XOR数据集上的应用

本文介绍了高斯过程分类器(GPC)在XOR数据集上的应用,比较了RBF核和DotProduct核的性能,并提供了详细的代码实现。

特征提取工具介绍

本文介绍了多种特征提取工具,包括图像和文本数据的处理方法,以及如何将这些数据转换为机器学习模型可以处理的格式。

稀疏矩阵的均值和方差计算

本页面介绍了如何在Python中使用稀疏矩阵计算均值和方差,并提供了示例代码。

特征重要性评估

本文介绍了如何使用随机森林模型来评估特征在分类任务中的重要性,并比较了基于不纯度减少和排列重要性两种方法。

平均精度(AP)计算方法

本页面介绍了如何计算平均精度(AP),包括其公式、参数和在机器学习中的应用示例。

多标签排序问题的平均精度计算

本文介绍了多标签排序问题中的评估指标——平均精度(LRAP),并提供了使用Python计算LRAP的示例代码。

特征离散化在分类数据集中的应用

本文通过合成的分类数据集,展示了特征离散化技术如何通过将特征分解成多个区间,并使用独热编码,来增强线性分类器的性能。同时,对比了在线性可分和非线性可分数据集上,特征离散化对分类器性能的影响。

手写数字识别数据集使用指南

本文介绍了如何使用scikit-learn库中的手写数字数据集进行机器学习任务,包括数据加载、图像展示以及相关参数说明。

使用预计算的Gram矩阵和加权样本拟合ElasticNet

本教程展示了如何在使用加权样本的同时,预计算Gram矩阵来拟合ElasticNet模型。

Cython 开发技巧

本文介绍了在使用 scikit-learn 时,如何高效地利用 Cython 进行开发,包括性能优化、OpenMP 使用、类型定义等实用技巧。

支持向量回归模型比较

本文介绍了使用不同的核函数进行支持向量回归(SVR)的比较,包括线性核、多项式核和RBF核。

核岭回归与支持向量回归的比较

本文比较了核岭回归(Kernel Ridge Regression)和支持向量回归(Support Vector Regression)在不同数据集上的表现,包括它们的模型形式、损失函数、训练和预测时间。

非负矩阵分解(NMF)介绍

本网页介绍了非负矩阵分解(NMF)的概念、算法和应用示例。NMF是一种用于数据降维、源分离或主题提取的矩阵分解技术。

使用scikit-learn的评分器衡量模型性能

本文介绍了如何使用scikit-learn库中的评分器(scorer)来衡量模型性能。

K-Means算法初始化策略的影响评估

本文评估了不同的K-Means算法初始化策略对于算法收敛鲁棒性的影响,通过分析聚类中心的相对标准偏差来衡量。

ROC与DET曲线比较分类器性能

本文介绍了如何使用ROC和DET曲线来比较不同分类器的性能,并提供了相应的Python代码实现。

岭回归与正则化

本文介绍了岭回归和正则化的概念,以及如何通过调整正则化参数来平衡模型的预测准确性和泛化能力。

K-Means聚类算法演示

本页面展示了K-Means聚类算法在手写数字数据集上的应用,包括不同初始化策略的比较、聚类质量评估以及结果的可视化展示。

FastICA算法详解

本文介绍了独立成分分析(ICA)的FastICA算法实现,包括算法参数、原理和应用示例。

Pytest 参数化估计器检查

本文介绍了如何使用Pytest的装饰器来参数化估计器检查,确保估计器遵循scikit-learn的约定。

随机抽样算法详解

本文详细介绍了随机抽样算法的实现方式,包括无替换抽样的概念、参数设置、不同抽样方法的适用场景以及代码示例。

机器学习库scikit-learn 1.0版本更新概览

本文介绍了scikit-learn 1.0版本的新特性、改进和bug修复,包括API的变化、新引入的变换器和回归器等。

沪ICP备2024098111号-1
上海秋旦网络科技中心:上海市奉贤区金大公路8218号1幢 联系电话:15216758379