特征重要性评估

本文介绍了如何使用随机森林模型来评估特征在分类任务中的重要性,并比较了基于不纯度减少和排列重要性两种方法。

精确度计算方法

本文介绍了精确度的计算方法,包括二分类和多分类情况下的计算公式和参数设置。

PCA与逻辑回归的管道化处理

本文介绍了如何将PCA和逻辑回归结合起来,通过管道化的方式进行数据的维度降低和分类预测。

梯度提升算法与模型优化

本网页探讨了如何使用梯度提升算法进行机器学习模型的优化,并通过随机森林的OOB误差和交叉验证来估计最优迭代次数。

ColumnTransformer的使用和参数详解

本文详细介绍了ColumnTransformer的使用方法和参数配置,帮助理解如何在数据预处理中应用这一工具。

平均绝对百分比误差(MAPE)

本文介绍了平均绝对百分比误差(MAPE)的概念、计算方法以及在sklearn库中的使用示例。

RBF核函数与SVM分类器的近似特征映射

本网页介绍了如何使用RBFSampler和Nystroem近似RBF核函数的特征映射,并在手写数字数据集上使用SVM进行分类。比较了在原始空间中使用线性SVM、使用近似映射的线性SVM以及核化SVM的结果。

压缩感知:L1正则化下的断层成像重建

本页面介绍了如何利用L1正则化技术进行断层成像的图像重建。

生成棋盘状数组以进行双聚类分析

本页面提供了一个用于生成棋盘状结构数组的函数,该数组可用于双聚类分析。

聚类分析中的配对混淆矩阵

本文介绍了聚类分析中的配对混淆矩阵,这是一种评估两个聚类结果相似度的方法。

数字数据集嵌入技术比较

本文介绍了如何使用不同的嵌入技术对数字数据集进行处理,并比较了各种方法的效果。

特征选择与F统计量计算

本页面介绍了特征选择的概念,F统计量的计算方法,以及如何在Python中使用sklearn库进行特征选择和F统计量的计算。

糖尿病数据集分析

本文介绍了如何加载和分析糖尿病数据集,包括数据的维度、特征和目标变量的描述,以及如何使用Python进行数据加载和基本操作。

随机森林与梯度提升树模型性能比较

本文比较了随机森林(RF)和直方图梯度提升树(HGBT)模型在回归数据集上的得分和计算时间。

随机投影技术在高维数据集中的应用

本网页介绍了随机投影技术在高维数据集中的应用,包括理论基础、代码实现和实验验证。

稳健线性估计方法比较

本文介绍了如何使用不同的稳健线性估计方法来拟合一个正弦函数,并比较了在不同情况下它们的表现。

召回率计算指南

本文介绍了召回率的计算方法,包括不同参数设置下的计算方式,以及如何使用Python进行召回率的计算。

多指标参数搜索与评估

本文介绍了如何使用scikit-learn库中的GridSearchCV进行多指标参数搜索,并通过图形化展示评估结果。

线性回归模型实例

本文介绍了如何使用scikit-learn库中的线性回归模型来预测糖尿病数据集的进展情况。

多类分类器性能比较

本网页展示了使用不同分类器对三类数据集进行分类的性能比较,包括支持向量机、L1和L2惩罚的逻辑回归、以及高斯过程分类器。

数据集概览

本文介绍了机器学习中常用的数据集,包括玩具数据集、真实世界数据集、生成数据集以及其他数据集的加载方式。

K均值聚类与轮廓分析

本网页通过轮廓分析方法来评估K均值聚类算法中不同聚类数量的优劣。

近邻分类与邻域成分分析比较

本文比较了使用和不使用邻域成分分析的最近邻分类方法,并展示了通过欧几里得距离在原始特征上以及在邻域成分分析学习到的变换后进行分类时的类决策边界。

非负最小二乘法与普通最小二乘法比较

本文比较了非负最小二乘法(NNLS)和普通最小二乘法(OLS)在拟合线性模型时的表现,包括回归系数的比较和模型的稀疏性。

scikit-learn版本更新历史

scikit-learn是一个流行的Python机器学习库,本文记录了scikit-learn从0.4版本到最新版本的更新历史,包括每个版本的新特性和改进。

多层感知器中的正则化参数研究

本网页探讨了在多层感知器中不同正则化参数alpha值对合成数据集的影响,并展示了如何通过调整alpha值来控制模型的过拟合和欠拟合问题。

稀疏编码与Ricker小波变换

本网页介绍了稀疏编码技术,特别是使用Ricker小波变换对信号进行稀疏表示的方法。通过比较不同的稀疏编码方法,展示了如何使用不同的原子宽度来改善信号的稀疏表示。

线性模型与网格搜索

本文介绍了如何使用GridSearchCV进行线性模型的参数优化,并通过matplotlib进行结果可视化。

鸢尾花数据集介绍

本网页介绍了著名的鸢尾花数据集,包括数据集的基本信息、参数、返回值以及如何在Python中加载和使用该数据集。

Matthews相关系数计算

本文介绍了Matthews相关系数(MCC),这是一种在机器学习中用于衡量二元和多类分类质量的指标。它考虑了真正例、假正例、真负例和假负例,并且被认为是一种平衡的度量,即使在类别大小差异很大的情况下也可以使用。

沪ICP备2024098111号-1
上海秋旦网络科技中心:上海市奉贤区金大公路8218号1幢 联系电话:17898875485