鸢尾花数据集分类分析

本文通过鸢尾花数据集,使用SVM分类器进行分类,并分析了混淆矩阵,探讨了模型参数调优对分类结果的影响。

目标编码器与交叉拟合

本文介绍了目标编码器的内部交叉拟合机制,以及它如何帮助防止机器学习模型过拟合。通过构建合成数据集,展示了目标编码器在有无交叉拟合时对模型性能的影响。

线性支持向量机(LinearSVC)示例

本页面展示了如何在使用线性支持向量机(LinearSVC)时获取支持向量。通过matplotlib和sklearn库,我们能够可视化分类边界和支持向量。

稀疏编码信号生成示例

本页面展示了如何使用sklearn库中的make_sparse_coded_signal函数生成稀疏编码信号,包括数据集、字典和编码矩阵的生成过程。

多项式核近似与线性分类器训练

本文介绍了如何使用PolynomialCountSketch高效生成多项式核特征空间近似,以训练近似核化分类器的线性分类器,并在Covtype数据集上进行实验。

数字分类练习教程

本教程介绍了如何使用分类技术对数字数据集进行分类,包括KNN和逻辑回归方法的应用。

调整兰德指数(ARI)在聚类评估中的应用

本文介绍了调整兰德指数(Adjusted Rand Index, ARI)的概念、计算方法和在聚类评估中的应用。

正交匹配追踪算法(OMP)详解

本文详细介绍了正交匹配追踪(OMP)算法的原理、参数设置以及在机器学习中的应用示例。

随机梯度下降与早停策略

本文介绍了一种在随机梯度下降中使用早停策略来优化线性模型的方法,并通过实验比较了不同停止准则对模型性能的影响。

机器学习策略对比

本文探讨了不同的机器学习策略,包括SGD和Adam,以及它们在不同数据集上的表现。

马氏距离与高斯分布数据

本文介绍了如何使用马氏距离来衡量高斯分布数据中单个观测值与分布模式之间的距离,并讨论了稳健协方差估计器在处理异常值时的优势。

乳腺癌威斯康星数据集概览

本文介绍了乳腺癌威斯康星数据集,这是一个经典的二分类数据集,用于机器学习领域的分类任务。

加法卡方核函数介绍

本页面介绍了加法卡方核函数的计算方法,应用场景,以及如何在Python中使用sklearn库进行计算。

高斯混合模型初始化方法比较

本文比较了四种高斯混合模型的初始化方法:kmeans、random、random_from_data和k-means++。通过生成样本数据并使用不同的初始化方法,展示了每种方法的收敛速度和初始化时间。

scikit-learn版本更新历史

scikit-learn是一个流行的Python机器学习库,本文记录了scikit-learn从0.4版本到最新版本的更新历史,包括每个版本的新特性和改进。

无监督学习与降维技术

本文介绍了无监督学习中的降维技术,包括主成分分析(PCA)、随机投影和特征聚合等方法,并讨论了它们在数据预处理中的应用。

支持向量机(SVM)的平局破解示例

本文介绍了在多类分类问题中,支持向量机(SVM)的平局破解参数break_ties对决策边界的影响。

指数卡方核函数详解

本文详细介绍了指数卡方核函数的计算方法、参数设置以及在机器学习中的应用。

高斯量化数据集分类分析

本网页展示了使用高斯量化数据集进行分类分析的过程,包括构建数据集、训练AdaBoost分类器、绘制决策边界和决策分数分布。

聚类分析中的配对混淆矩阵

本文介绍了聚类分析中的配对混淆矩阵,这是一种评估两个聚类结果相似度的方法。

排列测试评分 - 数据科学实例

本网页通过排列测试评分方法,评估交叉验证得分的重要性,并使用Iris数据集进行演示。

多项式计数草图与线性分类器

本网页介绍了如何使用多项式计数草图来近似核方法特征空间,并训练线性分类器以模拟核化分类器的准确性。

数据转换方法 - 幂变换

幂变换是一种参数化的数据转换方法,用于将数据转换为更接近正态分布的形式,以解决非恒定方差或需要正态分布的情况。

随机森林嵌入与降维

本网页介绍了如何使用随机森林嵌入技术进行数据的高维稀疏表示,以及如何利用该技术进行非线性降维和分类。

ROC曲线与交叉验证的方差分析

本网页介绍了如何使用交叉验证来分析接收者操作特征(ROC)曲线的方差,并展示了不同数据集的ROC响应。

单类SVM异常检测示例

本页面展示了如何使用单类SVM进行异常检测,包括数据生成、模型训练、预测及结果可视化。

偏最小二乘回归分析

本网页介绍了偏最小二乘回归分析的基本概念,包括PLS1和PLS2的区别,以及如何使用Python进行CCA分析。

聚类评估指标分析

本文分析了随机标签对聚类评估指标的影响,并通过实验展示了不同指标在固定和变化的类别数量下的表现。

线性模型Lasso在密集与稀疏数据上的应用

本文探讨了线性模型Lasso在处理密集与稀疏数据时的表现,并对比了两种数据格式下的运行速度。

机器学习库scikit-learn 1.0版本更新概览

本文介绍了scikit-learn 1.0版本的新特性、改进和bug修复,包括API的变化、新引入的变换器和回归器等。

沪ICP备2024098111号-1
上海秋旦网络科技中心:上海市奉贤区金大公路8218号1幢 联系电话:15216758379