本文介绍了如何使用排列测试来评估交叉验证分数的统计显著性,以及如何解释得到的p值。
本网页展示了使用不同分类器对三类数据集进行分类的性能比较,包括支持向量机、L1和L2惩罚的逻辑回归、以及高斯过程分类器。
本页面介绍高斯过程模型,包括分类器、回归器以及多种核函数。
本文比较了主成分回归(PCR)和偏最小二乘回归(PLS)在一个小数据集上的表现,展示了在目标变量与数据中的某些低方差方向强相关时,PLS如何优于PCR。
本页面介绍了如何计算曲线下面积(AUC)以及ROC曲线的基本概念和应用。
本网页展示了不同在线求解器在手写数字数据集上的性能比较。
本文介绍了非负最小二乘法与普通最小二乘法在回归系数估计上的比较,并提供了相应的Python代码示例。
本页面介绍了如何使用sklearn库生成一个具有稀疏不相关设计和少量信息特征的回归问题数据集。
本文讨论了在模型选择过程中使用嵌套交叉验证和非嵌套交叉验证的策略,以及它们在优化模型参数时的差异。
本文介绍了均方对数误差回归损失的概念、参数、使用方法以及在不同情况下的应用示例。
本页面介绍了加法卡方核函数的计算方法,应用场景,以及如何在Python中使用sklearn库进行计算。
本页面展示了如何使用Python中的逻辑回归模型对鸢尾花数据集进行分析,并可视化其决策边界。
本文介绍了Fowlkes-Mallows指数的计算方法,这是一种衡量两个聚类结果相似度的指标。
本文比较了PCA和KernelPCA在数据投影上的差异,展示了KernelPCA在非线性数据分离上的优势。
本文介绍了如何使用Python和机器学习库scikit-learn来可视化多层感知器(MLP)在MNIST数据集上的权重。
本文介绍了如何使用scikit-learn库中的手写数字数据集进行机器学习任务,包括数据加载、图像展示以及相关参数说明。
本文介绍了如何使用标签传播模型在只有少量标签的情况下对手写数字数据集进行分类。
本文探讨了特征离散化技术如何影响线性分类器在不同数据集上的性能表现。
本页面介绍了增量主成分分析(IPCA)的概念和实现,以及如何使用IPCA处理大数据集。
幂变换是一种参数化的数据转换方法,用于将数据转换为更接近正态分布的形式,以解决非恒定方差或需要正态分布的情况。
本网页介绍了如何使用图形Lasso估计器从少量样本中学习协方差和稀疏精度矩阵。
本文介绍了精确度的计算方法,包括二分类和多分类情况下的计算公式和参数设置。
本页面展示了一维核密度估计的原理和实现,包括直方图的局限性和不同核函数的应用。
本网页展示了层次聚类算法在数字数据集上的应用,包括不同链接策略的效果比较。
本页面展示了如何使用高斯过程分类器对数据进行分类,并预测分类的概率。
本网页展示了常规K均值聚类算法与二分K均值聚类算法之间的差异,并提供了代码示例和可视化图表。
本文介绍了如何将图像转换为图结构,其中像素之间的连接由梯度值加权。
本页面介绍了如何使用Ledoit-Wolf方法估计协方差矩阵,并提供了Python代码示例。
本页面展示了如何使用线性回归模型对数据进行分析和预测,包括模型的构建、训练、预测以及评估过程。
本文介绍了scikit-learn 1.0版本的新特性、改进和bug修复,包括API的变化、新引入的变换器和回归器等。