本文通过生成包含异常值的数据集,比较了Huber回归和岭回归在处理异常值时的表现。
本文介绍了多种机器学习中的分类器和回归器,包括线性分类器、回归器、变量选择模型、鲁棒回归器以及广义线性模型等。
本文介绍了数据科学中无监督学习的各种技术,包括降维、聚类、双聚类、信号分解、协方差估计、异常检测和密度估计等。
本文介绍了图形Lasso算法,这是一种用于估计稀疏协方差矩阵的L1惩罚估计器。
本网页旨在比较两种流行的非线性降维技术:t-SNE和LLE,并探讨它们在添加数据空洞时的表现。
本页面介绍了Cohen's Kappa一致性统计量的计算方法,这是一种衡量两个标注者在分类问题上达成一致程度的统计指标。
本页面介绍了中位数绝对误差回归损失的计算方法,包括参数定义、计算公式和示例代码。
本文详细介绍了谱聚类算法的原理、参数设置以及应用实例。
本文介绍了支持向量机(SVM)中正则化参数C的作用,并通过代码示例展示了不同C值对模型的影响。
本文介绍了如何根据用户选项确定评分器,并提供了相应的代码示例。
本页面展示了如何利用决策树算法在鸢尾花数据集上进行特征组合和决策边界的绘制。
本文介绍了随机化算法在主成分分析中的应用,包括算法原理、参数设置和代码示例。
本文介绍了如何使用Scikit-learn库中的函数来检索所有继承自BaseEstimator的估计器类。
本页面介绍如何将决策树模型导出为GraphViz格式,并提供了详细的参数说明和示例代码。
本文介绍了几种交叉分解方法,包括PLS典型分析、PLS回归以及典型相关分析(CCA),并通过Python代码示例展示了这些方法的应用。
本页面展示了如何使用Python的scikit-learn库进行多指标网格搜索,并使用决策树分类器进行模型选择和评估。
本文通过分析神经网络的权重,探讨学习行为,使用MNIST数据集训练MLP分类器,并通过可视化权重矩阵来理解学习过程。
本文介绍了如何使用pytest的参数化装饰器来检查评估器是否符合scikit-learn的API规范。
本教程介绍了如何使用PCA和SVM对人脸数据集进行特征提取和分类。
本文通过学习曲线分析了朴素贝叶斯和SVM分类器的模型性能,并探讨了它们的计算成本和统计准确性。
本页面介绍了增量主成分分析(IPCA)的概念和实现,以及如何使用IPCA处理大数据集。
本网页介绍了特征选择的重要性和几种常用的特征选择方法,包括递归特征消除算法和单变量特征选择器等。
本文介绍了覆盖误差这一评估多标签分类模型性能的指标,包括其计算方法、参数说明以及如何使用Python中的sklearn库来计算覆盖误差。
本页面介绍了如何使用scikit-learn库生成随机回归问题,包括参数设置和示例代码。
本文介绍了一种评估降维后数据信任度的方法,该方法基于局部结构的保留程度,适用于多种降维技术。
本文介绍了一种数据标准化方法,通过中心化和基于四分位数范围的缩放来处理数据,适用于机器学习中的预处理步骤。
本文介绍了如何使用RBFSampler和Nystroem方法来近似径向基函数核的特征映射,并在手写数字数据集上使用SVM进行分类。
本文探讨了在数据聚类中使用图连接性来捕捉数据的局部结构,并分析了稀疏连接矩阵的优势和不同链接方法的稳定性。
本网页介绍了使用OneClassSVM模型分析南美洲两种哺乳动物的地理分布情况,包括模型拟合、预测分布和ROC曲线下面积的计算。
本页面展示了在鸢尾花数据集上使用不同SVM分类器的效果,包括线性和非线性模型的决策边界。