本文介绍了高斯过程分类(GPC)的概率预测,通过RBF核函数的不同超参数选择,展示了优化对数边际似然(LML)对模型性能的影响。
本网页展示了使用不同分类器对三类数据集进行分类的性能比较,包括支持向量机、L1和L2惩罚的逻辑回归、以及高斯过程分类器。
本网页展示了使用GradientBoostingRegressor、RandomForestRegressor和LinearRegression三种不同的回归预测模型,以及它们的集成模型VotingRegressor在糖尿病数据集上的应用和比较。
本文介绍了多种机器学习中的分类器和回归器,包括线性分类器、回归器、变量选择模型、鲁棒回归器以及广义线性模型等。
本页面展示了如何使用sklearn库中的make_sparse_coded_signal函数生成稀疏编码信号,包括数据集、字典和编码矩阵的生成过程。
本文介绍了如何使用PolynomialCountSketch高效生成多项式核特征空间近似,以训练近似核化分类器的线性分类器,并在Covtype数据集上进行实验。
本文介绍了如何使用sklearn库加载和向量化20新闻组数据集,包括参数设置和数据预处理。
本文详细介绍了模型验证和参数调优的方法,包括交叉验证、参数搜索、决策阈值调整和评估指标。
本网页旨在比较MiniBatchKMeans和BIRCH两种聚类算法在合成数据集上的性能。
本网页通过一个浣熊脸图像的例子,展示了如何使用KBinsDiscretizer进行图像的向量量化处理,并探讨了不同的压缩策略和内存占用情况。
本页面介绍了如何使用递归特征消除(RFE)结合交叉验证来自动调整所选特征的数量。
本文介绍了如何在scikit-learn库中使用set_output方法来配置模型输出为pandas DataFrame格式,并提供了详细的代码示例。
本文介绍了如何使用分类器链来解决多标签分类问题,并通过酵母数据集的实验结果来比较不同模型的性能。
本文介绍了如何将PCA和逻辑回归结合起来,通过管道化的方式进行数据的维度降低和分类预测。
本页面展示了如何使用随机梯度下降(SGD)训练线性支持向量机(SVM)分类器,并绘制出在两个类别可分数据集中的最大分隔超平面。
本文介绍了如何使用Python和机器学习库scikit-learn来可视化多层感知器(MLP)在MNIST数据集上的权重。
本教程展示了如何在使用加权样本的同时,预计算Gram矩阵来拟合ElasticNet模型。
本文介绍了如何使用核函数对基因序列数据进行回归和分类任务的分析。
本页面介绍了增量主成分分析(IPCA)的概念和实现,以及如何使用IPCA处理大数据集。
本文分析了不同异常检测算法在二维数据集上的表现,探讨了这些算法处理多模态数据的能力,并展示了算法在不同情况下的决策边界。
本网页介绍了在统计学中如何使用最大似然估计来计算协方差,并通过正则化来减少其方差,同时介绍了几种不同的正则化参数设置方法。
本文介绍了Matthews相关系数(MCC),这是一种在机器学习中用于衡量二元和多类分类质量的指标。它考虑了真正例、假正例、真负例和假负例,并且被认为是一种平衡的度量,即使在类别大小差异很大的情况下也可以使用。
本文介绍了随机投影技术,一种通过牺牲一定精度来加快处理速度和减小模型大小的降维方法。
本网页介绍了高斯混合模型(GMM)和贝叶斯高斯混合模型(使用狄利克雷过程作为先验)的比较,包括它们的工作原理和在低维空间中的可视化展示。
本网页介绍了随机森林分类器在训练过程中如何通过OOB误差进行模型验证,并提供了相应的Python代码示例。
本网页展示了常规K均值聚类算法与二分K均值聚类算法之间的差异,并提供了代码示例和可视化图表。
本网页展示了如何使用基于哈维森距离度量的布朗树对地理空间数据进行核密度估计。
本文介绍了多维缩放算法SMACOF的基本原理和实现步骤,包括算法的参数设置和应用示例。
本文介绍了单类SVM算法,这是一种无监督学习算法,用于新颖性检测,能够将新数据分类为与训练集相似或不同。
本文介绍了如何使用半径邻居图来计算数据点的邻居关系,并提供了详细的参数说明和代码示例。