本页面展示了如何使用谱聚类算法对数据进行二维聚类,并重新排列数据以展示聚类结果。
本教程介绍了如何使用交叉验证和线性模型对糖尿病数据集进行模型选择和参数调优。
Scikit-learn 是一个开源的机器学习库,用于Python编程语言。本页面介绍Scikit-learn项目的起源、发展、团队成员以及如何引用和支持该项目。
本文介绍了如何使用线性回归模型对糖尿病数据集进行预测,并使用交叉验证方法来可视化预测误差。
本文详细介绍了谱聚类算法的原理、参数设置以及应用实例。
本文介绍了混淆矩阵的概念、计算方法以及在机器学习分类任务中的应用,并通过代码示例展示了如何使用混淆矩阵来评估分类模型的准确度。
本网页通过一个浣熊脸图像的例子,展示了如何使用KBinsDiscretizer进行图像的向量量化处理,并探讨了不同的压缩策略和内存占用情况。
本文介绍了如何使用一种高效的方法来计算一个点与一组点之间的最小距离。
本文介绍了一种在随机梯度下降中使用早停策略来优化线性模型的方法,并通过实验比较了不同停止准则对模型性能的影响。
本页面介绍了如何使用Python的sklearn库生成Friedman #2回归问题的数据集,包括数据的生成方法和参数说明。
本文介绍了如何使用GridSearchCV进行线性模型的参数优化,并通过matplotlib进行结果可视化。
本文介绍了乳腺癌威斯康星数据集,这是一个经典的二分类数据集,用于机器学习领域的分类任务。
本文介绍了Ledoit-Wolf和OAS协方差估计器在分类问题中的应用,并通过实验比较了它们与传统线性判别分析的性能。
本文介绍了如何将PCA和逻辑回归结合起来,通过管道化的方式进行数据的维度降低和分类预测。
本页介绍了D²回归评分函数,这是一种用于评估回归模型性能的度量方法。它通过比较模型预测值和实际值来计算分数,最佳得分为1.0,可能为负值。
本文介绍了如何使用set_output API来配置scikit-learn中的Transformer,使其输出Pandas DataFrame,便于数据分析和可视化。
本页面介绍了Brier得分的概念、计算方法和应用场景,以及如何使用Python的sklearn库来计算Brier得分。
本文介绍了在鸢尾花数据集上应用高斯过程分类(GPC)的示例,包括各向同性和各向异性径向基函数(RBF)核的概率预测。
本文介绍了一种数据标准化方法,通过中心化和基于四分位数范围的缩放来处理数据,适用于机器学习中的预处理步骤。
幂变换是一种参数化的数据转换方法,用于将数据转换为更接近正态分布的形式,以解决非恒定方差或需要正态分布的情况。
本文介绍了SGD分类器支持的多种凸损失函数,并提供了一个比较这些损失函数的图表。
本页面介绍了平均绝对百分比误差(MAPE)回归损失的概念、计算方法和应用示例。
本文介绍了如何使用OneClassSVM模型来预测南美两种哺乳动物的地理分布,并展示了模型的ROC曲线下面积。
本网页介绍了如何使用机器学习可视化API来比较ROC曲线,并展示了如何加载数据、训练支持向量分类器和随机森林分类器,以及如何绘制ROC曲线。
本页面介绍了如何使用特定的算法来计算一组点与另一组点之间的最小距离。
本网页展示了在数据中施加连接图以捕获局部结构的效果,以及不同链接方法对聚类结果的影响。
本网页介绍了随机投影技术在高维数据集中的应用,包括理论基础、代码实现和实验验证。
本页面展示了如何使用单类SVM进行异常检测,包括数据生成、模型训练、预测及结果可视化。
本页面展示了使用K近邻算法进行回归预测的示例,包括如何生成样本数据、训练模型以及使用不同的权重方法来预测数据。
本文介绍了如何使用受限玻尔兹曼机(RBM)进行特征提取,并结合逻辑回归对数字进行分类。