本文通过生成包含异常值的数据集,比较了Huber回归和岭回归在处理异常值时的表现。
本网页展示了多种聚类算法的演示和比较,包括K-Means、层次聚类、均值漂移等,并探讨了聚类性能评估和特征选择的方法。
本页面介绍了F1分数的计算方法,包括其定义、公式、参数以及在不同情况下的应用。
本文比较了非负最小二乘法(NNLS)和普通最小二乘法(OLS)在拟合线性模型时的表现,包括回归系数的比较和模型的稀疏性。
本文对比了传统的主成分分析(PCA)和核主成分分析(KernelPCA)在数据投影上的差异,展示了KernelPCA在非线性数据分离上的优势。
本文介绍了如何使用谱聚类算法对文档进行双聚类处理,并比较了该方法与传统的MiniBatchKMeans聚类算法的效果。
本网页介绍了层次聚类分析中结构化与非结构化的区别,并通过瑞士卷数据集的实例演示了两种方法的应用。
本网页展示了不同在线求解器在手写数字数据集上的性能比较。
本网页介绍约翰逊-林登斯特劳斯引理,并通过随机投影技术展示如何在保持数据对之间距离的同时降低数据集的维度。
本文介绍了如何在scikit-learn库中使用set_output方法来配置模型输出为pandas DataFrame格式,并提供了详细的代码示例。
本网页介绍了半监督学习在文本数据集上的分类应用,包括SGD分类器、自我训练分类器和标签传播方法。
葡萄酒数据集是一个经典的多类分类数据集,包含178个样本,每个样本有13个特征。
本页面介绍了轮廓系数的计算方法,包括其定义、计算过程以及在聚类分析中的应用。
本文通过合成的分类数据集,展示了特征离散化技术如何通过将特征分解成多个区间,并使用独热编码,来增强线性分类器的性能。同时,对比了在线性可分和非线性可分数据集上,特征离散化对分类器性能的影响。
本文介绍了如何使用PowerTransformer和QuantileTransformer将不同分布的数据映射到正态分布,并分析了变换前后的数据可视化效果。
本页面展示了如何使用特征聚合技术将相似的特征合并在一起,并通过Python代码和图表进行演示。
本页面介绍了使用AdaBoost算法增强决策树回归模型的过程,包括数据准备、模型训练与预测以及结果可视化。
本页面介绍了均值漂移算法的基本概念和实现,包括算法的数学原理、Python代码示例和可视化结果。
本文介绍了无监督学习中的降维技术,包括主成分分析(PCA)、随机投影和特征聚合等方法,并讨论了它们在数据预处理中的应用。
本文介绍了均值绝对误差回归损失的计算方法,包括参数说明、返回值以及示例代码。
本文通过一个合成数据集,展示了逻辑回归和线性回归模型如何对数据进行分类。
本指南旨在为开发者提供机器学习可视化API的详细介绍,包括如何使用API进行数据可视化和绘图工具的开发与维护。
本页面展示了OPTICS聚类算法的工作原理,包括数据生成、算法应用以及结果的可视化展示。
本文详细介绍了D^2回归评分函数,包括其定义、计算方法、参数说明以及实际应用示例。
本文介绍了精确度的计算方法,包括二分类和多分类情况下的计算公式和参数设置。
本文通过生成不同类型的数据集来展示k-means聚类算法在不同情况下的表现,包括非最优聚类数量、各向异性分布、不等方差和大小不一的聚类。
本网页展示了如何使用基于哈维森距离度量的布朗树对地理空间数据进行核密度估计。
本指南提供了模型评估中使用的各类指标的详细说明,包括分类、回归、聚类和双聚类评估指标。
本文介绍了等渗回归算法,该算法在最小化训练数据的均方误差的同时,寻找函数的非递减近似。与线性回归模型相比,等渗回归作为一种非参数模型,除了单调性外,不假设目标函数的任何形状。
本文分析了随机标签对聚类评估指标的影响,并通过实验展示了不同指标在固定和变化的类别数量下的表现。