局部异常因子(LOF)是一种无监督异常检测方法,用于计算给定数据点与其邻居的局部密度偏差。本网页介绍了如何使用LOF进行异常检测,包括生成带有异常值的数据、模型拟合、结果绘图等步骤。
本指南详细介绍了如何使用雅卡尔相似系数来评估分类模型的性能,包括参数设置、代码示例和不同情况下的计算方法。
本页面展示了如何使用PCA方法对鸢尾花数据集进行降维,并在三维空间中进行可视化展示。
本文比较了非负最小二乘法(NNLS)和普通最小二乘法(OLS)在拟合线性模型时的表现,包括回归系数的比较和模型的稀疏性。
本页面展示了如何使用Python和matplotlib库来可视化不同的机器学习损失函数,包括零一损失、合页损失、感知器损失等。
本文介绍了如何使用PolynomialCountSketch高效生成多项式核特征空间近似,以训练近似核化分类器的线性分类器,并在Covtype数据集上进行实验。
本页面介绍了如何对输入的数组、列表或类似结构进行验证,包括数据类型、数值检查、稀疏矩阵格式转换等。
本页面展示了如何使用Python和scikit-learn库进行多维缩放分析(MDS)和非度量多维缩放(NMDS)的示例。
本页面介绍了中位数绝对误差回归损失的计算方法,包括参数定义、计算公式和示例代码。
本文详细介绍了谱聚类算法的原理、参数设置以及应用实例。
本文介绍了如何在包含噪声的数据集上提高分类模型的精度,通过添加非信息性特征到鸢尾花数据集,并使用支持向量机(SVM)进行分类,对比了单变量特征选择前后模型的精度和权重变化。
本页面介绍了如何使用排列测试来评估交叉验证分数的重要性,并解释了p值在统计学上的意义。
本文介绍了如何使用scikit-learn库加载森林覆盖类型数据集,并提供了详细的参数说明和示例代码。
本文介绍了Pinball Loss在量化回归中的应用,包括其参数设置、计算方法和示例代码。
本网页探讨了在多层感知器中不同正则化参数alpha值对合成数据集的影响,并展示了如何通过调整alpha值来控制模型的过拟合和欠拟合问题。
本文介绍了均方误差回归损失的计算方法,包括参数定义、计算公式和示例代码。
本文介绍了高斯过程分类器(GPC)在鸢尾花数据集上的应用,包括各向同性和各向异性径向基函数(RBF)核的使用和比较。
本文比较了PCA和KernelPCA在数据投影上的差异,展示了KernelPCA在非线性数据分离上的优势。
本页面介绍了层次聚类算法在瑞士卷数据集上的应用,包括无结构和有结构的聚类方法,并提供了相应的Python代码示例。
本文介绍了轮廓系数的计算方法,这是一种衡量样本聚类质量的指标,包括其定义、计算公式和应用实例。
本页面展示了如何使用基于邻居的查询(特别是核密度估计)来处理地理空间数据,使用基于Haversine距离度量的球面坐标。
本网页介绍了如何使用非负矩阵分解(NMF)和潜在狄利克雷分配(LDA)对文档集合进行主题提取,并展示了使用Python和scikit-learn库实现的代码示例。
本页面展示了OPTICS聚类算法的工作原理,包括数据生成、算法应用以及结果的可视化展示。
本文介绍了如何使用卡方检验进行特征选择,以提高分类任务的性能。
本网页介绍了如何使用Python中的matplotlib和sklearn库来绘制决策树和多层感知器模型的偏依赖图,并通过API进行快速定制。
本文介绍了如何使用逻辑回归分类器处理鸢尾花数据集,并展示了决策边界的可视化。
本页面介绍了如何使用交叉验证方法来评估机器学习模型的性能。
本文介绍了余弦相似度的概念,以及如何在Python中使用sklearn库计算两个数据集之间的余弦相似度。
本页面展示了如何使用高斯过程分类器对数据进行分类,并预测分类的概率。
本文介绍了如何计算接收者操作特征曲线下面积(ROC AUC)的方法,包括二进制、多类和多标签分类的应用场景。