本文比较了不同异常检测算法在2D数据集上的表现,包括OneClassSVM、SGDOneClassSVM、EllipticEnvelope、IsolationForest和LocalOutlierFactor等。
本页面介绍了F1分数的计算方法,包括其定义、公式、参数以及在不同情况下的应用。
本指南旨在帮助开发者了解如何为开源项目贡献代码,报告问题,并参与项目的持续集成和性能监控。
本文探讨了在构建估计器前如何处理缺失值,包括使用常数、均值、中位数或众数等方法。
本网页展示了如何使用AgglomerativeClustering和scipy中的dendrogram方法绘制层次聚类的树状图。
本文介绍了多种机器学习中的分类器和回归器,包括线性分类器、回归器、变量选择模型、鲁棒回归器以及广义线性模型等。
本文介绍了Theil-Sen回归分析方法,并通过代码示例展示了其在处理包含异常值的数据集时的鲁棒性。
本文通过生成的回归数据集,展示了Huber回归和岭回归在面对异常值时的不同表现,并分析了Huber回归参数epsilon对模型的影响。
本网页旨在比较两种流行的非线性降维技术:t-SNE和LLE,并探讨它们在添加数据空洞时的表现。
本文介绍了Pinball Loss在量化回归中的应用,包括其参数设置、计算方法和示例代码。
本文介绍了如何使用互信息估计方法进行特征选择,并提供了代码示例。
本文介绍了如何使用Scikit-learn库中的函数来检索所有继承自BaseEstimator的估计器类。
本页面介绍了数据归一化的概念、方法和在机器学习中的应用。
本网页介绍了ROC曲线和DET曲线在二元分类任务中的比较,包括它们的定义、绘制方法以及如何使用Python的scikit-learn库来实现。
本文比较了PCA和KernelPCA在数据投影上的差异,展示了KernelPCA在非线性数据分离上的优势。
本页面介绍了如何在Python中使用稀疏矩阵计算均值和方差,并提供了示例代码。
本文介绍了如何使用随机梯度下降(SGD)训练的线性支持向量机(SVM)来处理一个可分离的数据集,并展示了如何绘制决策边界和数据点。
本文介绍了一种基于局部异常因子(LOF)的无监督异常检测方法,该方法通过计算给定数据点与其邻居的局部密度偏差来识别异常值。
scikit-learn是一个流行的Python机器学习库,本文记录了scikit-learn从0.4版本到最新版本的更新历史,包括每个版本的新特性和改进。
本文介绍了覆盖误差这一评估多标签分类模型性能的指标,包括其计算方法、参数说明以及如何使用Python中的sklearn库来计算覆盖误差。
本网页详细介绍了K-means聚类算法的参数设置、工作原理以及Python代码实现。
本页面展示了等值回归算法和线性回归算法在处理具有均匀同质噪声的数据时的效果对比。
本文介绍了如何使用scikit-learn库中的线性回归模型来预测糖尿病数据集的进展情况。
本页面介绍了如何将数组转换为浮点数类型,包括转换过程中的参数设置和数据类型处理。
本网页展示了如何计算Lasso、Lasso-LARS和Elastic Net正则化路径上的系数。
本文介绍了局部异常因子(LOF)算法在新颖性检测中的应用,包括算法原理、参数设置、代码实现和结果展示。
本文介绍了如何使用部分依赖图和个体条件期望(ICE)来分析机器学习模型中特征对预测结果的影响。
本文介绍了Matthews相关系数(MCC),这是一种在机器学习中用于衡量二元和多类分类质量的指标。它考虑了真正例、假正例、真负例和假负例,并且被认为是一种平衡的度量,即使在类别大小差异很大的情况下也可以使用。
本文探讨了机器学习中模型的偏差、方差和噪声问题,并介绍了如何通过验证曲线和学习曲线来评估模型性能。