本文比较了Theil-Sen估计器与OLS和RANSAC估计器在处理异常值时的性能,并提供了Python代码示例。
本页面展示了如何使用Python和scikit-learn库中的VotingClassifier来计算并可视化不同分类器对同一样本的概率预测结果。
局部异常因子(LOF)是一种无监督异常检测方法,用于计算给定数据点相对于其邻居的局部密度偏差。本文介绍了如何在scikit-learn中使用LOF进行异常检测,并展示了如何生成带有异常值的数据集,拟合模型并绘制结果。
本文介绍了如何使用numpy中的RandomState对象来控制随机数生成,以及其在机器学习中的应用示例。
本文介绍了平均绝对百分比误差(MAPE)的概念、计算方法以及在sklearn库中的使用示例。
本文介绍了如何使用一个函数来计算一个点与一组点之间的最小距离,包括参数设置和代码示例。
本文介绍了混淆矩阵的概念、计算方法以及在机器学习分类任务中的应用,并通过代码示例展示了如何使用混淆矩阵来评估分类模型的准确度。
本文介绍了如何在scikit-learn中使用多类别分类器,包括元估计器的概念、预测概率的计算以及多类策略的实现。
本网页介绍约翰逊-林登斯特劳斯引理,并通过随机投影技术展示如何在保持数据对之间距离的同时降低数据集的维度。
本页面展示了如何使用Python和scikit-learn库来训练L1正则化的逻辑回归模型,并绘制了正则化路径图。
本页面介绍了一个用于验证输入数据并设置或检查特征名称和数量的助手函数。适用于需要输入验证的估计器。
本页面介绍了如何生成一个稀疏对称正定矩阵,并提供了相应的代码示例。
本文介绍了聚类评估中的三个关键指标:同质性、完备性和V-度量,这些指标用于衡量聚类结果的质量。
本文介绍了如何使用pytest的参数化装饰器来检查评估器是否符合scikit-learn的API规范。
本文详细介绍了稀疏编码算法的工作原理,参数设置以及在Python中使用sklearn库进行稀疏编码的示例代码。
本文介绍了如何使用Python中的scikit-learn库来加载和处理文本数据集,包括设置文件编码、随机打乱数据、选择特定文件扩展名等。
本文介绍了如何使用Python进行多维尺度分析(MDS)和非度量多维尺度分析(NMDS),并通过代码示例展示了两种方法在数据可视化中的应用。
本教程展示了如何在使用加权样本的同时,预计算Gram矩阵来拟合ElasticNet模型。
本网页介绍了多种聚类算法的演示和比较,包括K-Means、层次聚类、均值漂移等,并探讨了聚类算法在图像分割、颜色量化等方面的应用。
本网页介绍了在机器学习中,如何通过单调约束来优化梯度提升树模型,使其更好地捕捉数据的总体趋势,而忽略局部波动。
本文介绍了如何通过PCA降维和网格搜索结合交叉验证来评估和选择模型,以达到最佳的准确率和模型复杂度的平衡。
本文探讨了如何使用排列重要性来评估随机森林分类器中特征的重要性,并展示了如何处理多重共线性问题,以提高模型的准确性。
本文介绍了如何使用卡方检验进行特征选择,以提高分类任务的性能。
本文分析了不同异常检测算法在二维数据集上的表现,探讨了这些算法处理多模态数据的能力,并展示了算法在不同情况下的决策边界。
本文详细介绍了最新版scikit-learn中的bug修复、性能提升以及新增的关键特性。
本文介绍了多种数据生成器,包括分类、聚类、回归和流形学习的数据生成器,以及它们在机器学习中的应用。
本网页展示了如何计算Lasso、Lasso-LARS和Elastic Net正则化路径上的系数。
本示例展示了如何使用scikit-learn库来识别0到9的手写数字图像。
本网页介绍了如何使用正交匹配追踪算法对含有噪声的稀疏信号进行恢复处理。
本页面介绍了弗里德曼回归问题 #1 的数据生成方法和相关参数。