Warning: file_get_contents(/var/www/html/ad/index.json): Failed to open stream: No such file or directory in /var/www/html/assist_functions.php on line 203

Warning: Trying to access array offset on value of type null in /var/www/html/assist_functions.php on line 205

Warning: file_get_contents(/var/www/html/ad/index.json): Failed to open stream: No such file or directory in /var/www/html/assist_functions.php on line 219

Warning: Trying to access array offset on value of type null in /var/www/html/assist_functions.php on line 221
scikit-learn技术文档

局部异常因子(LOF)异常检测方法

局部异常因子(LOF)是一种无监督异常检测方法,用于计算给定数据点与其邻居的局部密度偏差。本网页介绍了如何使用LOF进行异常检测,包括生成带有异常值的数据、模型拟合、结果绘图等步骤。

分类器的概率校准

本文介绍了如何对分类器进行概率校准,并通过Brier分数评估校准后的概率质量。比较了高斯朴素贝叶斯分类器在未校准、sigmoid校准和等温校准下的性能。

高斯过程分类(GPC)的等概率线示例

本页面展示了一个二维分类示例,其中预测概率的等概率线被清晰地描绘出来。通过学习核函数,我们能够预测分类结果,并展示出分类边界。

梯度提升树的OOB估计

本文介绍了梯度提升树中OOB估计的概念、计算方法以及如何使用OOB估计来确定模型的最佳迭代次数。

异常检测算法比较

本文比较了不同异常检测算法在2D数据集上的表现,包括OneClassSVM、SGDOneClassSVM、EllipticEnvelope、IsolationForest和LocalOutlierFactor等。

Cohen's Kappa一致性统计量计算

本页面介绍了Cohen's Kappa一致性统计量的计算方法,这是一种衡量两个标注者在分类问题上达成一致程度的统计指标。

独立成分分析(ICA)与主成分分析(PCA)比较

本文介绍了独立成分分析(ICA)的概念、实现和与主成分分析(PCA)的比较。通过模拟数据的生成和分析,展示了ICA在信号分离领域的应用。

梯度提升中的早停技术

本文介绍了梯度提升中的早停技术,通过加州房价数据集的案例,展示了如何使用早停技术来优化模型性能和提高训练效率。

流形学习技术比较

本文探讨了t-SNE和LLE两种流形学习技术在Swiss Roll数据集上的表现,并分析了它们在数据中添加空洞时的处理方式。

贝叶斯岭回归与自动相关性确定

本文介绍了贝叶斯岭回归和自动相关性确定(ARD)在回归分析中的应用,包括模型的健壮性、系数的恢复、以及多项式特征扩展的使用。

模型特征重要性分析

本文介绍了如何通过随机排列特征值的方法来评估模型中各个特征的重要性,并探讨了该方法的优势和局限性。

手写数字数据集的流形学习技术比较

本文介绍了在手写数字数据集上应用多种流形学习技术,并通过可视化比较了它们的性能和特点。

目标变换在回归分析中的应用

本文通过合成数据和艾姆斯房价数据集,探讨了在回归分析中对目标变量进行变换以提高模型预测精度的方法。

决策树模型导出为GraphViz格式

本页面介绍如何将决策树模型导出为GraphViz格式,并提供了详细的参数说明和示例代码。

参数密度估计技术在数据生成模型中的应用

本文介绍了如何使用参数密度估计技术来学习数据集的生成模型,并利用该模型生成新的数据样本。

分块计算距离矩阵

本文介绍了如何使用分块计算方法来处理大规模数据集中的距离矩阵计算问题,旨在优化内存使用和提高计算效率。

多标签分类:分类器链的使用

本文介绍了如何使用分类器链来解决多标签分类问题,并通过酵母数据集的实验结果来比较不同模型的性能。

L1正则化分类器的C参数下限计算

本页面介绍了如何计算L1正则化分类器的C参数下限,包括参数说明和示例代码。

贝叶斯回归模型比较与应用

本文深入探讨了贝叶斯回归模型的不同变体及其在线求解器,包括贝叶斯岭回归、弹性网络、Lasso和Ridge等,并讨论了如何通过正则化和特征选择来提高模型的泛化能力。

K最近邻分类器示例

本示例展示了如何使用K最近邻分类器对iris数据集进行训练,并观察不同权重参数下决策边界的变化。

基因序列的核函数分析

本文介绍了如何使用核函数对基因序列数据进行回归和分类任务的分析。

图像分割的谱聚类技术

本文介绍了如何使用谱聚类技术对图像进行分割,包括kmeans、离散化和QR分解等方法。

主题提取技术:NMF与LDA

本网页介绍了如何使用非负矩阵分解(NMF)和潜在狄利克雷分配(LDA)对文档集合进行主题提取,并展示了使用Python和scikit-learn库实现的代码示例。

距离矩阵计算方法

本页面介绍了如何计算距离矩阵,包括输入参数、计算方法以及多线程计算的应用。

偏最小二乘法及其在回归分析中的应用

本文介绍了偏最小二乘法(PLS)的基本原理、算法实现及其在回归分析中的应用。PLS是一种有效的数据降维技术,特别适用于变量数量多于观测值的情况。

稀疏矩阵特征缩放

本页面介绍了如何对CSC/CSR格式的稀疏矩阵进行特征缩放,通过乘以特定的缩放因子来实现。

线性与二次判别分析比较

本文介绍了线性判别分析(LDA)和二次判别分析(QDA)在不同数据集上的表现,并通过可视化展示了两种方法的决策边界和协方差椭球。

余弦相似度计算指南

本文介绍了余弦相似度的概念,以及如何在Python中使用sklearn库计算两个数据集之间的余弦相似度。

地理空间数据的核密度估计

本网页展示了如何使用基于哈维森距离度量的布朗树对地理空间数据进行核密度估计。

沪ICP备2024098111号-1
上海秋旦网络科技中心:上海市奉贤区金大公路8218号1幢 联系电话:15216758379