局部异常因子(LOF)异常检测

局部异常因子(LOF)是一种无监督异常检测方法,用于计算给定数据点相对于其邻居的局部密度偏差。本文介绍了如何在scikit-learn中使用LOF进行异常检测,并展示了如何生成带有异常值的数据集,拟合模型并绘制结果。

鲁棒协方差估计与异常检测

本文通过葡萄酒数据集的实例,探讨了在实际数据集中进行鲁棒协方差估计的必要性,以及如何使用不同的异常检测工具来理解数据结构。

糖尿病数据集的交叉验证练习

本教程介绍了如何使用交叉验证和线性模型对糖尿病数据集进行模型选择和参数调优。

参数验证函数

本文介绍了一个用于验证标量参数类型和值的函数,包括参数的名称、目标类型、最小值、最大值以及边界包含情况。

手写数字识别示例

使用Python和机器学习库对8x8像素的手写数字图像进行分类和识别。

机器学习评分器的创建与使用

本文介绍了如何使用scikit-learn库中的make_scorer函数来创建一个评分器,并详细解释了其参数和使用方法。

Scikit-learn 估计器概览

本文介绍了如何使用Scikit-learn库中的函数来检索所有继承自BaseEstimator的估计器类。

学习曲线分析

本文介绍了如何使用学习曲线分析来评估机器学习模型在不同训练集大小下的性能。

机器学习:降维与支持向量分类器

本文介绍了如何结合使用降维技术与支持向量分类器进行数据预测,并通过GridSearchCV和Pipeline优化模型参数。

高斯过程分类器(GPC)在XOR数据集上的应用

本文介绍了高斯过程分类器(GPC)在XOR数据集上的应用,比较了RBF核和DotProduct核的性能,并提供了详细的代码实现。

PCA与逻辑回归的管道化处理

本文介绍了如何将PCA和逻辑回归结合起来,通过管道化的方式进行数据的维度降低和分类预测。

参数化评估器检查

本文介绍了如何使用pytest的参数化装饰器来检查评估器是否符合scikit-learn的API规范。

使用线性支持向量机的可分离数据集

本文介绍了如何使用随机梯度下降(SGD)训练的线性支持向量机(SVM)来处理一个可分离的数据集,并展示了如何绘制决策边界和数据点。

BIRCH与MiniBatchKMeans算法比较

本网页旨在比较BIRCH和MiniBatchKMeans两种聚类算法在处理大规模数据集时的性能差异。

多维尺度分析与非度量多维尺度分析

本文介绍了如何使用Python进行多维尺度分析(MDS)和非度量多维尺度分析(NMDS),并通过代码示例展示了两种方法在数据可视化中的应用。

随机森林与多输出回归器的比较

本文介绍了如何使用随机森林回归器和多输出回归器进行多目标回归分析。通过比较这两种方法,我们可以了解它们在预测多个输出时的效能和偏差。

Brier得分计算指南

本页面介绍了Brier得分的概念、计算方法和应用场景,以及如何使用Python的sklearn库来计算Brier得分。

图像分割的谱聚类技术

本文介绍了如何使用谱聚类技术对图像进行分割,包括kmeans、离散化和QR分解等方法。

t-SNE技术及其困惑度参数的影响

本文探讨了t-SNE技术在不同困惑度参数下对数据集形状的影响,并通过实例代码展示了如何使用t-SNE进行有效的数据降维和可视化。

机器学习模型的偏依赖图可视化

本网页介绍了如何使用Python中的matplotlib和sklearn库来绘制决策树和多层感知器模型的偏依赖图,并通过API进行快速定制。

计算科恩卡帕系数

本文介绍了如何使用科恩卡帕系数来衡量两个标注者在分类问题上的一致性水平。

图像去噪:使用核主成分分析

本文介绍了如何使用核主成分分析(KernelPCA)对图像进行去噪处理,并通过比较精确重建和核PCA重建的结果,展示了去噪效果。

Python科学计算生态系统入门

本文为初学者提供了Python科学计算生态系统的入门指南,包括NumPy数组的基础知识,并推荐了一系列针对特定领域的在线教程和视频资源。

逻辑回归决策边界可视化

本页面展示了如何使用Python的scikit-learn库来绘制多类别逻辑回归和One-vs-Rest逻辑回归的决策边界。

岭回归与正则化

本文介绍了岭回归和正则化的概念,以及如何通过调整正则化参数来平衡模型的预测准确性和泛化能力。

使用类似NumPy的API进行数组操作库

本网页介绍了如何使用类似NumPy的API进行数组操作,并展示了如何在scikit-learn中使用CuPy和PyTorch等库进行数据操作。

scikit-learn 1.0版本发布亮点

本文介绍了scikit-learn 1.0版本的新特性、改进和bug修复。

高斯混合模型与狄利克雷过程模型比较

本网页介绍了高斯混合模型(GMM)和贝叶斯高斯混合模型(使用狄利克雷过程作为先验)的比较,包括它们的工作原理和在低维空间中的可视化展示。

SVM分类器在鸢尾花数据集上的应用

本页面展示了在鸢尾花数据集上使用不同SVM分类器的效果,包括线性和非线性模型的决策边界。

多维缩放算法SMACOF

本文介绍了多维缩放算法SMACOF的基本原理和实现步骤,包括算法的参数设置和应用示例。

沪ICP备2024098111号-1
上海秋旦网络科技中心:上海市奉贤区金大公路8218号1幢 联系电话:17898875485