分类器的概率校准

本文介绍了如何对分类器进行概率校准,并通过Brier分数评估校准后的概率质量。比较了高斯朴素贝叶斯分类器在未校准、sigmoid校准和等温校准下的性能。

高斯混合模型(GMM)与信息论标准

本文介绍了如何使用信息论标准,如AIC和BIC,来选择高斯混合模型(GMM)的最佳参数,包括协方差类型和模型中的组分数量。

t-SNE 算法的可视化分析

本文通过不同的困惑度值对t-SNE算法进行可视化分析,探讨了不同参数对算法结果的影响。

非负最小二乘法与普通最小二乘法比较

本文比较了非负最小二乘法(NNLS)和普通最小二乘法(OLS)在拟合线性模型时的表现,包括回归系数的比较和模型的稀疏性。

高斯过程分类在XOR数据集上的应用

本页面展示了高斯过程分类(GPC)在XOR数据集上的应用,并比较了静态各向同性核(RBF)与非静态核(点积核)的性能。

数据科学中的无监督学习技术

本文介绍了数据科学中无监督学习的各种技术,包括降维、聚类、双聚类、信号分解、协方差估计、异常检测和密度估计等。

非线性降维技术比较

本网页旨在比较两种流行的非线性降维技术:t-SNE和LLE,并探讨它们在添加数据空洞时的表现。

单类SVM与随机梯度下降单类SVM的比较

本网页展示了如何在RBF核的情况下,使用随机梯度下降版本的单类SVM来近似sklearn.svm.OneClassSVM的解决方案。

LARS路径算法详解

本文详细介绍了LARS路径算法的工作原理和参数设置,包括算法的目标函数、参数详解以及代码示例。

Python 切片生成器

本文介绍了如何使用Python的sklearn库中的gen_even_slices函数来生成等间隔的切片。

使用scikit-learn的set_output方法

本文介绍了如何在scikit-learn库中使用set_output方法来配置模型输出为pandas DataFrame格式,并提供了详细的代码示例。

聚类算法的收敛性研究

本文探讨了KMeans和MiniBatchKMeans聚类算法的不同初始化策略对算法收敛性的影响,并提供了代码示例。

召回率计算指南

本文介绍了召回率的计算方法,包括不同参数设置下的计算方式,以及如何使用Python进行召回率的计算。

获取评分器名称

本文介绍了如何使用get_scorer_names函数来获取所有可用评分器的名称,并提供了详细的参数说明、返回值以及示例代码。

LassoLarsIC模型选择

本网页介绍了使用LassoLarsIC估计器在糖尿病数据集上进行模型选择的过程,以及如何利用AIC和BIC标准来选择最佳模型。

ROC与DET曲线比较

本网页介绍了ROC曲线和DET曲线在二元分类任务中的比较,包括它们的定义、绘制方法以及如何使用Python的scikit-learn库来实现。

高斯混合模型初始化方法比较

本文比较了四种高斯混合模型的初始化方法:kmeans、random、random_from_data和k-means++。通过生成样本数据并使用不同的初始化方法,展示了每种方法的收敛速度和初始化时间。

scikit-learn 1.3版本新特性

本文详细介绍了scikit-learn 1.3版本的新特性,包括bug修复、性能提升以及新增的关键功能。

特征选择与聚合方法比较

本文比较了在贝叶斯岭回归问题中,单变量特征选择和特征聚合方法的效果。

D²评分函数详解

本文详细介绍了D²评分函数,这是一种用于评估分类模型性能的指标,通过比较实际标签和预测概率来计算得分。

物种分布的核密度估计

本页面展示了如何使用基于邻居的查询(特别是核密度估计)来处理地理空间数据,使用基于Haversine距离度量的球面坐标。

二元分类任务的错误率计算

本页面介绍了如何计算二元分类任务在不同概率阈值下的错误率,包括假阳性率(FPR)和假阴性率(FNR),并提供了相应的代码示例。

图像分割的谱聚类算法示例

本网页介绍了如何使用谱聚类算法进行图像分割的示例,包括代码实现和结果展示。

线性与二次判别分析比较

本文介绍了线性判别分析(LDA)和二次判别分析(QDA)在不同数据集上的表现,并通过可视化展示了两种方法的决策边界和协方差椭球。

局部异常因子(LOF)算法在新颖性检测中的应用

本文介绍了局部异常因子(LOF)算法在新颖性检测中的应用,包括算法原理、参数设置、代码实现和结果展示。

手写数字识别示例

本示例展示了如何使用scikit-learn库来识别0到9的手写数字图像。

多任务Lasso回归分析

本页面介绍了多任务Lasso回归模型,这是一种在多个回归问题中联合选择特征的方法,并通过模拟数据生成和模型拟合来展示其稳定性和效果。

模型拟合验证

本文介绍了如何对机器学习模型进行拟合状态的验证,包括检查模型是否已经通过训练获得了必要的属性,并在未拟合时抛出异常。

多标签数据集可视化

本页面展示了如何使用Python和matplotlib库来生成并可视化一个随机的多标签数据集。

单类SVM算法介绍

本文介绍了单类SVM算法,这是一种无监督学习算法,用于新颖性检测,能够将新数据分类为与训练集相似或不同。

沪ICP备2024098111号-1
上海秋旦网络科技中心:上海市奉贤区金大公路8218号1幢 联系电话:15216758379