分类器的概率校准

本文介绍了如何对分类器进行概率校准,并通过Brier分数评估校准后的概率质量。比较了高斯朴素贝叶斯分类器在未校准、sigmoid校准和等温校准下的性能。

随机森林与梯度提升树模型性能比较

本文比较了随机森林(RF)和直方图梯度提升树(HGBT)模型在回归数据集上的得分和计算时间。

多维缩放分析示例

本页面展示了如何使用Python和scikit-learn库进行多维缩放分析(MDS)和非度量多维缩放(NMDS)的示例。

森林覆盖类型数据集加载指南

本文介绍了如何使用scikit-learn库加载森林覆盖类型数据集,并提供了详细的参数说明和示例代码。

稀疏编码与Ricker小波变换

本网页介绍了稀疏编码技术,特别是使用Ricker小波变换对信号进行稀疏表示的方法。通过比较不同的稀疏编码方法,展示了如何使用不同的原子宽度来改善信号的稀疏表示。

目标变换在回归分析中的应用

本文通过合成数据和艾姆斯房价数据集,探讨了在回归分析中对目标变量进行变换以提高模型预测精度的方法。

K-Means++ 初始质心选择示例

通过sklearn.cluster.kmeans_plusplus函数生成聚类初始种子的示例,展示了K-Means++初始化方法的输出结果。

异常检测与数据结构理解

本文介绍了使用葡萄酒数据集进行异常检测和数据结构理解的分析方法,包括经验协方差估计、稳健协方差估计和单类支持向量机的应用。

马氏距离与高斯分布数据

本文介绍了如何使用马氏距离来衡量高斯分布数据中单个观测值与分布模式之间的距离,并讨论了稳健协方差估计器在处理异常值时的优势。

机器学习模型验证工具

本页面介绍了一个用于验证机器学习模型是否遵循scikit-learn框架约定的工具,包括API兼容性、输入验证和形状检查等。

流形学习技术在球面数据集上的应用

本文介绍了流形学习技术在球面数据集上的应用,并通过降维技术将数据集投影到二维空间,以获得直观的理解。

AdaBoost算法在多标签分类问题中的应用

本文介绍了AdaBoost算法在多标签分类问题上的应用,包括数据集的创建、模型训练、性能分析以及算法的收敛性。

数据变换与正态分布映射

本文介绍了如何使用PowerTransformer和QuantileTransformer将不同分布的数据映射到正态分布,并分析了变换前后的数据可视化效果。

核密度估计(KDE)示例

本文介绍了核密度估计(KDE)技术,这是一种强大的非参数密度估计方法,用于从数据集中学习生成模型,并从中抽取新的样本。

正则化方法对模型系数的影响

本网页探讨了在不同正则化参数C值下,L1、L2和Elastic-Net惩罚对模型系数稀疏性的影响,并展示了如何使用Python进行数字图像分类。

主题提取技术:NMF与LDA

本网页介绍了如何使用非负矩阵分解(NMF)和潜在狄利克雷分配(LDA)对文档集合进行主题提取,并展示了使用Python和scikit-learn库实现的代码示例。

OPTICS聚类算法演示

本页面展示了OPTICS聚类算法的工作原理,包括数据生成、算法应用以及结果的可视化展示。

支持向量机中的RBF核参数优化

本文介绍了支持向量机中RBF核的gamma和C参数对模型性能的影响,并通过可视化展示了不同参数组合下的效果。

高斯量化数据集分类分析

本网页展示了使用高斯量化数据集进行分类分析的过程,包括构建数据集、训练AdaBoost分类器、绘制决策边界和决策分数分布。

t-SNE技术及其困惑度参数的影响

本文探讨了t-SNE技术在不同困惑度参数下对数据集形状的影响,并通过实例代码展示了如何使用t-SNE进行有效的数据降维和可视化。

支持向量机(SVM)参数分析

本文通过实验分析了支持向量机(SVM)中核函数参数gamma对模型性能的影响,并提供了相应的代码示例。

数据局部结构的图连接性分析

本文探讨了在数据聚类中使用图连接性来捕捉数据的局部结构,并分析了稀疏连接矩阵的优势和不同链接方法的稳定性。

欧几里得距离计算

本页面介绍了如何使用Python的sklearn库来计算两个向量数组之间的欧几里得距离矩阵,包括计算方法、参数说明以及示例代码。

逻辑回归与一对多分类器

本文介绍了如何使用Python中的逻辑回归和一对多分类器进行多类分类任务,并通过数据可视化展示了分类效果。

增量计算均值和方差

本页面介绍了如何在CSR或CSC矩阵上沿指定轴增量计算均值和方差。

贝叶斯高斯混合模型分析

本网页探讨了贝叶斯高斯混合模型中权重浓度先验的不同类型对模型拟合数据的影响。通过比较Dirichlet分布先验和Dirichlet过程先验,展示了模型如何自动适应混合成分的数量,并分析了不同浓度先验值对模型结果的影响。

协方差矩阵收缩算法

本文介绍了一种在数据分析中常用的协方差矩阵收缩算法,该算法通过调整系数来计算收缩估计值,提高模型的稳定性和准确性。

ROC曲线与交叉验证的方差分析

本网页介绍了如何使用交叉验证来分析接收者操作特征(ROC)曲线的方差,并展示了不同数据集的ROC响应。

决策树回归分析

本文介绍了如何使用决策树进行回归分析,并通过调整树的最大深度来控制模型的复杂度,避免过拟合。

特征量化变换方法

本文介绍了一种基于分位数信息的特征变换方法,旨在将特征变换为均匀或正态分布,以减少异常值的影响并提高不同尺度变量的可比性。

沪ICP备2024098111号-1
上海秋旦网络科技中心:上海市奉贤区金大公路8218号1幢 联系电话:15216758379