密度不同的聚类分析

本文通过生成不同密度的数据集,使用OPTICS算法的Xi聚类检测方法和设置特定的可达性阈值来模拟DBSCAN算法,展示了不同阈值下DBSCAN算法的聚类效果。

预测误差可视化

本文介绍了如何使用线性回归模型对糖尿病数据集进行预测,并使用交叉验证方法来可视化预测误差。

自训练分类器阈值影响分析

本文通过乳腺癌数据集演示了自训练分类器在不同阈值设置下的效果。

核岭回归与支持向量回归比较

本文比较了核岭回归(Kernel Ridge Regression, KRR)和支持向量回归(Support Vector Regression, SVR)两种方法,它们都利用核技巧学习非线性函数。这两种方法在损失函数上有差异,KRR通常在中等规模数据集上训练速度更快,但预测时速度较慢。

聚类算法性能比较

本网页旨在比较MiniBatchKMeans和BIRCH两种聚类算法在合成数据集上的性能。

混淆矩阵计算与评估

本文介绍了混淆矩阵的概念、计算方法以及在机器学习分类任务中的应用,并通过代码示例展示了如何使用混淆矩阵来评估分类模型的准确度。

机器学习模型验证工具

本页面介绍了一个用于验证机器学习模型是否遵循scikit-learn框架约定的工具,包括API兼容性、输入验证和形状检查等。

支持向量机在不平衡数据集上的应用

本网页介绍了如何在不平衡数据集上使用支持向量机(SVM)进行分类,并展示了如何绘制决策边界。

偏差-方差分解与集成学习

本文通过比较单个估计器与集成方法(如Bagging)在回归问题中的偏差-方差分解,探讨了模型的偏差、方差和噪声对预测误差的影响。

线性支持向量机分类器中的分隔超平面

本页面展示了如何使用随机梯度下降(SGD)训练线性支持向量机(SVM)分类器,并绘制出在两个类别可分数据集中的最大分隔超平面。

交叉验证行为可视化

本文介绍了如何在Python的scikit-learn库中使用不同的交叉验证对象,并提供了一个可视化示例来比较它们的行为。

独立成分分析(ICA)在噪声数据源分离中的应用

本文介绍了独立成分分析(ICA)技术在处理噪声数据源分离问题中的应用,通过模拟三个乐器同时演奏并被三个麦克风记录的场景,展示了如何使用FastICA算法来恢复每个乐器的原始信号。

使用加权样本计算Gram矩阵

本网页介绍了在使用ElasticNet模型时,如何对加权样本进行预处理以计算Gram矩阵。

层次聚类算法在瑞士卷数据集上的应用

本页面介绍了层次聚类算法在瑞士卷数据集上的应用,包括无结构和有结构的聚类方法,并提供了相应的Python代码示例。

使用预计算的Gram矩阵和加权样本拟合ElasticNet

本教程展示了如何在使用加权样本的同时,预计算Gram矩阵来拟合ElasticNet模型。

均值漂移聚类算法演示

本页面介绍了均值漂移算法的基本概念和实现,包括算法的数学原理、Python代码示例和可视化结果。

Cython 开发技巧

本文介绍了在使用 scikit-learn 时,如何高效地利用 Cython 进行开发,包括性能优化、OpenMP 使用、类型定义等实用技巧。

特征离散化与线性分类器的性能

本文探讨了特征离散化技术如何影响线性分类器在不同数据集上的性能表现。

层次聚类分析

本文介绍了如何使用AgglomerativeClustering和scipy中的dendrogram方法进行层次聚类分析。

交叉验证预测误差可视化

本网页展示了如何使用scikit-learn库中的cross_val_predict函数与PredictionErrorDisplay工具来可视化预测误差。

多类别分类的标签二值化

本文介绍了如何使用scikit-learn库中的函数将多类别标签转换为二值化形式,以便用于机器学习算法中。

排列测试评分 - 数据科学实例

本网页通过排列测试评分方法,评估交叉验证得分的重要性,并使用Iris数据集进行演示。

机器学习模型和复杂流程的展示

本网页介绍了如何在机器学习中展示模型和复杂的数据处理流程,包括如何使用不同的编码器和标准化工具。

径向基函数核的显式特征映射近似

本文介绍了如何使用RBFSampler和Nystroem方法来近似径向基函数核的特征映射,并在手写数字数据集上使用SVM进行分类。

K-means聚类算法详解

本网页详细介绍了K-means聚类算法的参数设置、工作原理以及Python代码实现。

协方差估计的收缩算法比较

本网页比较了Ledoit-Wolf和OAS两种协方差估计的收缩算法,使用高斯分布数据进行模拟。

机器学习库新特性介绍

本文介绍了机器学习库scikit-learn的最新版本中新增的一些关键特性和改进,包括固定阈值分类器、阈值优化分类器、PCA性能提升等。

协方差矩阵收缩算法

本文介绍了一种在数据分析中常用的协方差矩阵收缩算法,该算法通过调整系数来计算收缩估计值,提高模型的稳定性和准确性。

主成分回归与偏最小二乘回归比较

本文通过一个简单的数据集,展示了在目标变量与数据中的某些低方差方向强相关时,偏最小二乘回归(PLS)如何优于主成分回归(PCR)。

准确率分类评分

本页面介绍了在多标签分类中计算准确率的方法,包括参数说明、返回值以及示例代码。

沪ICP备2024098111号-1
上海秋旦网络科技中心:上海市奉贤区金大公路8218号1幢 联系电话:15216758379