Theil-Sen 回归分析示例

本文介绍了Theil-Sen回归分析方法,并通过代码示例展示了其在处理包含异常值的数据集时的鲁棒性。

密度不同的聚类分析

本文通过生成不同密度的数据集,使用OPTICS算法的Xi聚类检测方法和设置特定的可达性阈值来模拟DBSCAN算法,展示了不同阈值下DBSCAN算法的聚类效果。

数据聚类分析与KMeans算法

本文探讨了KMeans聚类算法在处理不同数据分布时的表现,包括非等方差、非等大小聚类,以及如何通过高斯混合模型解决这些问题。

半监督分类器与SVM在Iris数据集上的决策边界比较

本文比较了在Iris数据集上使用半监督分类器Label Spreading、Self-training和SVM生成的决策边界。

使用自定义核的SVM分类示例

本页面展示了如何使用支持向量机(SVM)进行分类,并使用自定义核函数。

多层感知器中的正则化参数研究

本网页探讨了在多层感知器中不同正则化参数alpha值对合成数据集的影响,并展示了如何通过调整alpha值来控制模型的过拟合和欠拟合问题。

递归特征消除与交叉验证

本页面介绍了如何使用递归特征消除(RFE)结合交叉验证来自动调整所选特征的数量。

数据预处理技术概览

本文介绍了多种数据预处理技术,包括二值化、特征缩放、编码器等,旨在帮助数据科学家和工程师更好地准备数据以进行机器学习。

机器学习与因果效应推断的局限性

本文探讨了机器学习模型在统计关联和因果效应推断中的局限性,并通过模拟数据集来说明遗漏变量偏差对因果效应估计的影响。

分块计算距离矩阵

本文介绍了如何使用分块计算方法来处理大规模数据集中的距离矩阵计算问题,旨在优化内存使用和提高计算效率。

机器学习模型验证工具

本页面介绍了一个用于验证机器学习模型是否遵循scikit-learn框架约定的工具,包括API兼容性、输入验证和形状检查等。

层次聚类算法与度量方式

本页面展示了不同度量方式对层次聚类算法的影响,包括欧几里得距离、曼哈顿距离和余弦距离。

Lasso模型选择:AIC与BIC标准

本网页介绍了如何使用AIC和BIC标准来选择最佳的Lasso回归模型,并提供了相应的Python代码示例。

使用set_output API配置Transformer输出Pandas DataFrame

本文介绍了如何使用set_output API来配置scikit-learn中的Transformer,使其输出Pandas DataFrame,便于数据分析和可视化。

R平方回归评分函数详解

本文介绍了R平方(R^2)回归评分函数的计算方法及其在机器学习模型评估中的应用。

AdaBoost算法在多标签分类问题中的应用

本文介绍了AdaBoost算法在多标签分类问题上的应用,包括数据集的创建、模型训练、性能分析以及算法的收敛性。

回归模型中目标转换的影响

本文通过合成数据和艾姆斯房价数据集探讨了在回归模型中对目标变量进行转换的益处。

支持向量机中的正则化参数调整

本文探讨了在使用支持向量机进行分类时,如何调整正则化参数C以适应不同数量的训练样本。

流形学习技术在球面数据集上的应用

本文介绍了流形学习技术在球面数据集上的应用,包括局部线性嵌入、t-SNE等方法,并通过代码展示了这些技术如何将高维数据投影到二维空间。

正则化方法对模型系数的影响

本网页探讨了在不同正则化参数C值下,L1、L2和Elastic-Net惩罚对模型系数稀疏性的影响,并展示了如何使用Python进行数字图像分类。

解释方差回归评分函数

本文介绍了解释方差回归评分函数,这是一种用于评估预测模型性能的指标。

最新版scikit-learn功能介绍

本文详细介绍了最新版scikit-learn中的bug修复、性能提升以及新增的关键特性。

二元分类任务的错误率计算

本页面介绍了如何计算二元分类任务在不同概率阈值下的错误率,包括假阳性率(FPR)和假阴性率(FNR),并提供了相应的代码示例。

平均绝对百分比误差(MAPE)回归损失

本页面介绍了平均绝对百分比误差(MAPE)回归损失的概念、计算方法和应用示例。

支持向量机中的RBF核参数优化

本文探讨了支持向量机(SVM)中径向基函数(RBF)核的参数gamma和C对模型性能的影响,并提供了代码示例。

KBinsDiscretizer策略演示

本页面展示了KBinsDiscretizer中实现的不同离散化策略,包括均匀离散化、分位数离散化和K均值离散化,并提供了相应的Python代码示例。

模型正则化对误差的影响

本网页介绍了线性模型中正则化参数对训练和测试误差的影响,并展示了如何通过验证曲线确定最优正则化参数,以及如何比较真实系数和估计系数。

支持向量机(SVM)核函数练习

本教程旨在通过使用不同的SVM核函数来分类鸢尾花数据集,提供了详细的代码实现和结果展示。

多标签文本分类问题模拟

本文介绍了如何使用PCA和CCA进行多标签文本分类问题的模拟和可视化。

K-Means与MiniBatchKMeans聚类算法性能比较

本文对比了K-Means和MiniBatchKMeans两种聚类算法的性能,并展示了如何生成数据集、执行聚类以及结果的可视化。

沪ICP备2024098111号-1
上海秋旦网络科技中心:上海市奉贤区金大公路8218号1幢 联系电话:15216758379