scikit-learn 1.4版本发布亮点

本文介绍了scikit-learn 1.4版本的新特性、改进和bug修复。

约翰逊-林登斯特劳斯引理与随机投影

本文介绍了约翰逊-林登斯特劳斯引理在随机投影中的应用,解释了如何通过随机投影来降低数据维度,同时保持数据点间距离的相对不变性。

ROC曲线计算与分析

本页面介绍了如何使用ROC曲线来评估二元分类模型的性能,并提供了相关的代码示例和解释。

机器学习损失函数可视化

本页面展示了如何使用Python和matplotlib库来可视化不同的机器学习损失函数,包括零一损失、合页损失、感知器损失等。

密度不同的聚类分析

本文通过生成不同密度的数据集,使用OPTICS算法的Xi聚类检测方法和设置特定的可达性阈值来模拟DBSCAN算法,展示了不同阈值下DBSCAN算法的聚类效果。

独立成分分析与主成分分析对比

本文对比了独立成分分析(ICA)与主成分分析(PCA)两种不同的特征空间分析技术,并通过模拟数据展示了它们在提取信号时的不同表现。

Huber回归与岭回归的比较

本文通过生成的回归数据集,展示了Huber回归和岭回归在面对异常值时的不同表现,并分析了Huber回归参数epsilon对模型的影响。

多维缩放分析示例

本页面展示了如何使用Python和scikit-learn库进行多维缩放分析(MDS)和非度量多维缩放(NMDS)的示例。

单类SVM与随机梯度下降单类SVM的比较

本网页展示了如何在RBF核的情况下,使用随机梯度下降版本的单类SVM来近似sklearn.svm.OneClassSVM的解决方案。

数据权重对模型的影响

本文探讨了数据权重在模型训练中的作用,并通过Python代码示例展示了权重如何影响决策边界。

使用scikit-learn的set_output方法

本文介绍了如何在scikit-learn库中使用set_output方法来配置模型输出为pandas DataFrame格式,并提供了详细的代码示例。

生成高斯数据集

本页面介绍如何使用sklearn库中的make_blobs函数生成高斯数据集,用于聚类分析。

半监督学习在乳腺癌数据集上的应用

本文介绍了半监督学习中的自我训练分类器在乳腺癌数据集上的应用,分析了不同阈值对分类器性能的影响。

单调约束对梯度提升估计器的影响

本网页通过构建人工数据集,展示了单调约束在梯度提升估计器中的应用及其对模型预测的影响。

距离计算函数详解

本文详细介绍了如何使用机器学习库中的函数来计算两点之间的最小距离,并提供了代码示例和参数说明。

特征缩放:MinMaxScaler使用指南

本文介绍了MinMaxScaler在机器学习中如何用于特征缩放,以及如何避免数据泄露的风险。

ROC与DET曲线比较

本网页介绍了ROC曲线和DET曲线在二元分类任务中的比较,包括它们的定义、绘制方法以及如何使用Python的scikit-learn库来实现。

特征重要性评估

本文介绍了如何使用随机森林模型来评估特征在分类任务中的重要性,并比较了基于不纯度减少和排列重要性两种方法。

贝叶斯回归模型比较与应用

本文深入探讨了贝叶斯回归模型的不同变体及其在线求解器,包括贝叶斯岭回归、弹性网络、Lasso和Ridge等,并讨论了如何通过正则化和特征选择来提高模型的泛化能力。

瑞士卷数据集生成器

本页面介绍了如何使用瑞士卷数据集生成器来创建三维数据点,并提供了代码示例和相关参考。

使用set_output API配置Transformer输出Pandas DataFrame

本文介绍了如何使用set_output API来配置scikit-learn中的Transformer,使其输出Pandas DataFrame,便于数据分析和可视化。

D²评分函数详解

本文详细介绍了D²评分函数,这是一种用于评估分类模型性能的指标,通过比较实际标签和预测概率来计算得分。

支持向量机中的正则化参数调整

本文探讨了在使用支持向量机进行分类时,如何调整正则化参数C以适应不同数量的训练样本。

协方差矩阵收缩算法

本文介绍了一种在数据分析中常用的协方差矩阵收缩算法,该算法通过调整系数来计算收缩估计值,提高模型的稳定性和准确性。

随机投影技术在高维数据集中的应用

本网页介绍了随机投影技术在高维数据集中的应用,包括理论基础、代码实现和实验验证。

图像重建技术与压缩感知

本文介绍了如何使用计算机断层扫描(CT)技术获取的一组平行投影数据来重建图像。讨论了压缩感知的概念,并通过Lasso优化算法实现了图像的重建。

弹性网络回归模型

本页面介绍了弹性网络回归模型的计算方法和参数配置,包括单输出和多输出任务的优化函数,以及如何使用坐标下降法来计算模型。

部分依赖图可视化API

本网页展示了如何使用Python的scikit-learn库中的PartialDependenceDisplay对象来绘制和自定义部分依赖图。

SVM分类器在鸢尾花数据集上的应用

本页面展示了在鸢尾花数据集上使用不同SVM分类器的效果,包括线性和非线性模型的决策边界。

主成分回归与偏最小二乘回归比较

本文通过一个简单的数据集,展示了在目标变量与数据中的某些低方差方向强相关时,偏最小二乘回归(PLS)如何优于主成分回归(PCR)。

沪ICP备2024098111号-1
上海秋旦网络科技中心:上海市奉贤区金大公路8218号1幢 联系电话:15216758379