稳健回归估计器:Theil-Sen与OLS和RANSAC的比较

本文比较了Theil-Sen估计器与OLS和RANSAC估计器在处理异常值时的性能,并提供了Python代码示例。

校准曲线计算方法

本网页介绍了如何使用校准曲线来计算真实和预测概率,适用于二元分类问题。

岭回归系数分析

本页面介绍了岭回归中系数的变化情况,并展示了如何通过调整正则化参数来平衡模型的偏差和方差。

稀疏编码信号生成示例

本页面展示了如何使用sklearn库中的make_sparse_coded_signal函数生成稀疏编码信号,包括数据集、字典和编码矩阵的生成过程。

数据聚类分析与KMeans算法

本文探讨了KMeans聚类算法在处理不同数据分布时的表现,包括非等方差、非等大小聚类,以及如何通过高斯混合模型解决这些问题。

标签传播算法演示

本页面通过一个简单的示例演示了标签传播算法在半监督学习中的应用,通过可视化的方式展示了算法的工作原理。

数字分类练习教程

本教程介绍了如何使用分类技术对数字数据集进行分类,包括KNN和逻辑回归方法的应用。

人脸识别技术实现

本文介绍了如何使用PCA和SVM技术进行人脸识别的实现过程,包括数据预处理、模型训练和结果评估。

计算点与点集之间的最小距离

本文介绍了如何使用一个函数来计算一个点与一组点之间的最小距离,包括参数设置和代码示例。

LARS路径算法详解

本文详细介绍了LARS路径算法的工作原理和参数设置,包括算法的目标函数、参数详解以及代码示例。

机器学习管道与特征选择

本文介绍了如何使用机器学习管道进行特征选择和模型训练,并展示了如何预测新样本和检查管道步骤。

Scikit-learn 全局配置指南

本文介绍了如何设置scikit-learn库的全局配置,包括参数验证、内存使用、输出格式等,旨在提高机器学习任务的效率和性能。

决策阈值调整与模型评估

本文介绍了如何使用TunedThresholdClassifierCV调整分类模型的决策阈值,并使用糖尿病数据集进行示例演示。

数据离散化策略

本文介绍了三种数据离散化策略:均匀离散化、分位数离散化和K均值离散化,并通过Python代码和图表展示了这些策略的应用和效果。

集成学习算法概览

本文介绍了多种集成学习算法,包括AdaBoost、Bagging、ExtraTrees、Gradient Boosting、Isolation Forest、Random Forest、Stacking和Voting等。

模型选择与交叉验证策略

本文讨论了在模型选择过程中使用嵌套交叉验证和非嵌套交叉验证的策略,以及它们在优化模型参数时的差异。

受限玻尔兹曼机(RBM)介绍

受限玻尔兹曼机(RBM)是一种基于概率模型的无监督非线性特征学习算法,常用于初始化深度神经网络。本文详细介绍了RBM的基本概念、模型参数化、伯努利RBM以及随机最大似然学习算法。

多标签数据集的生成与分类

本文介绍了如何生成多标签数据集,并使用PCA和CCA进行降维,最后通过SVM进行分类。

神经网络学习行为分析

本文通过分析神经网络的权重,探讨学习行为,使用MNIST数据集训练MLP分类器,并通过可视化权重矩阵来理解学习过程。

D²回归评分函数

本页介绍了D²回归评分函数,这是一种用于评估回归模型性能的度量方法。它通过比较模型预测值和实际值来计算分数,最佳得分为1.0,可能为负值。

贝叶斯回归模型比较与应用

本文深入探讨了贝叶斯回归模型的不同变体及其在线求解器,包括贝叶斯岭回归、弹性网络、Lasso和Ridge等,并讨论了如何通过正则化和特征选择来提高模型的泛化能力。

特征离散化在分类数据集中的应用

本文通过合成的分类数据集,展示了特征离散化技术如何通过将特征分解成多个区间,并使用独热编码,来增强线性分类器的性能。同时,对比了在线性可分和非线性可分数据集上,特征离散化对分类器性能的影响。

数据变换与正态分布映射

本文介绍了如何使用PowerTransformer和QuantileTransformer将不同分布的数据映射到正态分布,并分析了变换前后的数据可视化效果。

不平衡数据集的类别权重估计

本文介绍了如何在不平衡数据集中估计类别权重,以提高机器学习模型的性能。

特征离散化与线性分类器的性能

本文探讨了特征离散化技术如何影响线性分类器在不同数据集上的性能表现。

均值绝对误差回归损失计算

本文介绍了均值绝对误差回归损失的计算方法,包括参数说明、返回值以及示例代码。

糖尿病数据集的LASSO路径计算

本文介绍了如何使用LASSO方法计算糖尿病数据集的正则化路径,并展示了系数向量随正则化参数变化的可视化结果。

聚类分析中的配对混淆矩阵

本文介绍了聚类分析中的配对混淆矩阵,这是一种评估两个聚类结果相似度的方法。

多类分类策略比较与优化

本网页介绍了如何在机器学习中处理多类分类问题,包括使用scikit-learn库中的不同策略进行比较和优化。

协方差估计方法比较

本网页介绍了在统计学中常用的几种协方差估计方法,包括最大似然估计、Ledoit-Wolf估计和OAS估计,并比较了它们在不同情况下的表现。

沪ICP备2024098111号-1
上海秋旦网络科技中心:上海市奉贤区金大公路8218号1幢 联系电话:15216758379