梯度提升树的OOB估计

本文介绍了梯度提升树中OOB估计的概念、计算方法以及如何使用OOB估计来确定模型的最佳迭代次数。

正则化参数优化与模型性能

本文通过Elastic-Net回归模型探讨了正则化参数对训练和测试数据集性能的影响,并使用解释方差R^2作为性能度量。

DBSCAN聚类算法演示

本页面展示了DBSCAN聚类算法的实现和评估,包括数据生成、算法应用、结果可视化和性能评估。

高斯混合模型初始化方法比较

本文介绍了高斯混合模型(GMM)的四种初始化方法:k-means、随机、数据随机和k-means++,并比较了它们的初始化时间和收敛迭代次数。

标签传播算法演示

本页面通过一个简单的示例演示了标签传播算法在半监督学习中的应用,通过可视化的方式展示了算法的工作原理。

贝叶斯回归器比较

本网页比较了两种不同的贝叶斯回归器:自动相关性确定(ARD)和贝叶斯岭回归。通过生成合成数据集,展示了这两种模型的系数估计,并使用多项式特征展开来拟合非线性关系。

贝叶斯岭回归与自动相关性确定

本文介绍了贝叶斯岭回归和自动相关性确定(ARD)在回归分析中的应用,包括模型的健壮性、系数的恢复、以及多项式特征扩展的使用。

参数优化与验证曲线

本文介绍了如何使用sklearn库中的validation_curve函数来分析不同参数值对模型训练和测试分数的影响。

数据预处理:列选择器的使用

本文介绍了如何使用sklearn库中的ColumnTransformer和make_column_selector函数来选择数据集中的特定列进行预处理。

机器学习管道与特征选择

本文介绍了如何使用机器学习管道进行特征选择和模型训练,并展示了如何预测新样本和检查管道步骤。

构建标签关系矩阵

本文介绍了如何使用sklearn.metrics.cluster中的contingency_matrix函数来构建描述真实标签与预测标签之间关系的矩阵。

多任务Lasso回归分析

本文介绍了多任务Lasso回归在特征选择中的应用,通过模拟数据生成和模型拟合,展示了Lasso回归在不同时间点上对特征选择的稳定性。

K-Means++ 初始质心选择示例

通过sklearn.cluster.kmeans_plusplus函数生成聚类初始种子的示例,展示了K-Means++初始化方法的输出结果。

半监督学习在乳腺癌数据集上的应用

本文介绍了半监督学习中的自我训练分类器在乳腺癌数据集上的应用,分析了不同阈值对分类器性能的影响。

L1正则化逻辑回归路径

本页面展示了如何使用Python和scikit-learn库来训练L1正则化的逻辑回归模型,并绘制了正则化路径图。

基于投票分类器的分类概率可视化

本文介绍了如何使用Python和sklearn库中的VotingClassifier进行软投票分类,并可视化不同分类器对单个样本的分类概率。

基于特征矩阵的Ward聚类算法

本文介绍了基于特征矩阵的Ward聚类算法,这是一种递归合并聚类方法,旨在最小化簇内方差。

邻域成分分析示例

本示例展示了如何使用邻域成分分析(NCA)来学习一个距离度量,以最大化最近邻分类的准确性。

线性支持向量机分类器中的分隔超平面

本页面展示了如何使用随机梯度下降(SGD)训练线性支持向量机(SVM)分类器,并绘制出在两个类别可分数据集中的最大分隔超平面。

数据预处理与特征提取

本网页介绍了数据预处理和特征提取的基本概念、方法和技术,包括标准化、归一化、编码分类特征、缺失值处理、多项式特征生成、无监督降维等。

支持向量机中的正则化参数调整

本文探讨了在使用支持向量机进行分类时,如何根据样本数量调整正则化参数C,以达到最佳的分类效果。

机器学习中的决策边界可视化

本文介绍了如何使用Python和机器学习库sklearn来可视化决策边界,特别是针对Iris数据集的多类SGD分类器。

数据生成器在机器学习中的应用

本文介绍了多种数据生成器,包括分类、聚类、回归和流形学习的数据生成器,以及它们在机器学习中的应用。

K-Means聚类算法演示

本页面展示了K-Means聚类算法在手写数字数据集上的应用,包括不同初始化策略的比较、聚类质量评估以及结果的可视化展示。

线性与二次判别分析比较

本文介绍了线性判别分析(LDA)和二次判别分析(QDA)在不同数据集上的表现,并通过可视化展示了两种方法的决策边界和协方差椭球。

Olivetti人脸数据集加载指南

本页面提供了关于如何加载和处理Olivetti人脸数据集的详细指南,包括参数设置、数据结构和使用示例。

线性支持向量分类器中支持向量的可视化

本页面展示了如何在线性支持向量分类器(LinearSVC)中获取并可视化支持向量。

非负矩阵分解(NMF)技术介绍

本文介绍了非负矩阵分解(NMF)技术,这是一种用于数据降维、源分离或主题提取的数学方法。

决策树在鸢尾花数据集上的应用

本文介绍了如何使用决策树对鸢尾花数据集的特征对进行训练,并展示了决策树的结构和决策边界。

线性回归分析示例

本页面展示了如何使用线性回归模型对数据进行分析和预测,包括模型的构建、训练、预测以及评估过程。

沪ICP备2024098111号-1
上海秋旦网络科技中心:上海市奉贤区金大公路8218号1幢 联系电话:15216758379