梯度提升算法与模型优化

本网页探讨了如何使用梯度提升算法进行机器学习模型的优化,并通过随机森林的OOB误差和交叉验证来估计最优迭代次数。

分类器的概率校准

本文介绍了如何对分类器进行概率校准,并通过Brier分数评估校准后的概率质量。比较了高斯朴素贝叶斯分类器在未校准、sigmoid校准和等温校准下的性能。

校准曲线计算方法

本网页介绍了如何使用校准曲线来计算真实和预测概率,适用于二元分类问题。

教育经济学中的因果效应分析

本文通过模拟数据来探讨教育经济学中的一个重要问题:大学学位对小时工资的因果效应。

岭回归系数分析

本页面介绍了岭回归中系数的变化情况,并展示了如何通过调整正则化参数来平衡模型的偏差和方差。

数据聚类分析与KMeans算法

本文探讨了KMeans聚类算法在处理不同数据分布时的表现,包括非等方差、非等大小聚类,以及如何通过高斯混合模型解决这些问题。

20新闻组数据集加载与向量化

本文介绍了如何使用sklearn库加载和向量化20新闻组数据集,包括参数设置和数据预处理。

多维缩放分析示例

本页面展示了如何使用Python和scikit-learn库进行多维缩放分析(MDS)和非度量多维缩放(NMDS)的示例。

模型验证与参数调优指南

本文详细介绍了模型验证和参数调优的方法,包括交叉验证、参数搜索、决策阈值调整和评估指标。

高斯分布分类数据集生成

本页面介绍了如何生成一个多维高斯分布的分类数据集,包括参数设置和代码示例。

最大似然协方差估计器

本页面介绍了最大似然协方差估计器的计算方法和应用示例。

机器学习管道与特征选择

本文介绍了如何使用机器学习管道进行特征选择和模型训练,并展示了如何预测新样本和检查管道步骤。

机器学习管道中的特征选择

本文介绍了如何在机器学习的管道中集成特征选择,并通过分类报告展示了模型的性能。

参数密度估计技术在数据生成模型中的应用

本文介绍了如何使用参数密度估计技术来学习数据集的生成模型,并利用该模型生成新的数据样本。

数据集划分工具train_test_split详解

本文详细介绍了train_test_split函数的使用方法,包括参数设置、代码示例以及在机器学习数据预处理中的应用。

K近邻算法与数据缓存优化

本文介绍了如何使用K近邻算法进行数据预处理,并利用缓存技术提高模型训练效率。

L1正则化逻辑回归路径

本页面展示了如何使用Python和scikit-learn库来训练L1正则化的逻辑回归模型,并绘制了正则化路径图。

人脸数据集加载与处理

本页面介绍了如何加载和处理Labeled Faces in the Wild (LFW)人脸数据集,包括数据集的参数设置、数据结构和使用示例。

半监督学习算法介绍

本文介绍了半监督学习算法在sklearn库中的实现,包括自我训练算法和标签传播算法的原理和应用。

参数化评估器检查

本文介绍了如何使用pytest的参数化装饰器来检查评估器是否符合scikit-learn的API规范。

半监督学习在手写数字识别中的应用

本文通过Label Spreading模型演示了半监督学习在手写数字识别任务中的高效性能,即使在标签数据非常有限的情况下。

回归模型中目标转换的影响

本文通过合成数据和艾姆斯房价数据集探讨了在回归模型中对目标变量进行转换的益处。

均值漂移聚类算法演示

本页面介绍了均值漂移算法的基本概念和实现,包括算法的数学原理、Python代码示例和可视化结果。

交叉验证生成器工具

本页面介绍了一个用于构建交叉验证生成器的工具,包括参数说明、使用方法以及示例代码。

非负矩阵分解(NMF)介绍

本网页介绍了非负矩阵分解(NMF)的概念、算法和应用示例。NMF是一种用于数据降维、源分离或主题提取的矩阵分解技术。

机器学习算法可视化

本页面展示了如何使用Python的matplotlib库和numpy库来可视化机器学习中的L1和L2正则化以及弹性网络算法。

计算加法卡方核

本文介绍了加法卡方核的计算方法,这是一种在机器学习中用于特征数组比较的核方法。

距离度量与核函数在机器学习中的应用

本文介绍了距离度量和核函数在机器学习中的重要性,包括它们的定义、性质以及在不同算法中的应用。

贝叶斯岭回归曲线拟合示例

本网页介绍了如何使用贝叶斯岭回归对正弦波数据进行曲线拟合,并探讨了初始参数选择对模型的影响。

机器学习库scikit-learn 1.0版本更新概览

本文介绍了scikit-learn 1.0版本的新特性、改进和bug修复,包括API的变化、新引入的变换器和回归器等。

沪ICP备2024098111号-1
上海秋旦网络科技中心:上海市奉贤区金大公路8218号1幢 联系电话:15216758379