梯度提升算法与模型优化

本网页探讨了如何使用梯度提升算法进行机器学习模型的优化,并通过随机森林的OOB误差和交叉验证来估计最优迭代次数。

t-SNE 算法的可视化分析

本文通过不同的困惑度值对t-SNE算法进行可视化分析,探讨了不同参数对算法结果的影响。

生成棋盘状数组以进行双聚类分析

本页面提供了一个用于生成棋盘状结构数组的函数,该数组可用于双聚类分析。

Lasso回归路径计算

本文介绍了使用坐标下降法计算Lasso回归路径的过程,包括参数设置、优化函数、以及如何使用Python实现。

自训练分类器阈值影响分析

本文通过乳腺癌数据集演示了自训练分类器在不同阈值设置下的效果。

非线性降维技术比较

本网页旨在比较两种流行的非线性降维技术:t-SNE和LLE,并探讨它们在添加数据空洞时的表现。

手写数字识别示例

使用Python和机器学习库对8x8像素的手写数字图像进行分类和识别。

F-beta得分计算与应用

本页面介绍了F-beta得分的计算方法和参数,以及如何在不同情况下使用该得分来评估分类模型的性能。

归纳式聚类与分类器结合

本文介绍了如何将归纳式聚类与分类器结合使用,以提高对新数据样本的分类效率。

计算点与点集之间的最小距离

本文介绍了如何使用一种高效的方法来计算一个点与一组点之间的最小距离。

正交匹配追踪算法(OMP)详解

本文详细介绍了正交匹配追踪(OMP)算法的原理、参数设置以及在机器学习中的应用示例。

决策树模型导出为GraphViz格式

本页面介绍如何将决策树模型导出为GraphViz格式,并提供了详细的参数说明和示例代码。

生成Friedman #2回归问题数据集

本页面介绍了如何使用Python的sklearn库生成Friedman #2回归问题的数据集,包括数据的生成方法和参数说明。

亲和力传播聚类算法

本文介绍了亲和力传播聚类算法的基本原理、参数设置和应用实例,旨在帮助读者理解和掌握这种高效的聚类方法。

单调约束对梯度提升估计器的影响

本网页通过构建人工数据集,展示了单调约束在梯度提升估计器中的应用及其对模型预测的影响。

稳健线性估计方法比较

本文介绍了如何使用不同的稳健线性估计方法来拟合一个正弦函数,并比较了在不同情况下它们的表现。

特征重要性评估

本文介绍了如何使用随机森林模型来评估特征在分类任务中的重要性,并比较了基于不纯度减少和排列重要性两种方法。

scikit-learn工具和函数介绍

本页面介绍了scikit-learn库中用于数据科学和机器学习的各种工具和函数。

半监督学习在手写数字识别中的应用

本文通过Label Spreading模型演示了半监督学习在手写数字识别任务中的高效性能,即使在标签数据非常有限的情况下。

数据子集选择工具

本页面介绍了一个用于选择数据子集的工具,它支持多种数据类型和索引方式,适用于数据分析和处理。

数据集生成:圆形数据集

本页面介绍了如何生成一个包含内圈和外圈的圆形数据集,用于可视化聚类和分类算法的效果。

模型拟合验证

本文介绍了如何使用机器学习库中的函数来验证模型是否已经拟合,并提供了相应的代码示例。

多类别分类的标签二值化

本文介绍了如何使用scikit-learn库中的函数将多类别标签转换为二值化形式,以便用于机器学习算法中。

图像去噪与字典学习

本网页介绍了使用字典学习进行图像去噪的方法,并通过实验比较了不同的变换方法在重建噪声图像时的效果。

精确度、召回率和F-分数计算

本页面介绍了如何计算精确度、召回率、F-分数和支持度,这些是评估分类模型性能的关键指标。

数据缺失值处理技术

本文探讨了使用不同的数据填充技术来处理缺失值,包括使用常数0填充、均值填充、k最近邻填充和迭代填充。

图像分类中像素重要性评估

本文介绍了如何使用随机森林算法在人脸数据集中评估像素的重要性,并展示了如何进行并行计算以提高效率。

双聚类相似度计算

本文介绍了如何计算两组双聚类之间的相似度,并使用修改后的Jonker-Volgenant算法找到最佳匹配,最终得分是相似度之和除以较大集合的大小。

部分依赖图可视化API

本网页展示了如何使用Python的scikit-learn库中的PartialDependenceDisplay对象来绘制和自定义部分依赖图。

随机森林分类器的OOB误差分析

本网页介绍了随机森林分类器在训练过程中如何通过OOB误差进行模型验证,并提供了相应的Python代码示例。

沪ICP备2024098111号-1
上海秋旦网络科技中心:上海市奉贤区金大公路8218号1幢 联系电话:15216758379