聚类算法演示与比较

本网页展示了多种聚类算法的演示和比较,包括K-Means、层次聚类、均值漂移等,并探讨了聚类性能评估和特征选择的方法。

KDDCup 99 数据集加载指南

本网页提供了关于如何加载KDDCup 99数据集的详细指南,包括参数设置和数据集特点。

加权样本的决策函数图

本文介绍了如何使用Python的scikit-learn库来绘制加权样本的决策函数图。通过调整样本权重,观察模型决策边界的变化。

逻辑回归正则化路径分析

本文介绍了使用Iris数据集进行二分类问题的逻辑回归正则化路径分析,包括数据加载、模型训练、正则化路径的计算和可视化。

数据可视化与分类算法示例

本文介绍了如何使用make_moons函数生成两个交错的半圆形数据集,用于可视化分类和聚类算法的效果。

数据点间传递消息的聚类分析

本文介绍了一种基于数据点间传递消息的聚类方法,使用Affinity Propagation算法进行样本数据的聚类,并评估聚类效果。

模型验证与参数调优指南

本文详细介绍了模型验证和参数调优的方法,包括交叉验证、参数搜索、决策阈值调整和评估指标。

梯度提升中的早停技术

本文介绍了梯度提升中的早停技术,通过加州房价数据集的案例,展示了如何使用早停技术来优化模型性能和提高训练效率。

排列测试在模型评估中的应用

本页面介绍了如何使用排列测试来评估交叉验证分数的重要性,并解释了p值在统计学上的意义。

数据标准化变换示例

本页面展示了如何使用Box-Cox和Yeo-Johnson变换将不同分布的数据映射到正态分布,并通过QuantileTransformer进行比较。

Tweedie偏差回归损失计算

本文介绍了Tweedie偏差回归损失的计算方法,包括参数设置和不同分布类型下的计算公式。

构建标签关系矩阵

本文介绍了如何使用sklearn.metrics.cluster中的contingency_matrix函数来构建描述真实标签与预测标签之间关系的矩阵。

随机搜索与网格搜索优化线性SVM的超参数

本文比较了随机搜索和网格搜索在优化线性SVM的超参数方面的效率和性能。

约翰逊-林登斯特劳斯引理与随机投影

本网页介绍约翰逊-林登斯特劳斯引理,并通过随机投影技术展示如何在保持数据对之间距离的同时降低数据集的维度。

多标签分类数据可视化

本页面展示了如何使用Python和matplotlib库来可视化多标签分类数据。

图的中心性分析

本文介绍了如何使用随机SVD算法来分析维基百科内部链接图,以计算页面的重要性。

图像去噪与PCA重建

本网页介绍了如何使用PCA和核PCA对USPS数字数据集进行去噪和重建。

数据验证助手函数

本页面介绍了一个用于验证输入数据并设置或检查特征名称和数量的助手函数。适用于需要输入验证的估计器。

数组对称性检查工具

本工具用于检查和转换数组的对称性,确保输入的矩阵是二维、方阵且对称。

机器学习中的降维与模型选择

本文介绍了如何使用Pipeline和GridSearchCV进行降维和模型选择,并通过代码示例展示了PCA、NMF和特征选择技术的应用。

Scikit-learn工具包内部实用工具介绍

本文介绍了Scikit-learn工具包中的内部实用工具,包括数据验证、随机抽样、线性代数计算等。

文件下载与校验

本页面介绍了如何从网络下载文件,并进行SHA256校验以确保文件的完整性。

逻辑回归与线性回归模型对比

本文通过一个合成数据集,展示了逻辑回归和线性回归模型如何对数据进行分类。

数据降维与分类示例

本页面展示了如何使用随机森林和贝叶斯分类器在高维稀疏数据上进行降维和分类。

鸢尾花数据集的K最近邻分类器决策边界分析

本网页通过Python代码演示了在鸢尾花数据集上使用K最近邻分类器,并分析了不同参数权重对决策边界的影响。

指数卡方核函数详解

本文详细介绍了指数卡方核函数的计算方法、参数设置以及在机器学习中的应用。

手写数字识别示例

本示例展示了如何使用scikit-learn库来识别0到9的手写数字图像。

DBSCAN与HDBSCAN聚类算法比较

本文介绍了DBSCAN和HDBSCAN两种聚类算法,并比较了它们在特定数据集上的表现,同时评估了HDBSCAN对某些超参数的敏感性。

最近质心分类法示例

本网页展示了如何使用最近质心分类法对iris数据集进行分类,并绘制了决策边界。

均方误差回归损失计算

本文介绍了均方误差回归损失的概念、计算方法和在机器学习中的应用。

沪ICP备2024098111号-1
上海秋旦网络科技中心:上海市奉贤区金大公路8218号1幢 联系电话:15216758379