线性支持向量机(LinearSVC)示例

本页面展示了如何在使用线性支持向量机(LinearSVC)时获取支持向量。通过matplotlib和sklearn库,我们能够可视化分类边界和支持向量。

RBF核函数与SVM分类器的近似特征映射

本网页介绍了如何使用RBFSampler和Nystroem近似RBF核函数的特征映射,并在手写数字数据集上使用SVM进行分类。比较了在原始空间中使用线性SVM、使用近似映射的线性SVM以及核化SVM的结果。

机器学习损失函数可视化

本页面展示了如何使用Python和matplotlib库来可视化不同的机器学习损失函数,包括零一损失、合页损失、感知器损失等。

V-Measure聚类评估指标

V-Measure是一种用于评估聚类效果的外部指标,它综合了同质性和完备性两个维度,提供了一个介于0到1之间的评分,以衡量聚类的质量。

文本数据加载与处理

本文介绍了如何加载和处理文本数据,以便用于分类或聚类算法。

scikit-learn新特性介绍

本文介绍了scikit-learn库的最新版本中引入的一些关键特性,包括对分类数据的支持、改进的内存和运行时间效率等。

计算点与点集之间的最小距离

本文介绍了如何使用一个函数来计算一个点与一组点之间的最小距离,包括参数设置和代码示例。

线性回归与岭回归方差比较

本文探讨了在数据点较少时,线性回归和岭回归在预测方差上的差异,并提供了相应的Python代码示例。

支持向量机(SVM)分类器决策边界可视化

本页面展示了如何使用Python和matplotlib库来可视化支持向量机(SVM)分类器在鸢尾花数据集上的决策边界。

层次聚类分析:结构化与非结构化

本网页介绍了层次聚类分析中结构化与非结构化的区别,并通过瑞士卷数据集的实例演示了两种方法的应用。

多标签分类数据可视化

本页面展示了如何使用Python和matplotlib库来可视化多标签分类数据。

图的中心性分析

本文介绍了如何使用随机SVD算法来分析维基百科内部链接图,以计算页面的重要性。

模型选择与交叉验证策略

本文讨论了在模型选择过程中使用嵌套交叉验证和非嵌套交叉验证的策略,以及它们在优化模型参数时的差异。

机器学习:降维与支持向量分类器

本文介绍了如何结合使用降维技术与支持向量分类器进行数据预测,并通过GridSearchCV和Pipeline优化模型参数。

数据划分与模型验证

本文介绍了如何使用scikit-learn库进行数据划分和模型验证,包括不同的交叉验证方法和它们的可视化展示。

随机投影降维技术

本文介绍了随机投影降维技术,包括其理论基础Johnson-Lindenstrauss引理,以及如何通过高斯随机投影和稀疏随机投影来减少数据维度,同时保持数据间距离的近似不变。

加法卡方核函数介绍

本页面介绍了加法卡方核函数的计算方法,应用场景,以及如何在Python中使用sklearn库进行计算。

瑞士卷数据集生成器

本页面介绍了如何使用瑞士卷数据集生成器来创建三维数据点,并提供了代码示例和相关参考。

高斯过程在离散数据结构上的应用

本网页介绍了如何使用高斯过程对非固定长度特征向量形式的数据进行回归和分类任务。

岭回归分析

本网页介绍了岭回归的概念、原理、参数设置以及如何在Python中使用sklearn库进行岭回归分析。

Cython 开发技巧

本文介绍了在使用 scikit-learn 时,如何高效地利用 Cython 进行开发,包括性能优化、OpenMP 使用、类型定义等实用技巧。

D²评分函数详解

本文详细介绍了D²评分函数,这是一种用于评估分类模型性能的指标,通过比较实际标签和预测概率来计算得分。

物种分布的核密度估计

本页面展示了如何使用基于邻居的查询(特别是核密度估计)来处理地理空间数据,使用基于Haversine距离度量的球面坐标。

非负矩阵分解(NMF)介绍

本网页介绍了非负矩阵分解(NMF)的概念、算法和应用示例。NMF是一种用于数据降维、源分离或主题提取的矩阵分解技术。

特征选择与递归特征消除算法指南

本网页介绍了特征选择的重要性和几种常用的特征选择方法,包括递归特征消除算法和单变量特征选择器等。

排列测试评分 - 数据科学实例

本网页通过排列测试评分方法,评估交叉验证得分的重要性,并使用Iris数据集进行演示。

概率校准方法比较

本文比较了不同的概率校准方法,包括无校准、sigmoid校准和isotonic校准,并使用Brier分数评估了校准后的概率质量。

模型拟合验证

本文介绍了如何对机器学习模型进行拟合状态的验证,包括检查模型是否已经通过训练获得了必要的属性,并在未拟合时抛出异常。

平衡准确率计算方法

本文介绍了平衡准确率的概念,它用于处理二分类和多类分类问题中的数据不平衡问题,定义为每个类别召回率的平均值。

高斯混合模型与正弦曲线的拟合

本文介绍了高斯混合模型在非高斯随机变量混合数据集上的表现,通过正弦曲线上的噪声点数据,探讨了不同模型的选择和效果。

沪ICP备2024098111号-1
上海秋旦网络科技中心:上海市奉贤区金大公路8218号1幢 联系电话:15216758379