稳健协方差估计与马氏距离的相关性

本文介绍了在高斯分布数据中使用稳健协方差估计和马氏距离来识别异常值和进行数据聚类。

投票分类器概率可视化

本页面展示了如何使用Python和scikit-learn库中的VotingClassifier来计算并可视化不同分类器对同一样本的概率预测结果。

模型评估与解释性分析

本文探讨了模型评估中的常见问题,以及如何通过解释性分析来理解模型预测,并提供了一系列工具和方法来评估模型假设和偏差,设计更好的模型,诊断模型性能问题。

Theil-Sen 回归分析示例

本文介绍了Theil-Sen回归分析方法,并通过代码示例展示了其在处理包含异常值的数据集时的鲁棒性。

谱聚类算法在文档双聚类中的应用

本文介绍了如何使用谱聚类算法对文档进行双聚类处理,并比较了该方法与传统的MiniBatchKMeans聚类算法的效果。

随机搜索与网格搜索的比较

本文比较了随机搜索和网格搜索在优化线性SVM的超参数时的效果和效率。

岭回归系数与正则化参数的关系

本网页展示了岭回归系数如何随着正则化参数的变化而变化,以及在处理高度病态矩阵时岭回归的实用性。

独立成分分析与主成分分析对比

本文对比了独立成分分析(ICA)与主成分分析(PCA)两种不同的特征空间分析技术,并通过模拟数据展示了它们在提取信号时的不同表现。

主成分回归与偏最小二乘回归的比较

本文比较了主成分回归(PCR)和偏最小二乘回归(PLS)在一个小数据集上的表现,展示了在目标变量与数据中的某些低方差方向强相关时,PLS如何优于PCR。

多类别稀疏逻辑回归在20newsgroups数据集上的比较

本文比较了在20newsgroups数据集上,使用L1正则化的多类别逻辑回归与一对一逻辑回归的性能。

计算点与点集之间的最小距离

本文介绍了如何使用一个函数来计算一个点与一组点之间的最小距离,包括参数设置和代码示例。

数据类型识别

本页面解释了如何根据目标数据识别数据类型,包括连续型、二进制、多类、多输出和多标签等类型。

机器学习策略对比

本文探讨了不同的机器学习策略,包括SGD和Adam,以及它们在不同数据集上的表现。

图像去噪与PCA重建

本网页介绍了如何使用PCA和核PCA对USPS数字数据集进行去噪和重建。

机器学习:降维与支持向量分类器

本文介绍了如何结合使用降维技术与支持向量分类器进行数据预测,并通过GridSearchCV和Pipeline优化模型参数。

多标签分类:分类器链的使用

本文介绍了如何使用分类器链来解决多标签分类问题,并通过酵母数据集的实验结果来比较不同模型的性能。

基于特征矩阵的Ward聚类算法

本文介绍了基于特征矩阵的Ward聚类算法,这是一种递归合并聚类方法,旨在最小化簇内方差。

特征联合构造器

本页面介绍了如何使用特征联合构造器来组合多个变换器,并通过并行处理提高效率。

使用set_output API配置Transformer输出Pandas DataFrame

本文介绍了如何使用set_output API来配置scikit-learn中的Transformer,使其输出Pandas DataFrame,便于数据分析和可视化。

交叉验证行为可视化

本文介绍了如何在Python的scikit-learn库中使用不同的交叉验证对象,并提供了一个可视化示例来比较它们的行为。

机器学习库Scikit-learn入门指南

本网页介绍了如何使用Scikit-learn库进行机器学习任务,包括模型拟合、数据预处理、模型选择、模型评估等基本概念和操作。

均值漂移聚类算法演示

本页面介绍了均值漂移算法的基本概念和实现,包括算法的数学原理、Python代码示例和可视化结果。

基因序列的核函数分析

本文介绍了如何使用核函数对基因序列数据进行回归和分类任务的分析。

非负矩阵分解(NMF)介绍

本网页介绍了非负矩阵分解(NMF)的概念、算法和应用示例。NMF是一种用于数据降维、源分离或主题提取的矩阵分解技术。

机器学习算法可视化

本页面展示了如何使用Python的matplotlib库和numpy库来可视化机器学习中的L1和L2正则化以及弹性网络算法。

使用类似NumPy的API进行数组操作库

本网页介绍了如何使用类似NumPy的API进行数组操作,并展示了如何在scikit-learn中使用CuPy和PyTorch等库进行数据操作。

支持向量机(SVM)最大边界超平面示例

本文介绍了如何使用支持向量机(SVM)分类器和线性核来绘制一个两类别可分离数据集中的最大边界超平面。

Calinski-Harabasz 分数计算方法

本文介绍了Calinski-Harabasz分数的定义、参数、返回值以及如何使用Python中的sklearn库进行计算。

连续减半搜索示例

本网页介绍了如何使用连续减半搜索(Successive Halving)方法来选择最佳的参数组合。

多类分类策略比较

本文探讨了在目标变量包含多于两个类别时的分类问题,即多类分类问题,并比较了不同的多类分类策略。

沪ICP备2024098111号-1
上海秋旦网络科技中心:上海市奉贤区金大公路8218号1幢 联系电话:15216758379