生成双聚类结构数组

本文介绍了如何生成一个用于双聚类的常数块对角结构数组,包括参数说明、返回值以及示例代码。

正交匹配追踪算法在信号恢复中的应用

本文介绍了使用正交匹配追踪算法从带有噪声的测量中恢复稀疏信号的过程,包括算法的实现和结果展示。

低秩矩阵生成指南

本页面介绍了如何生成具有钟形奇异值分布的低秩矩阵,这种矩阵在实际应用中非常常见,如面部灰度图像和从网络爬取的文本文档的TF-IDF向量。

数据集概览

本文介绍了机器学习中常用的数据集,包括玩具数据集、真实世界数据集、生成数据集以及其他数据集的加载方式。

谱聚类共聚类算法演示

本文介绍了使用谱聚类共聚类算法对数据集进行分析的过程,包括数据集的生成、模型的训练以及结果的可视化展示。

目标编码器与交叉拟合

本文介绍了目标编码器的内部交叉拟合机制,以及它如何帮助防止机器学习模型过拟合。通过构建合成数据集,展示了目标编码器在有无交叉拟合时对模型性能的影响。

缺失值处理技术

本文探讨了在构建估计器前如何处理缺失值,包括使用常数、均值、中位数或众数等方法。

机器学习分类器与回归器概览

本文介绍了多种机器学习中的分类器和回归器,包括线性分类器、回归器、变量选择模型、鲁棒回归器以及广义线性模型等。

Tweedie回归评分函数

本文介绍了Tweedie回归评分函数的计算方法和应用示例,包括参数说明和代码实现。

网格搜索与连续减半搜索比较

本文比较了在支持向量机(SVC)估计器中,使用连续减半搜索(HalvingGridSearchCV)和网格搜索(GridSearchCV)进行参数搜索的效果,并展示了两者的效率和准确性。

机器学习模型评估与优化

本文介绍了机器学习中模型评估和优化的多种方法,包括交叉验证、超参数优化、ROC曲线等关键概念和技术。

加权众数计算方法

本文介绍了一种计算加权众数的方法,通过给定的数组和权重,找到出现频率最高的值及其对应的加权计数。

召回率计算指南

本文介绍了召回率的计算方法,包括不同参数设置下的计算方式,以及如何使用Python进行召回率的计算。

参数密度估计技术在数据生成模型中的应用

本文介绍了如何使用参数密度估计技术来学习数据集的生成模型,并利用该模型生成新的数据样本。

人脸数据集加载指南

本网页介绍了如何加载和使用Labeled Faces in the Wild (LFW)人脸数据集,包括数据集的参数设置和使用示例。

使用支持向量机进行数据分类

本页面展示了如何使用支持向量机(SVM)进行数据分类,并通过Python代码实现线性核函数下的分类器。

LassoLarsIC模型选择

本网页介绍了使用LassoLarsIC估计器在糖尿病数据集上进行模型选择的过程,以及如何利用AIC和BIC标准来选择最佳模型。

平均绝对误差回归损失计算

本页面介绍了平均绝对误差回归损失的计算方法,包括参数说明、返回值、示例代码以及相关应用场景。

特征选择与聚合方法比较

本文比较了在贝叶斯岭回归问题中,单变量特征选择和特征聚合方法的效果。

半监督学习在手写数字识别中的应用

本文通过Label Spreading模型演示了半监督学习在手写数字识别任务中的高效性能,即使在标签数据非常有限的情况下。

交叉验证评分方法

本文介绍了如何使用交叉验证来评估机器学习模型的性能,包括参数设置、使用方法和示例代码。

无监督学习与降维技术

本文介绍了无监督学习中的降维技术,包括主成分分析(PCA)、随机投影和特征聚合等方法,并讨论了它们在数据预处理中的应用。

支持向量机中的RBF核参数优化

本文介绍了支持向量机中RBF核的gamma和C参数对模型性能的影响,并通过可视化展示了不同参数组合下的效果。

鸢尾花数据集介绍

鸢尾花数据集是一个经典的多类分类数据集,用于机器学习教学和实践。

模型评分函数的使用与异常处理

本文介绍了如何在机器学习中使用模型评分函数,并处理可能出现的异常情况。

数据生成器在机器学习中的应用

本文介绍了多种数据生成器,包括分类、聚类、回归和流形学习的数据生成器,以及它们在机器学习中的应用。

线性模型正则化路径分析

本网页展示了如何计算Lasso、Lasso-LARS和Elastic Net正则化路径上的系数。

随机化SVD算法介绍

本页面介绍了随机化SVD算法的原理、参数和应用示例。

特征量化变换方法

本文介绍了一种基于分位数信息的特征变换方法,旨在将特征变换为均匀或正态分布,以减少异常值的影响并提高不同尺度变量的可比性。

计算成对距离

本页面介绍如何使用成对距离计算方法来计算两个数组之间的距离。

沪ICP备2024098111号-1
上海秋旦网络科技中心:上海市奉贤区金大公路8218号1幢 联系电话:15216758379