鲁棒线性模型估计:RANSAC算法应用

本文介绍了如何使用RANSAC算法对含有异常值的数据进行鲁棒的线性模型拟合。

概率模型的稀疏精度估计

本文讨论了如何从少量样本中估计概率模型的精度矩阵,包括高斯模型的参数化、数据采样、以及不同估计器的性能比较。

低秩矩阵生成指南

本页面介绍了如何生成具有钟形奇异值分布的低秩矩阵,这种矩阵在实际应用中非常常见,如面部灰度图像和从网络爬取的文本文档的TF-IDF向量。

主成分分析与核主成分分析的对比

本文对比了传统的主成分分析(PCA)和核主成分分析(KernelPCA)在数据投影上的差异,展示了KernelPCA在非线性数据分离上的优势。

线性回归与多项式特征:拟合不足与过拟合

本文介绍了线性回归模型在拟合非线性函数时可能遇到的拟合不足和过拟合问题,并通过多项式特征来展示如何近似非线性函数。

随机状态对象的使用

本文介绍了如何使用numpy中的RandomState对象来控制随机数生成,以及其在机器学习中的应用示例。

高斯过程模型

本页面介绍高斯过程模型,包括分类器、回归器以及多种核函数。

非线性降维技术比较

本网页旨在比较两种流行的非线性降维技术:t-SNE和LLE,并探讨它们在添加数据空洞时的表现。

Cohen's Kappa一致性统计量计算

本页面介绍了Cohen's Kappa一致性统计量的计算方法,这是一种衡量两个标注者在分类问题上达成一致程度的统计指标。

网格搜索与连续减半搜索比较

本文比较了在支持向量机(SVC)估计器中,使用连续减半搜索(HalvingGridSearchCV)和网格搜索(GridSearchCV)进行参数搜索的效果,并展示了两者的效率和准确性。

SGD算法中的惩罚函数比较

本文介绍了SGD算法中常用的三种惩罚函数:L1、L2和弹性网络,并展示了它们在不同参数下的轮廓图。

核岭回归与支持向量回归比较

本文比较了核岭回归(KRR)与支持向量回归(SVR)两种机器学习模型在数据拟合和预测任务中的性能差异。

聚类相似度评估指标

本文介绍了一种用于衡量两个聚类结果相似度的指标,即Rand指数。通过比较真实类别标签与预测聚类标签之间的一致性来计算相似度得分。

压缩感知:L1正则化下的断层成像重建

本页面介绍了如何利用L1正则化技术进行断层成像的图像重建。

多项式与样条插值示例

本网页展示了如何使用岭回归来近似一个函数,通过多项式和样条插值方法。

LassoLarsIC模型选择

本网页介绍了使用LassoLarsIC估计器在糖尿病数据集上进行模型选择的过程,以及如何利用AIC和BIC标准来选择最佳模型。

高斯过程在离散数据结构上的应用

本网页介绍了如何使用高斯过程对非固定长度特征向量形式的数据进行回归和分类任务。

参数化评估器检查

本文介绍了如何使用pytest的参数化装饰器来检查评估器是否符合scikit-learn的API规范。

核密度估计(KDE)示例

本文介绍了核密度估计(KDE)技术,这是一种强大的非参数密度估计方法,用于从数据集中学习生成模型,并从中抽取新的样本。

支持向量机(SVM)参数C对分离线的影响

本文通过图形展示了支持向量机中参数C对数据分离线的影响,以及如何通过调整C值来优化模型的泛化能力。

回归模型中目标转换的影响

本文通过合成数据和艾姆斯房价数据集探讨了在回归模型中对目标变量进行转换的益处。

无监督学习与降维技术

本文介绍了无监督学习中的降维技术,包括主成分分析(PCA)、随机投影和特征聚合等方法,并讨论了它们在数据预处理中的应用。

高斯混合模型可视化

本网页展示了如何使用Python中的matplotlib和sklearn库来生成和可视化两个不同中心和协方差矩阵的高斯分布数据,并拟合高斯混合模型。

稀疏数据集加载指南

本文介绍了如何使用Python加载SVMLight/LibSVM格式的稀疏数据集,并提供了代码示例。

流形学习技术在球面数据集上的应用

本文介绍了流形学习技术在球面数据集上的应用,包括局部线性嵌入、t-SNE等方法,并通过代码展示了这些技术如何将高维数据投影到二维空间。

协方差估计的收缩算法比较

本网页比较了Ledoit-Wolf和OAS两种协方差估计的收缩算法,使用高斯分布数据进行模拟。

数据缺失值处理技术

本文探讨了使用不同的数据填充技术来处理缺失值,包括使用常数0填充、均值填充、k最近邻填充和迭代填充。

机器学习中的模型拟合检查

本文介绍了在机器学习库scikit-learn中如何使用__sklearn_is_fitted__方法来检查模型是否已经拟合,以及如何自定义估计器类。

多输出决策树回归示例

本文介绍了如何使用决策树进行多输出回归,并通过调整树的最大深度来控制模型的复杂度。

特征量化变换方法

本文介绍了一种基于分位数信息的特征变换方法,旨在将特征变换为均匀或正态分布,以减少异常值的影响并提高不同尺度变量的可比性。

沪ICP备2024098111号-1
上海秋旦网络科技中心:上海市奉贤区金大公路8218号1幢 联系电话:15216758379