交叉验证评估模型性能

本文介绍了如何使用scikit-learn库中的cross_validate函数来评估机器学习模型的性能,包括参数设置和使用示例。

局部异常因子(LOF)异常检测

局部异常因子(LOF)是一种无监督异常检测方法,用于计算给定数据点相对于其邻居的局部密度偏差。本文介绍了如何在scikit-learn中使用LOF进行异常检测,并展示了如何生成带有异常值的数据集,拟合模型并绘制结果。

正则化参数优化与模型性能

本文通过Elastic-Net回归模型探讨了正则化参数对训练和测试数据集性能的影响,并使用解释方差R^2作为性能度量。

集成回归预测模型比较

本网页展示了使用GradientBoostingRegressor、RandomForestRegressor和LinearRegression三种不同的回归预测模型,以及它们的集成模型VotingRegressor在糖尿病数据集上的应用和比较。

Tweedie回归评分函数

本文介绍了Tweedie回归评分函数的计算方法和应用示例,包括参数说明和代码实现。

逻辑回归正则化路径分析

本文介绍了使用Iris数据集进行二分类问题的逻辑回归正则化路径分析,包括数据加载、模型训练、正则化路径的计算和可视化。

多项式核近似与线性分类器训练

本文介绍了如何使用PolynomialCountSketch高效生成多项式核特征空间近似,以训练近似核化分类器的线性分类器,并在Covtype数据集上进行实验。

20新闻组数据集加载与向量化

本文介绍了如何使用sklearn库加载和向量化20新闻组数据集,包括参数设置和数据预处理。

数组输入验证指南

本页面介绍了如何对输入的数组、列表或类似结构进行验证,包括数据类型、数值检查、稀疏矩阵格式转换等。

半监督分类器与SVM在Iris数据集上的决策边界比较

本文比较了在Iris数据集上使用半监督分类器Label Spreading、Self-training和SVM生成的决策边界。

目标变换在回归分析中的应用

本文通过合成数据和艾姆斯房价数据集,探讨了在回归分析中对目标变量进行变换以提高模型预测精度的方法。

参数密度估计技术在数据生成模型中的应用

本文介绍了如何使用参数密度估计技术来学习数据集的生成模型,并利用该模型生成新的数据样本。

协方差估计器在分类中的应用

本文介绍了Ledoit-Wolf和OAS协方差估计器在分类问题中的应用,并通过实验比较了它们与传统线性判别分析的性能。

L1正则化分类器的C参数下限计算

本页面介绍了如何计算L1正则化分类器的C参数下限,包括参数说明和示例代码。

交叉验证与模型评估指南

本文介绍了如何使用交叉验证方法来评估机器学习模型的性能,并提供了详细的参数说明和示例代码。

层次聚类方法比较

本网页通过生成的2D数据集,比较了不同的层次聚类方法在处理噪声和非球形数据集时的表现。

Lasso模型选择:AIC与BIC标准

本网页介绍了如何使用AIC和BIC标准来选择最佳的Lasso回归模型,并提供了相应的Python代码示例。

归一化互信息(NMI)评分计算

本页面介绍了归一化互信息(NMI)评分的概念、计算方法以及在sklearn库中的应用示例。

Scikit-learn工具包内部实用工具介绍

本文介绍了Scikit-learn工具包中的内部实用工具,包括数据验证、随机抽样、线性代数计算等。

岭回归分析

本网页介绍了岭回归的概念、原理、参数设置以及如何在Python中使用sklearn库进行岭回归分析。

神经网络权重可视化

本文介绍了如何使用Python和机器学习库scikit-learn来可视化多层感知器(MLP)在MNIST数据集上的权重。

批量生成器示例

本页面提供了一个使用Python的sklearn库中的gen_batches函数来生成批量数据的示例。

不平衡数据集的类别权重估计

本文介绍了如何在不平衡数据集中估计类别权重,以提高机器学习模型的性能。

AdaBoost分类器示例

本页面展示了如何使用AdaBoost分类器对非线性可分数据集进行分类,并绘制了决策边界和决策分数的分布图。

排列测试评分 - 数据科学实例

本网页通过排列测试评分方法,评估交叉验证得分的重要性,并使用Iris数据集进行演示。

支持向量机中的样本权重调整

本文探讨了在支持向量机中如何通过调整样本权重来影响决策边界的形状,特别是对异常值的影响。

线性模型正则化路径分析

本网页展示了如何计算Lasso、Lasso-LARS和Elastic Net正则化路径上的系数。

支持向量机异常检测

本网页介绍了使用支持向量机进行异常检测的方法,包括基于RBF核的OneClassSVM和基于随机梯度下降的SGDOneClassSVM。

多标签文本分类问题模拟

本文介绍了如何使用PCA和CCA进行多标签文本分类问题的模拟和可视化。

准确率分类评分

本页面介绍了在多标签分类中计算准确率的方法,包括参数说明、返回值以及示例代码。

沪ICP备2024098111号-1
上海秋旦网络科技中心:上海市奉贤区金大公路8218号1幢 联系电话:15216758379