分类器的概率校准

本文介绍了如何对分类器进行概率校准,并通过Brier分数评估校准后的概率质量。比较了高斯朴素贝叶斯分类器在未校准、sigmoid校准和等温校准下的性能。

稳健协方差估计器:最小协方差行列式估计器

本文介绍了最小协方差行列式估计器(MCD),这是一种在数据集中存在异常值时,用于估计协方差矩阵的稳健方法。

KDDCup 99 数据集加载指南

本网页提供了关于如何加载KDDCup 99数据集的详细指南,包括参数设置和数据集特点。

多类分类器性能比较

本网页展示了使用不同分类器对三类数据集进行分类的性能比较,包括支持向量机、L1和L2惩罚的逻辑回归、以及高斯过程分类器。

scikit-learn版本更新通知

关注scikit-learn的版本更新,获取最新的机器学习库信息。

多项式核近似与线性分类器训练

本文介绍了如何使用PolynomialCountSketch高效生成多项式核特征空间近似,以训练近似核化分类器的线性分类器,并在Covtype数据集上进行实验。

提升决策树回归模型

本网页介绍了如何使用提升决策树回归模型来提高预测精度,并展示了与单个决策树回归模型的比较。

文本数据加载与处理

本文介绍了如何加载和处理文本数据,以便用于分类或聚类算法。

流形学习技术比较

本文探讨了t-SNE和LLE两种流形学习技术在Swiss Roll数据集上的表现,并分析了它们在数据中添加空洞时的处理方式。

多层感知器中的正则化参数研究

本网页探讨了在多层感知器中不同正则化参数alpha值对合成数据集的影响,并展示了如何通过调整alpha值来控制模型的过拟合和欠拟合问题。

不同层次聚类方法的可视化

本网页展示了在二维数字数据集上应用不同层次聚类方法的可视化效果,包括ward、average、complete和single等链接策略。

基于Xi方法的OPTICS聚类分析

本文介绍了基于Xi方法的OPTICS聚类算法,包括算法参数、执行过程以及代码示例。适用于数据科学和机器学习领域。

Scikit-learn 全局配置指南

本文介绍了如何设置scikit-learn库的全局配置,包括参数验证、内存使用、输出格式等,旨在提高机器学习任务的效率和性能。

不平衡数据集的样本权重估计

本文介绍了如何在不平衡数据集中估计样本权重,以帮助改善分类模型的性能。

数据离散化策略

本文介绍了三种数据离散化策略:均匀离散化、分位数离散化和K均值离散化,并通过Python代码和图表展示了这些策略的应用和效果。

数据归一化处理

本页面介绍了数据归一化的概念、方法和在机器学习中的应用。

K近邻算法与数据缓存优化

本文介绍了如何使用K近邻算法进行数据预处理,并利用缓存技术提高模型训练效率。

数据验证助手函数

本页面介绍了一个用于验证输入数据并设置或检查特征名称和数量的助手函数。适用于需要输入验证的估计器。

高斯混合模型初始化方法比较

本文比较了四种高斯混合模型的初始化方法:kmeans、random、random_from_data和k-means++。通过生成样本数据并使用不同的初始化方法,展示了每种方法的收敛速度和初始化时间。

机器学习算法概览

本文介绍了多种机器学习算法,包括BallTree、KDTree、KNeighborsClassifier、KNeighborsRegressor等,以及它们在数据点问题中的应用。

scikit-learn工具和函数介绍

本页面介绍了scikit-learn库中用于数据科学和机器学习的各种工具和函数。

神经网络权重可视化

本文介绍了如何使用Python和机器学习库scikit-learn来可视化多层感知器(MLP)在MNIST数据集上的权重。

MaxAbsScaler 数据标准化处理

本文介绍了MaxAbsScaler的作用、参数、使用注意事项以及示例代码。MaxAbsScaler是一种将数据特征缩放到[-1, 1]范围内的标准化方法,适用于机器学习和数据科学领域。

高斯过程回归中的噪声水平估计

本文介绍了如何使用高斯过程回归(GPR)来估计数据中的噪声水平,并强调了核函数超参数初始化的重要性。

D^2回归评分函数详解

本文详细介绍了D^2回归评分函数,包括其定义、计算方法、参数说明以及实际应用示例。

支持向量机中的RBF核参数优化

本文介绍了支持向量机中RBF核的gamma和C参数对模型性能的影响,并通过可视化展示了不同参数组合下的效果。

特征选择与递归特征消除算法指南

本网页介绍了特征选择的重要性和几种常用的特征选择方法,包括递归特征消除算法和单变量特征选择器等。

物种分布模型分析

本网页介绍了使用OneClassSVM模型分析南美洲两种哺乳动物的地理分布情况,包括模型拟合、预测分布和ROC曲线下面积的计算。

一维核密度估计示例

本页面展示了一维核密度估计的原理和实现,包括直方图的局限性和不同核函数的应用。

基于新闻组数据集的共聚类算法

本文介绍了在新闻组数据集上应用共聚类算法的过程,包括数据预处理、TF-IDF向量化、Dhillon共聚类算法的应用以及与其他聚类算法的比较。

沪ICP备2024098111号-1
上海秋旦网络科技中心:上海市奉贤区金大公路8218号1幢 联系电话:15216758379