scikit-learn技术文档

数据预处理：列选择器的使用

本文介绍了如何使用sklearn库中的ColumnTransformer和make_column_selector函数来选择数据集中的特定列进行预处理。

互信息估计与特征选择

本文介绍了如何使用互信息估计方法进行特征选择，并提供了代码示例。

生成随机回归问题

本页面介绍了如何使用scikit-learn库生成随机回归问题，包括参数设置和示例代码。

Tweedie回归评分函数

本文介绍了Tweedie回归评分函数的计算方法和应用示例，包括参数说明和代码实现。

数据可视化API使用指南

本网页介绍了如何使用数据可视化API进行快速绘图和视觉调整，无需重新计算。

多指标网格搜索示例

本页面展示了如何使用Python的scikit-learn库进行多指标网格搜索，并使用决策树分类器进行模型选择和评估。

多标签分类数据可视化

本页面展示了如何使用Python和matplotlib库来可视化多标签分类数据。

均值漂移聚类算法演示

本页面介绍了均值漂移算法的基本概念和实现，包括算法的数学原理、Python代码示例和可视化结果。

高斯混合模型选择

本网页展示了如何使用信息论标准对高斯混合模型（GMM）进行模型选择，包括协方差类型和模型中组件的数量。

数据变换与正态分布映射

本文介绍了如何使用PowerTransformer和QuantileTransformer将不同分布的数据映射到正态分布，并分析了变换前后的数据可视化效果。

图像硬币分割的分层聚类分析

本页面展示了如何使用Ward分层聚类算法对硬币图像进行分割处理，并通过代码示例和结果展示详细说明了聚类过程和效果。

数据可视化示例

本页面展示了使用matplotlib和sklearn库生成的多种数据可视化图表，包括不同特征数量和类别的数据点分布图。

正则化参数Alpha对决策边界的影响

本文探讨了正则化参数Alpha在不同数据集上对决策边界的影响，并通过代码示例展示了不同Alpha值如何影响模型的决策边界。

处理缺失值的欧几里得距离计算

本文介绍了一种在存在缺失值的情况下计算欧几里得距离的方法，详细解释了算法原理，并提供了Python代码示例。

半监督学习算法介绍

本文介绍了半监督学习算法在sklearn库中的实现，包括自我训练算法和标签传播算法的原理和应用。

二元分类数据生成

本页面介绍了如何生成用于二元分类的样本数据，这些数据基于标准独立高斯分布，并根据特定的规则定义目标变量。

模型评估与解释性分析

本文探讨了模型评估中的常见问题，以及如何通过解释性分析来理解模型预测，并提供了一系列工具和方法来评估模型假设和偏差，设计更好的模型，诊断模型性能问题。

协方差估计与分类性能提升

本网页探讨了Ledoit-Wolf和Oracle Approximating Shrinkage (OAS)估计器如何提升分类性能。

基于特征矩阵的Ward聚类算法

本文介绍了基于特征矩阵的Ward聚类算法，这是一种递归合并聚类方法，旨在最小化簇内方差。

字典学习矩阵分解问题解决方案

本页面提供了一个关于如何使用字典学习解决矩阵分解问题的详细解释，包括算法参数、代码示例和结果分析。

递归特征消除与交叉验证

本页面介绍了如何使用递归特征消除（RFE）结合交叉验证来自动调整所选特征的数量。

约翰逊-林登斯特劳斯引理与随机投影

本文介绍了约翰逊-林登斯特劳斯引理在随机投影中的应用，解释了如何通过随机投影来降低数据维度，同时保持数据点间距离的相对不变性。

OPTICS聚类算法演示

本页面展示了OPTICS聚类算法的工作原理，包括数据生成、算法应用以及结果的可视化展示。

SVM-Anova特征选择示例

本页面展示了如何在使用支持向量分类器（SVC）之前进行单变量特征选择以提高分类分数。我们使用鸢尾花数据集，并添加了36个非信息性特征。

核密度估计（KDE）示例

本文介绍了核密度估计（KDE）技术，这是一种强大的非参数密度估计方法，用于从数据集中学习生成模型，并从中抽取新的样本。

不同聚类算法的比较分析

本文通过生成的二维数据集，比较了多种聚类算法的特性和效果，包括参数敏感度和对不同数据结构的适应性。

数据科学中的无监督学习技术

本文介绍了数据科学中无监督学习的各种技术，包括降维、聚类、双聚类、信号分解、协方差估计、异常检测和密度估计等。

数组对称性检查工具

本工具用于检查和转换数组的对称性，确保输入的矩阵是二维、方阵且对称。

梯度提升回归模型实例

本网页介绍了使用梯度提升方法构建回归预测模型的过程，包括数据加载、预处理、模型训练、结果评估和特征重要性分析。

非负矩阵分解（NMF）介绍

本网页介绍了非负矩阵分解（NMF）的概念、算法和应用示例。NMF是一种用于数据降维、源分离或主题提取的矩阵分解技术。

AI人工智能

技术文档

AI人工智能技术文档

数据预处理：列选择器的使用

互信息估计与特征选择

生成随机回归问题

Tweedie回归评分函数

数据可视化API使用指南

多指标网格搜索示例

多标签分类数据可视化

均值漂移聚类算法演示

高斯混合模型选择

数据变换与正态分布映射

图像硬币分割的分层聚类分析

数据可视化示例

正则化参数Alpha对决策边界的影响

处理缺失值的欧几里得距离计算

半监督学习算法介绍

二元分类数据生成

模型评估与解释性分析

协方差估计与分类性能提升

基于特征矩阵的Ward聚类算法

字典学习矩阵分解问题解决方案

递归特征消除与交叉验证

约翰逊-林登斯特劳斯引理与随机投影

OPTICS聚类算法演示

SVM-Anova特征选择示例

核密度估计（KDE）示例

不同聚类算法的比较分析

数据科学中的无监督学习技术

数组对称性检查工具

梯度提升回归模型实例

非负矩阵分解（NMF）介绍

沪ICP备2024098111号-1

上海秋旦网络科技中心：上海市奉贤区金大公路8218号1幢联系电话：17898875485

AI人工智能

技术文档

AI人工智能技术文档

数据预处理：列选择器的使用

互信息估计与特征选择

生成随机回归问题

Tweedie回归评分函数

数据可视化API使用指南

多指标网格搜索示例

多标签分类数据可视化

均值漂移聚类算法演示

高斯混合模型选择

数据变换与正态分布映射

图像硬币分割的分层聚类分析

数据可视化示例

正则化参数Alpha对决策边界的影响

处理缺失值的欧几里得距离计算

半监督学习算法介绍

二元分类数据生成

模型评估与解释性分析

协方差估计与分类性能提升

基于特征矩阵的Ward聚类算法

字典学习矩阵分解问题解决方案

递归特征消除与交叉验证

约翰逊-林登斯特劳斯引理与随机投影

OPTICS聚类算法演示

SVM-Anova特征选择示例

核密度估计（KDE）示例

不同聚类算法的比较分析

数据科学中的无监督学习技术

数组对称性检查工具

梯度提升回归模型实例

非负矩阵分解（NMF）介绍

沪ICP备2024098111号-1

上海秋旦网络科技中心：上海市奉贤区金大公路8218号1幢 联系电话：17898875485

上海秋旦网络科技中心：上海市奉贤区金大公路8218号1幢联系电话：17898875485