scikit-learn技术文档

一维核密度估计原理

本文介绍了一维核密度估计的基本原理，并通过Python代码示例展示了如何使用直方图和核密度估计来分析一维数据的分布情况。

线性模型Lasso在密集与稀疏数据上的应用

本文探讨了线性模型Lasso在处理密集与稀疏数据时的表现，并对比了两种数据格式下的运行速度。

机器学习中的偏差、方差和噪声

本文探讨了机器学习中模型的偏差、方差和噪声问题，并介绍了如何通过验证曲线和学习曲线来评估模型性能。

Scikit-learn 项目介绍

Scikit-learn 是一个开源的机器学习库，用于Python编程语言。本页面介绍Scikit-learn项目的起源、发展、团队成员以及如何引用和支持该项目。

稀疏矩阵的行缩放操作

本文介绍了如何在Python中使用CSR或CSC格式的稀疏矩阵进行行缩放操作。

参数优化与验证曲线

本文介绍了如何使用sklearn库中的validation_curve函数来分析不同参数值对模型训练和测试分数的影响。

鸢尾花数据集分类分析

本文通过鸢尾花数据集，使用SVM分类器进行分类，并分析了混淆矩阵，探讨了模型参数调优对分类结果的影响。

scikit-learn 1.2版本发布亮点

本文介绍了scikit-learn 1.2版本的新特性、改进和bug修复。

数据集加载工具

本页面介绍了数据集加载工具的使用方法，包括数据集的获取、处理和生成。

邻域成分分析示例

本示例展示了如何使用邻域成分分析（NCA）来学习一个距离度量，以最大化最近邻分类的准确性。

高斯分布分类数据集生成

本页面介绍了如何生成一个多维高斯分布的分类数据集，包括参数设置和代码示例。

模型评估指标指南

本指南提供了模型评估中使用的各类指标的详细说明，包括分类、回归、聚类和双聚类评估指标。

特征选择与F统计量计算

本页面介绍了特征选择的概念，F统计量的计算方法，以及如何在Python中使用sklearn库进行特征选择和F统计量的计算。

模型评分函数的使用与异常处理

本文介绍了如何在机器学习中使用模型评分函数，并处理可能出现的异常情况。

决策树在鸢尾花数据集上的应用

本页面展示了如何利用决策树算法在鸢尾花数据集上进行特征组合和决策边界的绘制。

层次聚类树状图绘制示例

本网页展示了如何使用AgglomerativeClustering和scipy中的dendrogram方法绘制层次聚类的树状图。

鸢尾花数据集分析

本文介绍了如何使用Python和机器学习库对鸢尾花数据集进行加载、可视化和主成分分析（PCA）。

KBinsDiscretizer策略演示

本页面展示了KBinsDiscretizer中实现的不同离散化策略，包括均匀离散化、分位数离散化和K均值离散化，并提供了相应的Python代码示例。

正交匹配追踪算法（OMP）详解

本文详细介绍了正交匹配追踪（OMP）算法的原理、参数设置以及在机器学习中的应用示例。

文档语料库的主题模型提取

本页面展示了在文档语料库上应用非负矩阵分解(NMF)和潜在狄利克雷分配(LDA)来提取主题结构的加法模型，并使用基于权重的前几个词作为条形图表示每个主题。

神经网络权重可视化

本文介绍了如何使用Python和机器学习库scikit-learn来可视化多层感知器（MLP）在MNIST数据集上的权重。

多标签排序问题的平均精度计算

本文介绍了多标签排序问题中的评估指标——平均精度（LRAP），并提供了使用Python计算LRAP的示例代码。

欧几里得距离计算

本页面介绍了如何使用Python的sklearn库来计算两个向量数组之间的欧几里得距离矩阵，包括计算方法、参数说明以及示例代码。

机器学习可视化API指南

本指南旨在为开发者提供机器学习可视化API的详细介绍，包括如何使用API进行数据可视化和绘图工具的开发与维护。

半监督分类器与SVM在Iris数据集上的决策边界比较

本文比较了在Iris数据集上使用半监督分类器Label Spreading、Self-training和SVM生成的决策边界。

scikit-learn交流与支持指南

本页面提供scikit-learn社区交流和获取支持的指南，包括邮件列表、Stack Overflow、GitHub Discussions、问题报告等。

均方根误差回归损失

本文介绍了均方根误差（Root Mean Squared Error）回归损失的概念、计算方法以及在机器学习中的应用。

半监督学习：标签传播模型在手写数字分类中的应用

本文介绍了如何使用标签传播模型在只有少量标签的情况下对手写数字数据集进行分类。

协方差矩阵收缩算法

本文介绍了一种在数据分析中常用的协方差矩阵收缩算法，该算法通过调整系数来计算收缩估计值，提高模型的稳定性和准确性。

交叉验证与排列测试

本文介绍了如何使用排列测试来评估交叉验证分数的统计显著性，以及如何解释得到的p值。

AI人工智能

技术文档

AI人工智能技术文档

一维核密度估计原理

线性模型Lasso在密集与稀疏数据上的应用

机器学习中的偏差、方差和噪声

Scikit-learn 项目介绍

稀疏矩阵的行缩放操作

参数优化与验证曲线

鸢尾花数据集分类分析

scikit-learn 1.2版本发布亮点

数据集加载工具

邻域成分分析示例

高斯分布分类数据集生成

模型评估指标指南

特征选择与F统计量计算

模型评分函数的使用与异常处理

决策树在鸢尾花数据集上的应用

层次聚类树状图绘制示例

鸢尾花数据集分析

KBinsDiscretizer策略演示

正交匹配追踪算法（OMP）详解

文档语料库的主题模型提取

神经网络权重可视化

多标签排序问题的平均精度计算

欧几里得距离计算

机器学习可视化API指南

半监督分类器与SVM在Iris数据集上的决策边界比较

scikit-learn交流与支持指南

均方根误差回归损失

半监督学习：标签传播模型在手写数字分类中的应用

协方差矩阵收缩算法

交叉验证与排列测试

沪ICP备2024098111号-1

上海秋旦网络科技中心：上海市奉贤区金大公路8218号1幢联系电话：17898875485

AI人工智能

技术文档

AI人工智能技术文档

一维核密度估计原理

线性模型Lasso在密集与稀疏数据上的应用

机器学习中的偏差、方差和噪声

Scikit-learn 项目介绍

稀疏矩阵的行缩放操作

参数优化与验证曲线

鸢尾花数据集分类分析

scikit-learn 1.2版本发布亮点

数据集加载工具

邻域成分分析示例

高斯分布分类数据集生成

模型评估指标指南

特征选择与F统计量计算

模型评分函数的使用与异常处理

决策树在鸢尾花数据集上的应用

层次聚类树状图绘制示例

鸢尾花数据集分析

KBinsDiscretizer策略演示

正交匹配追踪算法（OMP）详解

文档语料库的主题模型提取

神经网络权重可视化

多标签排序问题的平均精度计算

欧几里得距离计算

机器学习可视化API指南

半监督分类器与SVM在Iris数据集上的决策边界比较

scikit-learn交流与支持指南

均方根误差回归损失

半监督学习：标签传播模型在手写数字分类中的应用

协方差矩阵收缩算法

交叉验证与排列测试

沪ICP备2024098111号-1

上海秋旦网络科技中心：上海市奉贤区金大公路8218号1幢 联系电话：17898875485

上海秋旦网络科技中心：上海市奉贤区金大公路8218号1幢联系电话：17898875485