局部异常因子(LOF)异常检测方法

局部异常因子(LOF)是一种无监督异常检测方法,用于计算给定数据点与其邻居的局部密度偏差。本网页介绍了如何使用LOF进行异常检测,包括生成带有异常值的数据、模型拟合、结果绘图等步骤。

梯度提升树的OOB估计

本文介绍了梯度提升树中OOB估计的概念、计算方法以及如何使用OOB估计来确定模型的最佳迭代次数。

教育经济学中的因果效应分析

本文通过模拟数据来探讨教育经济学中的一个重要问题:大学学位对小时工资的因果效应。

Theil-Sen 回归分析示例

本文介绍了Theil-Sen回归分析方法,并通过代码示例展示了其在处理包含异常值的数据集时的鲁棒性。

逻辑回归正则化路径分析

本文介绍了使用Iris数据集进行二分类问题的逻辑回归正则化路径分析,包括数据加载、模型训练、正则化路径的计算和可视化。

随机森林特征重要性评估

本页面展示了如何使用随机森林算法评估特征在分类任务中的重要性,并比较了基于不纯度减少和排列重要性两种方法。

图像量化压缩示例

本网页展示了如何使用Python和SciPy对图像进行量化压缩,包括原始图像的加载、信息检查、量化压缩过程以及压缩效果的展示。

机器学习模型评估与优化

本文介绍了机器学习中模型评估和优化的多种方法,包括交叉验证、超参数优化、ROC曲线等关键概念和技术。

糖尿病数据集分析

本文介绍了如何加载和分析糖尿病数据集,包括数据的维度、特征和目标变量的描述,以及如何使用Python进行数据加载和基本操作。

随机化算法与主成分分析

本文介绍了随机化算法在主成分分析中的应用,包括算法原理、参数设置和代码示例。

K-Means++ 初始质心选择示例

通过sklearn.cluster.kmeans_plusplus函数生成聚类初始种子的示例,展示了K-Means++初始化方法的输出结果。

参数密度估计技术在数据生成模型中的应用

本文介绍了如何使用参数密度估计技术来学习数据集的生成模型,并利用该模型生成新的数据样本。

半监督文本数据分类

本网页介绍了半监督学习在文本数据集上的分类应用,包括SGD分类器、自我训练分类器和标签传播方法。

递归特征消除(RFE)在手写数字识别中的应用

本文介绍了如何使用递归特征消除(RFE)方法来确定手写数字识别中各个像素的重要性,并展示了如何通过代码实现这一过程。

归一化互信息(NMI)评分计算

本页面介绍了归一化互信息(NMI)评分的概念、计算方法以及在sklearn库中的应用示例。

岭回归分析

本网页介绍了岭回归的概念、原理、参数设置以及如何在Python中使用sklearn库进行岭回归分析。

使用线性支持向量机的可分离数据集

本文介绍了如何使用随机梯度下降(SGD)训练的线性支持向量机(SVM)来处理一个可分离的数据集,并展示了如何绘制决策边界和数据点。

神经网络权重可视化

本文介绍了如何使用Python和机器学习库scikit-learn来可视化多层感知器(MLP)在MNIST数据集上的权重。

手写数字识别数据集使用指南

本文介绍了如何使用scikit-learn库中的手写数字数据集进行机器学习任务,包括数据加载、图像展示以及相关参数说明。

聚类算法演示与比较

本网页介绍了多种聚类算法的演示和比较,包括K-Means、层次聚类、均值漂移等,并探讨了聚类算法在图像分割、颜色量化等方面的应用。

支持向量机中的正则化参数调整

本文探讨了在使用支持向量机进行分类时,如何根据样本数量调整正则化参数C,以达到最佳的分类效果。

机器学习可视化API指南

本指南旨在为开发者提供机器学习可视化API的详细介绍,包括如何使用API进行数据可视化和绘图工具的开发与维护。

特征排列重要性与随机森林分类器

本文探讨了如何使用排列重要性来评估随机森林分类器中特征的重要性,并展示了如何处理多重共线性问题,以提高模型的准确性。

主成分分析(PCA)在Iris数据集上的应用

本文介绍了如何使用主成分分析(PCA)技术对Iris数据集进行降维处理,并展示了数据的三维可视化效果。

数据可视化:混淆矩阵、ROC曲线和精确率召回率曲线

本页面介绍如何使用Python中的sklearn库进行数据可视化,包括混淆矩阵、ROC曲线和精确率召回率曲线的绘制方法。

Python科学计算生态系统入门

本文为初学者提供了Python科学计算生态系统的入门指南,包括NumPy数组的基础知识,并推荐了一系列针对特定领域的在线教程和视频资源。

多类分类策略比较与优化

本网页介绍了如何在机器学习中处理多类分类问题,包括使用scikit-learn库中的不同策略进行比较和优化。

数组转换为浮点数类型

本页面介绍了如何将数组转换为浮点数类型,包括转换过程中的参数设置和数据类型处理。

模型正则化对误差的影响

本网页介绍了线性模型中正则化参数对训练和测试误差的影响,并展示了如何通过验证曲线确定最优正则化参数,以及如何比较真实系数和估计系数。

DBSCAN与HDBSCAN聚类算法比较

本文介绍了DBSCAN和HDBSCAN两种聚类算法,并比较了它们在特定数据集上的表现,同时评估了HDBSCAN对某些超参数的敏感性。

沪ICP备2024098111号-1
上海秋旦网络科技中心:上海市奉贤区金大公路8218号1幢 联系电话:15216758379