机器学习算法概览

本文详细介绍了各种机器学习算法,包括线性模型、回归分析、分类器等,以及它们的应用和实现细节。

20新闻组数据集加载与向量化

本文介绍了如何使用sklearn库加载和向量化20新闻组数据集,包括参数设置和数据预处理。

迭代插补方法比较

本网页介绍了使用IterativeImputer类进行缺失值插补的几种不同估计器的比较。

交叉验证预测方法

本网页介绍了交叉验证预测方法,包括数据分割策略、参数设置以及如何使用这种方法来评估机器学习模型的泛化性能。

梯度提升算法与模型优化

本网页探讨了如何使用梯度提升算法进行机器学习模型的优化,并通过随机森林的OOB误差和交叉验证来估计最优迭代次数。

聚类算法演示与比较

本网页展示了多种聚类算法的演示和比较,包括K-Means、层次聚类、均值漂移等,并探讨了聚类性能评估和特征选择的方法。

scikit-learn新特性介绍

本文介绍了scikit-learn库的最新版本中引入的一些关键特性,包括对分类数据的支持、改进的内存和运行时间效率等。

不平衡数据集的类别权重估计

本文介绍了如何在不平衡数据集中估计类别权重,以提高机器学习模型的性能。

半监督文本数据分类

本网页介绍了半监督学习在文本数据集上的分类应用,包括SGD分类器、自我训练分类器和标签传播方法。

自训练分类器阈值影响分析

本文通过乳腺癌数据集演示了自训练分类器在不同阈值设置下的效果。

数据科学与机器学习应用案例

本文介绍了数据科学和机器学习在多个领域的应用案例,包括压缩感知、人脸检测、图像去噪、时间序列预测等。

贝叶斯岭回归与自动相关性确定

本文介绍了贝叶斯岭回归和自动相关性确定(ARD)在回归分析中的应用,包括模型的健壮性、系数的恢复、以及多项式特征扩展的使用。

数据生成器在机器学习中的应用

本文介绍了多种数据生成器,包括分类、聚类、回归和流形学习的数据生成器,以及它们在机器学习中的应用。

数据生成器概览

本文介绍了各种数据生成器的用途和特点,包括分类、聚类、回归、流形学习和分解等类型的数据生成器。

特征离散化在分类数据集中的应用

本文通过合成的分类数据集,展示了特征离散化技术如何通过将特征分解成多个区间,并使用独热编码,来增强线性分类器的性能。同时,对比了在线性可分和非线性可分数据集上,特征离散化对分类器性能的影响。

模型性能比较:Lasso、ARD与ElasticNet

本网页介绍了Lasso、ARD和ElasticNet三种模型在处理高维稀疏数据时的性能比较。

手写数字识别示例

本示例展示了如何使用scikit-learn库来识别0到9的手写数字图像。

KMeans聚类分析与轮廓系数评估

本文介绍了如何使用轮廓系数来评估KMeans聚类算法的效果,并通过数据可视化展示了不同聚类数量下的结果。

支持向量机中的正则化参数调整

本文探讨了在使用支持向量机进行分类时,如何根据样本数量调整正则化参数C,以达到最佳的分类效果。

D^2回归评分函数详解

本文详细介绍了D^2回归评分函数,包括其定义、计算方法、参数说明以及实际应用示例。

孤立森林算法示例

本文介绍了孤立森林算法的基本概念,并通过Python代码示例展示了如何在玩具数据集上训练孤立森林模型,并可视化其决策边界。

平衡准确率计算方法

本文介绍了平衡准确率的概念,它用于处理二分类和多类分类问题中的数据不平衡问题,定义为每个类别召回率的平均值。

Pytest 参数化估计器检查

本文介绍了如何使用Pytest的装饰器来参数化估计器检查,确保估计器遵循scikit-learn的约定。

数据离散化对线性回归和决策树的影响

本文探讨了数据离散化对线性回归和决策树模型预测结果的影响。通过使用KBinsDiscretizer对连续特征进行离散化处理,比较了处理前后模型的预测效果。

非线性降维技术比较

本网页旨在比较两种流行的非线性降维技术:t-SNE和LLE,并探讨它们在添加数据空洞时的表现。

谱嵌入算法介绍

本文介绍了谱嵌入算法,即Laplacian Eigenmaps,这是一种基于图拉普拉斯矩阵的特征向量进行数据降维的方法。

线性模型与网格搜索

本文介绍了如何使用GridSearchCV进行线性模型的参数优化,并通过matplotlib进行结果可视化。

数据可视化:混淆矩阵、ROC曲线和精确率召回率曲线

本页面介绍如何使用Python中的sklearn库进行数据可视化,包括混淆矩阵、ROC曲线和精确率召回率曲线的绘制方法。

逻辑回归决策边界可视化

本页面展示了如何使用Python的scikit-learn库来绘制多类别逻辑回归和One-vs-Rest逻辑回归的决策边界。

K-means聚类算法初始化策略

本文探讨了K-means聚类算法的不同初始化策略对运行时间和结果质量的影响,并使用真实数据集进行了实验验证。

沪ICP备2024098111号-1
上海秋旦网络科技中心:上海市奉贤区金大公路8218号1幢 联系电话:17898875485