scikit-learn 1.4版本发布亮点

本文介绍了scikit-learn 1.4版本的新特性、改进和bug修复。

验证曲线分析

本文介绍了如何使用验证曲线来分析不同参数值对模型性能的影响,并提供了具体的代码示例。

高斯混合模型(GMM)与信息论标准

本文介绍了如何使用信息论标准,如AIC和BIC,来选择高斯混合模型(GMM)的最佳参数,包括协方差类型和模型中的组分数量。

t-SNE 算法的可视化分析

本文通过不同的困惑度值对t-SNE算法进行可视化分析,探讨了不同参数对算法结果的影响。

线性支持向量机(LinearSVC)示例

本页面展示了如何在使用线性支持向量机(LinearSVC)时获取支持向量。通过matplotlib和sklearn库,我们能够可视化分类边界和支持向量。

稀疏编码信号生成示例

本页面展示了如何使用sklearn库中的make_sparse_coded_signal函数生成稀疏编码信号,包括数据集、字典和编码矩阵的生成过程。

K均值与二分K均值聚类算法比较

本网页介绍了K均值算法和二分K均值算法的区别,并提供了Python代码示例,用于生成样本数据并比较两种算法的聚类效果。

多项式特征与线性回归拟合非线性函数

本文介绍了如何使用带有多项式特征的线性回归来近似非线性函数,并通过交叉验证来评估模型的过拟合或欠拟合。

排列测试在模型评估中的应用

本页面介绍了如何使用排列测试来评估交叉验证分数的重要性,并解释了p值在统计学上的意义。

主成分回归与偏最小二乘回归的比较

本文比较了主成分回归(PCR)和偏最小二乘回归(PLS)在一个小数据集上的表现,展示了在目标变量与数据中的某些低方差方向强相关时,PLS如何优于PCR。

F-beta得分计算与应用

本页面介绍了F-beta得分的计算方法和参数,以及如何在不同情况下使用该得分来评估分类模型的性能。

DBSCAN聚类算法提取

本页面介绍了DBSCAN聚类算法的实现和应用,包括算法原理、参数设置和代码示例。

人脸图像补全示例

本网页展示了如何使用多输出估计器来补全人脸图像的下半部分,基于给定的上半部分。比较了极端随机树、K近邻、线性回归和岭回归四种方法的效果。

异常检测与数据结构理解

本文介绍了使用葡萄酒数据集进行异常检测和数据结构理解的分析方法,包括经验协方差估计、稳健协方差估计和单类支持向量机的应用。

人脸数据集加载指南

本网页介绍了如何加载和使用Labeled Faces in the Wild (LFW)人脸数据集,包括数据集的参数设置和使用示例。

Cython 开发技巧

本文介绍了在使用 scikit-learn 时,如何高效地利用 Cython 进行开发,包括性能优化、OpenMP 使用、类型定义等实用技巧。

集成学习在糖尿病数据集上的应用

本网页介绍了如何使用集成学习方法对糖尿病数据集进行回归分析,包括数据加载、模型训练、预测以及结果可视化。

数据离散化对线性回归和决策树的影响

本文探讨了数据离散化对线性回归和决策树模型预测结果的影响。通过使用KBinsDiscretizer对连续特征进行离散化处理,比较了处理前后模型的预测效果。

正交匹配追踪算法(OMP)详解

本文详细介绍了正交匹配追踪算法(OMP)的实现和应用,包括算法原理、参数说明、代码示例以及与其他算法的比较。

PCA降维与模型评估

本文介绍了如何通过PCA降维和网格搜索结合交叉验证来评估和选择模型,以达到最佳的准确率和模型复杂度的平衡。

卡方检验特征选择

本文介绍了如何使用卡方检验进行特征选择,以提高分类任务的性能。

覆盖误差计算方法

本文介绍了覆盖误差这一评估多标签分类模型性能的指标,包括其计算方法、参数说明以及如何使用Python中的sklearn库来计算覆盖误差。

使用scikit-learn的评分器衡量模型性能

本文介绍了如何使用scikit-learn库中的评分器(scorer)来衡量模型性能。

K-Means算法初始化策略的影响评估

本文评估了不同的K-Means算法初始化策略对于算法收敛鲁棒性的影响,通过分析聚类中心的相对标准偏差来衡量。

机器学习可视化API:ROC曲线示例

本网页通过scikit-learn的可视化API展示了如何绘制并比较ROC曲线,包括支持向量分类器和随机森林分类器的ROC曲线。

贝叶斯回归分析比较

本文比较了各种贝叶斯回归模型,包括线性贝叶斯回归器、弹性网络、L1惩罚和稀疏信号模型等,并探讨了它们在不同数据集上的表现。

汉明损失计算

本文介绍了汉明损失的概念、计算方法以及在多类分类和多标签分类中的应用。

高斯过程回归:基础入门示例

本文介绍了高斯过程回归(Gaussian Process Regression)的基本概念,包括无噪声和有噪声情况下的模型拟合和预测。

连续减半搜索示例

本网页介绍了如何使用连续减半搜索(Successive Halving)方法来选择最佳的参数组合。

K-Means与MiniBatchKMeans聚类算法性能比较

本文对比了K-Means和MiniBatchKMeans两种聚类算法的性能,并展示了如何生成数据集、执行聚类以及结果的可视化。

沪ICP备2024098111号-1
上海秋旦网络科技中心:上海市奉贤区金大公路8218号1幢 联系电话:15216758379