scikit-learn库新特性介绍

本文介绍了scikit-learn库的新版本更新,包括bug修复、性能提升和新特性介绍,如元数据路由、HDBSCAN聚类算法、TargetEncoder编码策略等。

贡献代码与问题报告指南

本指南旨在帮助开发者了解如何为开源项目贡献代码,报告问题,并参与项目的持续集成和性能监控。

非负最小二乘法与普通最小二乘法比较

本文比较了非负最小二乘法(NNLS)和普通最小二乘法(OLS)在拟合线性模型时的表现,包括回归系数的比较和模型的稀疏性。

生成棋盘状数组以进行双聚类分析

本页面提供了一个用于生成棋盘状结构数组的函数,该数组可用于双聚类分析。

目标编码与交叉拟合在机器学习中的应用

本文探讨了目标编码和交叉拟合在机器学习数据预处理中的重要性,并通过实例演示了如何使用这些技术来提高模型的泛化能力。

scikit-learn版本更新通知

关注scikit-learn的版本更新,获取最新的机器学习库信息。

对数损失函数详解

本文详细解释了对数损失函数,包括其定义、计算方式、参数说明以及在逻辑回归和神经网络中的应用。

计算点与点集之间的最小距离

本文介绍了如何使用一个函数来计算一个点与一组点之间的最小距离,包括参数设置和代码示例。

决策树在鸢尾花数据集上的应用

本页面展示了如何利用决策树算法在鸢尾花数据集上进行特征组合和决策边界的绘制。

在线求解器性能比较

本网页展示了不同在线求解器在手写数字数据集上的性能比较。

K-means聚类算法初始化策略

本文探讨了K-means聚类算法的不同初始化策略对运行时间和结果质量的影响,并使用真实数据集进行了实验验证。

协方差估计与异常检测

本网页介绍了协方差估计和异常检测的基本概念,包括椭圆包络、经验协方差、图形Lasso、Ledoit-Wolf估计等方法,并提供了相应的计算公式和代码示例。

决策树剪枝与成本复杂性剪枝

本文介绍了如何使用成本复杂性剪枝来控制决策树的规模,并通过实例代码展示了不同ccp_alpha值对决策树的影响。

亲和力传播聚类算法

本文介绍了亲和力传播聚类算法的基本原理、参数设置和应用实例,旨在帮助读者理解和掌握这种高效的聚类方法。

机器学习算法概览

本文介绍了多种机器学习算法,包括BallTree、KDTree、KNeighborsClassifier、KNeighborsRegressor等,以及它们在数据点问题中的应用。

数据集生成:圆形数据集

本页面介绍了如何生成一个包含内圈和外圈的圆形数据集,用于可视化聚类和分类算法的效果。

支持向量机中的正则化参数调整

本文探讨了在使用支持向量机进行分类时,如何根据样本数量调整正则化参数C,以达到最佳的分类效果。

模型拟合验证

本文介绍了如何使用机器学习库中的函数来验证模型是否已经拟合,并提供了相应的代码示例。

糖尿病数据集的LASSO路径计算

本文介绍了如何使用LASSO方法计算糖尿病数据集的正则化路径,并展示了系数向量随正则化参数变化的可视化结果。

距离矩阵计算指南

本页面提供了关于如何计算距离矩阵的详细指南,包括不同的距离度量方法和参数设置。

零一分类损失函数

本文介绍了零一分类损失函数的计算方法,包括参数说明、返回值以及在多标签分类中的应用。

ROC与DET曲线比较分类器性能

本文介绍了如何使用ROC和DET曲线来比较不同分类器的性能,并提供了相应的Python代码实现。

协方差估计与正则化

本网页介绍了在统计学中如何使用最大似然估计来计算协方差,并通过正则化来减少其方差,同时介绍了几种不同的正则化参数设置方法。

贝叶斯高斯混合模型分析

本网页探讨了贝叶斯高斯混合模型中权重浓度先验的不同类型对模型拟合数据的影响。通过比较Dirichlet分布先验和Dirichlet过程先验,展示了模型如何自动适应混合成分的数量,并分析了不同浓度先验值对模型结果的影响。

随机投影技术在高维数据集中的应用

本网页介绍了随机投影技术在高维数据集中的应用,包括理论基础、代码实现和实验验证。

嵌套与非嵌套交叉验证比较

本文比较了在鸢尾花数据集上的分类器上嵌套与非嵌套交叉验证策略。嵌套交叉验证通常用于训练需要优化超参数的模型。

列变换器与异构数据源

本网页介绍了如何使用列变换器处理包含不同类型特征的数据集,并通过20个新闻组数据集示例展示了具体的实现方法。

K均值与二分K均值聚类算法性能比较

本网页展示了常规K均值聚类算法与二分K均值聚类算法之间的差异,并提供了代码示例和可视化图表。

基于新闻组数据集的共聚类算法

本文介绍了在新闻组数据集上应用共聚类算法的过程,包括数据预处理、TF-IDF向量化、Dhillon共聚类算法的应用以及与其他聚类算法的比较。

K-Means与MiniBatchKMeans聚类算法性能比较

本文对比了K-Means和MiniBatchKMeans两种聚类算法的性能,并展示了如何生成数据集、执行聚类以及结果的可视化。

沪ICP备2024098111号-1
上海秋旦网络科技中心:上海市奉贤区金大公路8218号1幢 联系电话:15216758379