scikit-learn 1.4版本发布亮点

本文介绍了scikit-learn 1.4版本的新特性、改进和bug修复。

稳健协方差估计与马氏距离的相关性

本文介绍了在高斯分布数据中使用稳健协方差估计和马氏距离来识别异常值和进行数据聚类。

稳健回归估计器:Theil-Sen与OLS和RANSAC的比较

本文比较了Theil-Sen估计器与OLS和RANSAC估计器在处理异常值时的性能,并提供了Python代码示例。

目标编码器与交叉拟合

本文介绍了目标编码器的内部交叉拟合机制,以及它如何帮助防止机器学习模型过拟合。通过构建合成数据集,展示了目标编码器在有无交叉拟合时对模型性能的影响。

生成棋盘状数组以进行双聚类分析

本页面提供了一个用于生成棋盘状结构数组的函数,该数组可用于双聚类分析。

数字分类练习教程

本教程介绍了如何使用分类技术对数字数据集进行分类,包括KNN和逻辑回归方法的应用。

混淆矩阵计算与评估

本文介绍了混淆矩阵的概念、计算方法以及在机器学习分类任务中的应用,并通过代码示例展示了如何使用混淆矩阵来评估分类模型的准确度。

不平衡数据集的样本权重估计

本文介绍了如何在不平衡数据集中估计样本权重,以帮助改善分类模型的性能。

随机搜索与网格搜索优化线性SVM的超参数

本文比较了随机搜索和网格搜索在优化线性SVM的超参数方面的效率和性能。

逻辑回归中的L1惩罚与稀疏性

本文比较了在不同C值下,使用L1、L2和Elastic-Net惩罚的逻辑回归模型的稀疏性。

生成高斯数据簇

本页面提供了一个关于如何使用scikit-learn库中的make_blobs函数来生成高斯数据簇的详细指南。

机器学习策略对比

本文探讨了不同的机器学习策略,包括SGD和Adam,以及它们在不同数据集上的表现。

机器学习与因果效应推断的局限性

本文探讨了机器学习模型在统计关联和因果效应推断中的局限性,并通过模拟数据集来说明遗漏变量偏差对因果效应估计的影响。

图像去噪与字典学习

本网页介绍了使用在线字典学习和不同的变换方法对浣熊脸部图像碎片进行去噪的过程。

数组对称性检查工具

本工具用于检查和转换数组的对称性,确保输入的矩阵是二维、方阵且对称。

支持向量机(SVM)在鸢尾花数据集上的应用

本文介绍了如何使用支持向量机(SVM)在鸢尾花数据集上进行分类,并展示了不同核函数下的决策边界。

不平衡数据集的类别权重估计

本文介绍了如何在不平衡数据集中估计类别权重,以提高机器学习模型的性能。

正则化方法对模型系数的影响

本网页探讨了在不同正则化参数C值下,L1、L2和Elastic-Net惩罚对模型系数稀疏性的影响,并展示了如何使用Python进行数字图像分类。

机器学习可视化API指南

本指南旨在为开发者提供机器学习可视化API的详细介绍,包括如何使用API进行数据可视化和绘图工具的开发与维护。

排列测试评分 - 数据科学实例

本网页通过排列测试评分方法,评估交叉验证得分的重要性,并使用Iris数据集进行演示。

ROC与DET曲线比较分类器性能

本文介绍了如何使用ROC和DET曲线来比较不同分类器的性能,并提供了相应的Python代码实现。

贝叶斯回归分析比较

本文比较了各种贝叶斯回归模型,包括线性贝叶斯回归器、弹性网络、L1惩罚和稀疏信号模型等,并探讨了它们在不同数据集上的表现。

汉明损失计算

本文介绍了汉明损失的概念、计算方法以及在多类分类和多标签分类中的应用。

线性模型正则化路径分析

本网页展示了如何计算Lasso、Lasso-LARS和Elastic Net正则化路径上的系数。

精确度计算方法

本文介绍了精确度的计算方法,包括二分类和多分类情况下的计算公式和参数设置。

多标签数据集可视化

本页面展示了如何使用Python和matplotlib库来生成并可视化一个随机的多标签数据集。

嵌套与非嵌套交叉验证比较

本文比较了在鸢尾花数据集上的分类器上嵌套与非嵌套交叉验证策略。嵌套交叉验证通常用于训练需要优化超参数的模型。

数据特征提取与处理流程

本文介绍了如何使用ColumnTransformer处理包含不同类型特征的数据集,并通过20 newsgroups数据集演示了具体的实现方法。

K近邻回归模型示例

本页面展示了使用K近邻算法进行回归预测的示例,包括如何生成样本数据、训练模型以及使用不同的权重方法来预测数据。

多类分类策略比较

本文探讨了在目标变量包含多于两个类别时的分类问题,即多类分类问题,并比较了不同的多类分类策略。

沪ICP备2024098111号-1
上海秋旦网络科技中心:上海市奉贤区金大公路8218号1幢 联系电话:15216758379