本文介绍了scikit-learn 1.4版本的新特性、改进和bug修复。
本页面介绍了如何生成具有钟形奇异值分布的低秩矩阵,这种矩阵在实际应用中非常常见,如面部灰度图像和从网络爬取的文本文档的TF-IDF向量。
本文通过鸢尾花数据集,使用SVM分类器进行分类,并分析了混淆矩阵,探讨了模型参数调优对分类结果的影响。
局部异常因子(LOF)是一种无监督异常检测方法,用于计算给定数据点相对于其邻居的局部密度偏差。本文介绍了如何在scikit-learn中使用LOF进行异常检测,并展示了如何生成带有异常值的数据集,拟合模型并绘制结果。
本页面展示了如何使用PCA方法对鸢尾花数据集进行降维,并在三维空间中进行可视化展示。
本文比较了随机森林(RF)和直方图梯度提升树(HGBT)模型在回归数据集上的得分和计算时间。
本文比较了随机搜索和网格搜索在优化线性SVM的超参数时的效果和效率。
本文通过生成不同密度的数据集,使用OPTICS算法的Xi聚类检测方法和设置特定的可达性阈值来模拟DBSCAN算法,展示了不同阈值下DBSCAN算法的聚类效果。
本网页展示了岭回归系数如何随着正则化参数的变化而变化,以及在处理高度病态矩阵时岭回归的实用性。
本网页旨在比较两种流行的非线性降维技术:t-SNE和LLE,并探讨它们在添加数据空洞时的表现。
本网页介绍了梯度提升算法的基本概念和实现,包括正则化、随机梯度下降和特征采样等策略,以及如何使用Python进行梯度提升分类模型的训练和评估。
本网页介绍了稀疏编码技术,特别是使用Ricker小波变换对信号进行稀疏表示的方法。通过比较不同的稀疏编码方法,展示了如何使用不同的原子宽度来改善信号的稀疏表示。
本页面介绍了均方对数误差回归损失的概念、参数、返回值以及使用示例。
本文介绍了亲和力传播聚类算法的基本原理、参数设置和应用实例,旨在帮助读者理解和掌握这种高效的聚类方法。
本文介绍了使用邻域成分分析(NCA)进行降维的方法,并与PCA和LDA进行了比较。
本页面介绍了如何利用L1正则化技术进行断层成像的图像重建。
葡萄酒数据集是一个经典的多类分类数据集,包含178个样本,每个样本有13个特征。
本文介绍了多标签排序问题中的评估指标——平均精度(LRAP),并提供了使用Python计算LRAP的示例代码。
本网页介绍了如何使用高斯过程对非固定长度特征向量形式的数据进行回归和分类任务。
本文介绍了如何使用随机梯度下降(SGD)训练的线性支持向量机(SVM)来处理一个可分离的数据集,并展示了如何绘制决策边界和数据点。
本文介绍了决策树回归模型在预测带有噪声的圆圈数据中的应用,并通过Python代码展示了不同最大深度参数对模型性能的影响。
本页面展示了如何在使用支持向量分类器(SVC)之前进行单变量特征选择以提高分类分数。我们使用鸢尾花数据集,并添加了36个非信息性特征。
本文介绍了如何使用成本复杂性参数来控制决策树的剪枝,并通过实验展示了不同参数值对模型性能的影响。
本网页介绍了数据预处理和特征提取的基本概念、方法和技术,包括标准化、归一化、编码分类特征、缺失值处理、多项式特征生成、无监督降维等。
本文探讨了随机标记对聚类评估指标的影响,并通过实验分析了固定和变化的真值标签对聚类结果的影响。
本文介绍了如何使用科恩卡帕系数来衡量两个标注者在分类问题上的一致性水平。
本网页介绍了如何在机器学习中处理多类分类问题,包括使用scikit-learn库中的不同策略进行比较和优化。
本文介绍了高斯混合模型在非高斯随机变量混合数据集上的表现,通过正弦曲线上的噪声点数据,探讨了不同模型的选择和效果。
本文介绍了如何使用决策树进行回归分析,并通过调整树的最大深度来控制模型的复杂度,避免过拟合。