本文介绍了在高斯分布数据中使用稳健协方差估计和马氏距离来识别异常值和进行数据聚类。
本文介绍了如何使用Python的scikit-learn库来绘制加权样本的决策函数图。通过调整样本权重,观察模型决策边界的变化。
介绍如何将数组转换为浮点数数组,包括参数说明、返回值和示例代码。
本页面展示了如何使用Python和matplotlib库来可视化不同的机器学习损失函数,包括零一损失、合页损失、感知器损失等。
本文介绍了数据科学中无监督学习的各种技术,包括降维、聚类、双聚类、信号分解、协方差估计、异常检测和密度估计等。
本页面展示了如何使用随机森林算法评估特征在分类任务中的重要性,并比较了基于不纯度减少和排列重要性两种方法。
本文详细介绍了模型验证和参数调优的方法,包括交叉验证、参数搜索、决策阈值调整和评估指标。
本文比较了主成分回归(PCR)和偏最小二乘回归(PLS)在一个小数据集上的表现,展示了在目标变量与数据中的某些低方差方向强相关时,PLS如何优于PCR。
本文介绍了如何使用sklearn库中的ColumnTransformer和make_column_selector函数来选择数据集中的特定列进行预处理。
本文探讨了机器学习中不同算法的比较,包括异常检测算法、核岭回归与支持向量回归的对比,以及如何利用可视化工具来展示机器学习模型和管道。
本文介绍了一种利用谱聚类算法进行图像分割的技术,通过构建图模型并应用梯度最小化策略来分离图像中的不同对象。
本文介绍了如何使用scikit-learn库中的make_scorer函数来创建一个评分器,并详细解释了其参数和使用方法。
本文介绍了如何在scikit-learn库中使用set_output方法来配置模型输出为pandas DataFrame格式,并提供了详细的代码示例。
本文介绍了随机化算法在主成分分析中的应用,包括算法原理、参数设置和代码示例。
本文介绍了高斯混合模型(GMM)在鸢尾花数据集上的应用,包括不同协方差类型的表现比较和代码实现。
本网页旨在通过线性回归模型分析,比较不同特征对目标变量的影响,并展示模型的可视化效果。
本文通过一个实例比较了F检验和互信息在特征选择中的不同表现,展示了它们在处理线性和非线性关系时的差异。
本文介绍了如何使用Python和机器学习库对鸢尾花数据集进行加载、可视化和主成分分析(PCA)。
本文介绍了如何使用轮廓系数来评估KMeans聚类算法的效果,并通过数据可视化展示了不同聚类数量下的结果。
本文比较了PCA和KernelPCA在数据投影上的差异,展示了KernelPCA在非线性数据分离上的优势。
本网页介绍了如何使用在线学习算法处理大型图像数据集,通过分块加载和提取图像块,使用MiniBatchKMeans进行聚类分析。
本页面展示了亲和力传播聚类算法的实现过程,包括数据生成、算法应用、结果评估和可视化展示。
本页面展示了如何使用基于邻居的查询(特别是核密度估计)来处理地理空间数据,使用基于Haversine距离度量的球面坐标。
本文介绍了使用不同的核函数进行支持向量回归(SVR)的比较,包括线性核、多项式核和RBF核。
本文介绍了如何使用谱聚类技术对图像进行分割,包括kmeans、离散化和QR分解等方法。
本网页介绍了如何使用非负矩阵分解(NMF)和潜在狄利克雷分配(LDA)对文档集合进行主题提取,并展示了使用Python和scikit-learn库实现的代码示例。
本网页介绍了使用字典学习进行图像去噪的方法,并通过实验比较了不同的变换方法在重建噪声图像时的效果。
本文介绍了如何使用PCA和LDA对鸢尾花数据集进行分析,包括数据的预处理、模型的建立和结果的可视化。
本文介绍了汉明损失的概念、计算方法以及在多类分类和多标签分类中的应用。
本网页展示了如何计算Lasso、Lasso-LARS和Elastic Net正则化路径上的系数。