本文比较了在Iris数据集上使用半监督分类器Label Spreading、Self-training和SVM生成的决策边界。
本文介绍了Scikit-learn库中使用的各种混合类,包括分类器、回归器、聚类器等,并提供了如何克隆估计器和判断其类型的方法。
本文探讨了机器学习中不同算法的比较,包括异常检测算法、核岭回归与支持向量回归的对比,以及如何利用可视化工具来展示机器学习模型和管道。
本文介绍了如何使用scikit-learn库中的GridSearchCV进行多指标参数搜索,并通过图形化展示评估结果。
本页面提供了一个关于如何使用scikit-learn库中的make_blobs函数来生成高斯数据簇的详细指南。
本文探讨了不同的机器学习策略,包括SGD和Adam,以及它们在不同数据集上的表现。
本文介绍了Oracle Approximating Shrinkage算法,这是一种用于估计协方差的技术,广泛应用于数据科学和机器学习领域。
本文介绍了一种在机器学习中常用的数据重采样方法,包括参数说明、代码示例和使用场景。
本文通过分析神经网络的权重,探讨学习行为,使用MNIST数据集训练MLP分类器,并通过可视化权重矩阵来理解学习过程。
本页面介绍了如何使用特征联合构造器来组合多个变换器,并通过并行处理提高效率。
本文介绍了解决多标签分类问题的几种策略,包括独立模型、分类器链和集成模型,并使用酵母数据集进行实验比较。
本页面介绍了层次聚类算法在瑞士卷数据集上的应用,包括无结构和有结构的聚类方法,并提供了相应的Python代码示例。
本文比较了在贝叶斯岭回归问题中,单变量特征选择和特征聚合方法的效果。
本文详细介绍了稀疏编码算法的工作原理,参数设置以及在Python中使用sklearn库进行稀疏编码的示例代码。
本页面展示了如何在使用支持向量分类器(SVC)之前进行单变量特征选择以提高分类分数。我们使用鸢尾花数据集,并添加了36个非信息性特征。
本文介绍了如何使用成本复杂性参数来控制决策树的剪枝,并通过实验展示了不同参数值对模型性能的影响。
本页面展示了OPTICS聚类算法的工作原理,包括数据生成、算法应用以及结果的可视化展示。
本文介绍了一种评估降维后数据信任度的方法,该方法基于局部结构的保留程度,适用于多种降维技术。
幂变换是一种参数化的数据转换方法,用于将数据转换为更接近正态分布的形式,以解决非恒定方差或需要正态分布的情况。
本文介绍了如何使用逻辑回归分类器处理鸢尾花数据集,并展示了决策边界的可视化。
本文介绍了如何使用OneClassSVM模型来预测南美两种哺乳动物的地理分布,并展示了模型的ROC曲线下面积。
本网页展示了如何计算Lasso、Lasso-LARS和Elastic Net正则化路径上的系数。
本文介绍了随机投影技术,一种通过牺牲一定精度来加快处理速度和减小模型大小的降维方法。
本文介绍了如何计算两组双聚类之间的相似度,并使用修改后的Jonker-Volgenant算法找到最佳匹配,最终得分是相似度之和除以较大集合的大小。
本文介绍了非负矩阵分解(NMF)技术,这是一种用于数据降维、源分离或主题提取的数学方法。
本网页展示了高斯混合模型(GMM)中不同协方差类型在鸢尾花数据集上的性能比较。
本文介绍了距离度量和核函数在机器学习中的重要性,包括它们的定义、性质以及在不同算法中的应用。
本文介绍了如何使用决策树进行多输出回归,并通过调整树的最大深度来控制模型的复杂度。
本网页展示了如何使用基于哈维森距离度量的布朗树对地理空间数据进行核密度估计。
本文分析了随机标签对聚类评估指标的影响,并通过实验展示了不同指标在固定和变化的类别数量下的表现。