本文介绍了在高斯分布数据中使用稳健协方差估计和马氏距离来识别异常值和进行数据聚类。
本文介绍了使用正交匹配追踪算法从带有噪声的测量中恢复稀疏信号的过程,包括算法的实现和结果展示。
本页面介绍如何使用SVMlight文件格式导出工具,将数据集导出为SVMlight或libsvm格式,适用于稀疏数据集。
本页面介绍了调整互信息(AMI)指标,这是一种用于评估两个聚类结果相似度的指标,考虑了随机性的影响。
本文介绍了使用Iris数据集进行二分类问题的逻辑回归正则化路径分析,包括数据加载、模型训练、正则化路径的计算和可视化。
本文介绍了如何使用sklearn库加载和向量化20新闻组数据集,包括参数设置和数据预处理。
本文通过乳腺癌数据集演示了自训练分类器在不同阈值设置下的效果。
本网页展示了如何在RBF核的情况下,使用随机梯度下降版本的单类SVM来近似sklearn.svm.OneClassSVM的解决方案。
本页面通过一个简单的示例演示了标签传播算法在半监督学习中的应用,通过可视化的方式展示了算法的工作原理。
本文介绍了如何使用集成学习中的投票分类器对鸢尾花数据集进行分类,并展示了不同分类器预测结果的对比。
本文介绍了调整兰德指数(Adjusted Rand Index, ARI)的概念、计算方法和在聚类评估中的应用。
本网页介绍了协方差估计和异常检测的基本概念,包括椭圆包络、经验协方差、图形Lasso、Ledoit-Wolf估计等方法,并提供了相应的计算公式和代码示例。
本网页介绍了半监督学习在文本数据集上的分类应用,包括SGD分类器、自我训练分类器和标签传播方法。
本页面介绍了如何计算L1正则化分类器的C参数下限,包括参数说明和示例代码。
本文介绍了如何使用Python和机器学习库scikit-learn来可视化多层感知器(MLP)在MNIST数据集上的权重。
本网页介绍了如何使用L1正则化的逻辑回归模型对MNIST数据集中的手写数字进行分类,并展示了模型的稀疏性以及测试得分。
本文介绍了如何使用随机森林回归器和多输出回归器进行多目标回归分析。通过比较这两种方法,我们可以了解它们在预测多个输出时的效能和偏差。
本网页介绍了数据预处理和特征提取的基本概念、方法和技术,包括标准化、归一化、编码分类特征、缺失值处理、多项式特征生成、无监督降维等。
本网页通过Python代码演示了在鸢尾花数据集上使用K最近邻分类器,并分析了不同参数权重对决策边界的影响。
本指南旨在为开发者提供机器学习可视化API的详细介绍,包括如何使用API进行数据可视化和绘图工具的开发与维护。
本网页介绍了如何使用随机森林分类器处理具有多重共线性特征的数据集,并计算特征的重要性。
本网页介绍了使用梯度提升方法构建回归预测模型的过程,包括数据加载、预处理、模型训练、结果评估和特征重要性分析。
本文介绍了如何使用ROC和DET曲线来比较不同分类器的性能,并提供了相应的Python代码实现。
本页面展示了如何使用Python的scikit-learn库来绘制多类别逻辑回归和One-vs-Rest逻辑回归的决策边界。
本示例展示了如何使用scikit-learn库来识别0到9的手写数字图像。
本网页介绍了线性模型中正则化参数对训练和测试误差的影响,并展示了如何通过验证曲线确定最优正则化参数,以及如何比较真实系数和估计系数。
本文介绍了DBSCAN和HDBSCAN两种聚类算法,并比较了它们在特定数据集上的表现,同时评估了HDBSCAN对某些超参数的敏感性。
本文介绍了如何计算两组双聚类之间的相似度,并使用修改后的Jonker-Volgenant算法找到最佳匹配,最终得分是相似度之和除以较大集合的大小。
本页面介绍了弹性网络回归模型的计算方法和参数配置,包括单输出和多输出任务的优化函数,以及如何使用坐标下降法来计算模型。
本文探讨了在目标变量包含多于两个类别时的分类问题,即多类分类问题,并比较了不同的多类分类策略。