本文介绍了如何对分类器进行概率校准,并通过Brier分数评估校准后的概率质量。比较了高斯朴素贝叶斯分类器在未校准、sigmoid校准和等温校准下的性能。
本文介绍了多种机器学习中的分类器和回归器,包括线性分类器、回归器、变量选择模型、鲁棒回归器以及广义线性模型等。
本网页介绍了如何使用RBFSampler和Nystroem近似RBF核函数的特征映射,并在手写数字数据集上使用SVM进行分类。比较了在原始空间中使用线性SVM、使用近似映射的线性SVM以及核化SVM的结果。
本文介绍了如何使用PolynomialCountSketch高效生成多项式核特征空间近似,以训练近似核化分类器的线性分类器,并在Covtype数据集上进行实验。
本页面介绍了数据标准化的概念、方法以及在机器学习中的应用。
本网页介绍了稀疏编码技术,特别是使用Ricker小波变换对信号进行稀疏表示的方法。通过比较不同的稀疏编码方法,展示了如何使用不同的原子宽度来改善信号的稀疏表示。
本网页旨在通过线性回归模型分析,比较不同特征对目标变量的影响,并展示模型的可视化效果。
本文比较了在不同C值下,使用L1、L2和Elastic-Net惩罚的逻辑回归模型的稀疏性。
本网页通过置换测试评估分类得分的重要性,使用iris数据集进行演示。
本文介绍了使用葡萄酒数据集进行异常检测和数据结构理解的分析方法,包括经验协方差估计、稳健协方差估计和单类支持向量机的应用。
本文介绍了如何使用马氏距离来衡量高斯分布数据中单个观测值与分布模式之间的距离,并讨论了稳健协方差估计器在处理异常值时的优势。
本页面介绍了轮廓系数的计算方法,包括其定义、计算过程以及在聚类分析中的应用。
本页面介绍了一个用于验证机器学习模型是否遵循scikit-learn框架约定的工具,包括API兼容性、输入验证和形状检查等。
本文介绍了线性判别分析(LDA)和二次判别分析(QDA)在不同数据集上的表现比较,并通过数据可视化展示了两种算法的决策边界和分类效果。
本页面介绍了如何加载和处理Labeled Faces in the Wild (LFW)人脸数据集,包括数据集的参数设置、数据结构和使用示例。
本页面展示了如何使用随机梯度下降(SGD)训练线性支持向量机(SVM)分类器,并绘制出在两个类别可分数据集中的最大分隔超平面。
本文介绍了独立成分分析(ICA)技术在处理噪声数据源分离问题中的应用,通过模拟三个乐器同时演奏并被三个麦克风记录的场景,展示了如何使用FastICA算法来恢复每个乐器的原始信号。
本文介绍了如何使用Python中的scikit-learn库来加载和处理文本数据集,包括设置文件编码、随机打乱数据、选择特定文件扩展名等。
本文介绍了如何使用PowerTransformer和QuantileTransformer将不同分布的数据映射到正态分布,并分析了变换前后的数据可视化效果。
本文介绍了如何使用AgglomerativeClustering和scipy中的dendrogram方法进行层次聚类分析。
本文介绍了如何使用逻辑回归分类器处理鸢尾花数据集,并展示了决策边界的可视化。
本网页介绍了如何使用随机森林嵌入技术进行数据的高维稀疏表示,以及如何利用该技术进行非线性降维和分类。
本页面介绍了如何计算二元分类任务在不同概率阈值下的错误率,包括假阳性率(FPR)和假阴性率(FNR),并提供了相应的代码示例。
本文介绍了如何使用OneClassSVM模型来预测南美两种哺乳动物的地理分布,并展示了模型的ROC曲线下面积。
本文探讨了支持向量机(SVM)中径向基函数(RBF)核的参数gamma和C对模型性能的影响,并提供了代码示例。
本文介绍了如何使用TunedThresholdClassifierCV来根据特定指标调整分类器的决策阈值,以优化模型性能。
本文比较了随机森林(RF)和直方图梯度提升(HGBT)模型在回归数据集上的得分和计算时间。
本网页介绍了如何使用正交匹配追踪算法对含有噪声的稀疏信号进行恢复处理。
本文通过模拟数据对比了独立成分分析(ICA)和主成分分析(PCA)在二维点云上的应用效果。
本网页探讨了Ledoit-Wolf和Oracle Approximating Shrinkage (OAS)估计器如何提升分类性能。