本文介绍了如何对分类器进行概率校准,并通过Brier分数评估校准后的概率质量。比较了高斯朴素贝叶斯分类器在未校准、sigmoid校准和等温校准下的性能。
本网页介绍了如何使用RBFSampler和Nystroem近似RBF核函数的特征映射,并在手写数字数据集上使用SVM进行分类。比较了在原始空间中使用线性SVM、使用近似映射的线性SVM以及核化SVM的结果。
本文探讨了KMeans聚类算法在处理不同数据分布时的表现,包括非等方差、非等大小聚类,以及如何通过高斯混合模型解决这些问题。
本文介绍了一种在数据中存在缺失值时计算欧几里得距离的方法,包括算法原理、参数说明、代码示例和应用场景。
本文通过乳腺癌数据集演示了自训练分类器在不同阈值设置下的效果。
本页面介绍了如何生成一个多维高斯分布的分类数据集,包括参数设置和代码示例。
本网页展示了在二维数字数据集上应用不同层次聚类方法的可视化效果,包括ward、average、complete和single等链接策略。
本页面展示了增量主成分分析(IPCA)在处理大型数据集时的优势,通过与常规PCA的比较,展示了IPCA在内存使用上的优化,并提供了代码示例和结果图表。
本文介绍了半监督学习中的自我训练分类器在乳腺癌数据集上的应用,分析了不同阈值对分类器性能的影响。
本页面展示了如何使用Python和scikit-learn库来训练L1正则化的逻辑回归模型,并绘制了正则化路径图。
本文详细介绍了如何使用机器学习库中的函数来计算两点之间的最小距离,并提供了代码示例和参数说明。
本网页介绍了使用在线字典学习和不同的变换方法对浣熊脸部图像碎片进行去噪的过程。
本页面介绍了如何生成一个稀疏对称正定矩阵,并提供了相应的代码示例。
本文介绍了流形学习技术在球面数据集上的应用,并通过降维技术将数据集投影到二维空间,以获得直观的理解。
本网页介绍了如何使用高斯过程对非固定长度特征向量形式的数据进行回归和分类任务。
本文介绍了如何使用随机梯度下降(SGD)训练的线性支持向量机(SVM)来处理一个可分离的数据集,并展示了如何绘制决策边界和数据点。
本网页介绍了如何使用数据可视化API进行快速绘图和视觉调整,无需重新计算。
本文介绍了KMeans与MiniBatchKMeans两种聚类算法的比较,并通过生成数据集、执行聚类、比较结果和可视化差异来展示这两种算法的不同之处。
本网页介绍了数据预处理和特征提取的基本概念、方法和技术,包括标准化、归一化、编码分类特征、缺失值处理、多项式特征生成、无监督降维等。
本文详细介绍了正交匹配追踪算法(OMP)的实现和应用,包括算法原理、参数说明、代码示例以及与其他算法的比较。
本页面展示了如何使用基于邻居的查询(特别是核密度估计)来处理地理空间数据,使用基于Haversine距离度量的球面坐标。
本文介绍了如何使用LASSO方法计算糖尿病数据集的正则化路径,并展示了系数向量随正则化参数变化的可视化结果。
本指南旨在为开发者提供机器学习可视化API的详细介绍,包括如何使用API进行数据可视化和绘图工具的开发与维护。
本文介绍了如何使用谱聚类技术对图像进行分割,包括kmeans、离散化和QR分解等方法。
本文详细介绍了D^2回归评分函数,包括其定义、计算方法、参数说明以及实际应用示例。
本文介绍了岭回归中L2正则化如何影响模型系数,并展示了不同正则化强度下系数的变化。
本示例展示了如何使用scikit-learn库来识别0到9的手写数字图像。
本文介绍了如何计算两组双聚类之间的相似度,并使用修改后的Jonker-Volgenant算法找到最佳匹配,最终得分是相似度之和除以较大集合的大小。
本网页探讨了贝叶斯高斯混合模型中权重浓度先验的不同类型对模型拟合数据的影响。通过比较Dirichlet分布先验和Dirichlet过程先验,展示了模型如何自动适应混合成分的数量,并分析了不同浓度先验值对模型结果的影响。
本网页展示了在数据中施加连接图以捕获局部结构的效果,以及不同链接方法对聚类结果的影响。