本文介绍了scikit-learn库的新版本更新,包括bug修复、性能提升和新特性介绍,如元数据路由、HDBSCAN聚类算法、TargetEncoder编码策略等。
本文比较了非负最小二乘法(NNLS)和普通最小二乘法(OLS)在拟合线性模型时的表现,包括回归系数的比较和模型的稀疏性。
本页面介绍了如何计算曲线下面积(AUC)以及ROC曲线的基本概念和应用。
本网页通过一个浣熊脸图像的例子,展示了如何使用KBinsDiscretizer进行图像的向量量化处理,并探讨了不同的压缩策略和内存占用情况。
本文介绍了亲和力传播聚类算法的基本原理、参数设置和应用实例,旨在帮助读者理解和掌握这种高效的聚类方法。
本文介绍了如何使用分块计算方法来处理大规模数据集中的距离矩阵计算问题,旨在优化内存使用和提高计算效率。
本文介绍了互信息这一评估指标,用于衡量两个聚类结果之间的相似度。
本网页介绍了使用在线字典学习和不同的变换方法对浣熊脸部图像碎片进行去噪的过程。
本网页介绍了在使用ElasticNet模型时,如何对加权样本进行预处理以计算Gram矩阵。
本文详细介绍了稀疏编码算法的工作原理,参数设置以及在Python中使用sklearn库进行稀疏编码的示例代码。
scikit-learn是一个流行的Python机器学习库,本文记录了scikit-learn从0.4版本到最新版本的更新历史,包括每个版本的新特性和改进。
本文介绍了如何使用交叉验证来评估机器学习模型的性能,包括参数设置、使用方法和示例代码。
本页面展示了如何使用随机森林和贝叶斯分类器在高维稀疏数据上进行降维和分类。
本页面介绍了如何使用scikit-learn库生成随机回归问题,包括参数设置和示例代码。
本文介绍了一维核密度估计的基本原理,并通过Python代码示例展示了如何使用直方图和核密度估计来分析一维数据的分布情况。
本文介绍了如何使用RBFSampler和Nystroem方法来近似径向基函数核的特征映射,并在手写数字数据集上使用SVM进行分类。
本文介绍了如何在机器学习中使用模型评分函数,并处理可能出现的异常情况。
本网页详细介绍了K-means聚类算法的参数设置、工作原理以及Python代码实现。
本文介绍了如何使用排列重要性方法来评估机器学习模型中各个特征的重要性。
本网页介绍了在统计学中常用的几种协方差估计方法,包括最大似然估计、Ledoit-Wolf估计和OAS估计,并比较了它们在不同情况下的表现。
本文介绍了如何使用部分依赖图和个体条件期望(ICE)来分析机器学习模型中特征对预测结果的影响。
本教程旨在通过使用不同的SVM核函数来分类鸢尾花数据集,提供了详细的代码实现和结果展示。
本文介绍了如何计算两组双聚类之间的相似度,并使用修改后的Jonker-Volgenant算法找到最佳匹配,最终得分是相似度之和除以较大集合的大小。
本网页介绍了使用支持向量机进行异常检测的方法,包括基于RBF核的OneClassSVM和基于随机梯度下降的SGDOneClassSVM。
本文介绍了如何使用计算机断层扫描(CT)技术获取的一组平行投影数据来重建图像。讨论了压缩感知的概念,并通过Lasso优化算法实现了图像的重建。
本网页介绍了高斯混合模型(GMM)和贝叶斯高斯混合模型(使用狄利克雷过程作为先验)的比较,包括它们的工作原理和在低维空间中的可视化展示。
本文介绍了距离度量和核函数在机器学习中的重要性,包括它们的定义、性质以及在不同算法中的应用。
本文介绍了在新闻组数据集上应用共聚类算法的过程,包括数据预处理、TF-IDF向量化、Dhillon共聚类算法的应用以及与其他聚类算法的比较。
这篇文章通过生成一个简单的数据集,展示了如何使用逻辑回归和线性回归模型对数据进行分类,并比较了两种模型的效果。
本文探讨了机器学习中模型的偏差、方差和噪声问题,并介绍了如何通过验证曲线和学习曲线来评估模型性能。