本文介绍了如何对分类器进行概率校准,并通过Brier分数评估校准后的概率质量。比较了高斯朴素贝叶斯分类器在未校准、sigmoid校准和等温校准下的性能。
本文介绍了如何使用信息论标准,如AIC和BIC,来选择高斯混合模型(GMM)的最佳参数,包括协方差类型和模型中的组分数量。
本文通过不同的困惑度值对t-SNE算法进行可视化分析,探讨了不同参数对算法结果的影响。
本文比较了非负最小二乘法(NNLS)和普通最小二乘法(OLS)在拟合线性模型时的表现,包括回归系数的比较和模型的稀疏性。
本页面展示了高斯过程分类(GPC)在XOR数据集上的应用,并比较了静态各向同性核(RBF)与非静态核(点积核)的性能。
本文介绍了数据科学中无监督学习的各种技术,包括降维、聚类、双聚类、信号分解、协方差估计、异常检测和密度估计等。
本网页旨在比较两种流行的非线性降维技术:t-SNE和LLE,并探讨它们在添加数据空洞时的表现。
本网页展示了如何在RBF核的情况下,使用随机梯度下降版本的单类SVM来近似sklearn.svm.OneClassSVM的解决方案。
本文详细介绍了LARS路径算法的工作原理和参数设置,包括算法的目标函数、参数详解以及代码示例。
本文介绍了如何使用Python的sklearn库中的gen_even_slices函数来生成等间隔的切片。
本文介绍了如何在scikit-learn库中使用set_output方法来配置模型输出为pandas DataFrame格式,并提供了详细的代码示例。
本文探讨了KMeans和MiniBatchKMeans聚类算法的不同初始化策略对算法收敛性的影响,并提供了代码示例。
本文介绍了召回率的计算方法,包括不同参数设置下的计算方式,以及如何使用Python进行召回率的计算。
本文介绍了如何使用get_scorer_names函数来获取所有可用评分器的名称,并提供了详细的参数说明、返回值以及示例代码。
本网页介绍了使用LassoLarsIC估计器在糖尿病数据集上进行模型选择的过程,以及如何利用AIC和BIC标准来选择最佳模型。
本网页介绍了ROC曲线和DET曲线在二元分类任务中的比较,包括它们的定义、绘制方法以及如何使用Python的scikit-learn库来实现。
本文比较了四种高斯混合模型的初始化方法:kmeans、random、random_from_data和k-means++。通过生成样本数据并使用不同的初始化方法,展示了每种方法的收敛速度和初始化时间。
本文详细介绍了scikit-learn 1.3版本的新特性,包括bug修复、性能提升以及新增的关键功能。
本文比较了在贝叶斯岭回归问题中,单变量特征选择和特征聚合方法的效果。
本文详细介绍了D²评分函数,这是一种用于评估分类模型性能的指标,通过比较实际标签和预测概率来计算得分。
本页面展示了如何使用基于邻居的查询(特别是核密度估计)来处理地理空间数据,使用基于Haversine距离度量的球面坐标。
本页面介绍了如何计算二元分类任务在不同概率阈值下的错误率,包括假阳性率(FPR)和假阴性率(FNR),并提供了相应的代码示例。
本网页介绍了如何使用谱聚类算法进行图像分割的示例,包括代码实现和结果展示。
本文介绍了线性判别分析(LDA)和二次判别分析(QDA)在不同数据集上的表现,并通过可视化展示了两种方法的决策边界和协方差椭球。
本文介绍了局部异常因子(LOF)算法在新颖性检测中的应用,包括算法原理、参数设置、代码实现和结果展示。
本示例展示了如何使用scikit-learn库来识别0到9的手写数字图像。
本页面介绍了多任务Lasso回归模型,这是一种在多个回归问题中联合选择特征的方法,并通过模拟数据生成和模型拟合来展示其稳定性和效果。
本文介绍了如何对机器学习模型进行拟合状态的验证,包括检查模型是否已经通过训练获得了必要的属性,并在未拟合时抛出异常。
本页面展示了如何使用Python和matplotlib库来生成并可视化一个随机的多标签数据集。
本文介绍了单类SVM算法,这是一种无监督学习算法,用于新颖性检测,能够将新数据分类为与训练集相似或不同。