本文介绍了scikit-learn 1.4版本的新特性、改进和bug修复。
本文介绍了如何使用折扣累积增益(Discounted Cumulative Gain, DCG)来评估多标签分类或实体排序任务的性能。
本文介绍了如何使用PolynomialCountSketch高效生成多项式核特征空间近似,以训练近似核化分类器的线性分类器,并在Covtype数据集上进行实验。
本文介绍了使用线性、多项式和径向基函数(RBF)核的支持向量回归(SVR)模型,并提供了一个一维数据回归的示例。
本文介绍了一个用于验证标量参数类型和值的函数,包括参数的名称、目标类型、最小值、最大值以及边界包含情况。
本网页介绍了鸢尾花数据集的两种降维技术:主成分分析(PCA)和线性判别分析(LDA),并展示了它们在数据可视化上的应用。
本文介绍了梯度提升中的早停技术,通过加州房价数据集的案例,展示了如何使用早停技术来优化模型性能和提高训练效率。
本文介绍了SGD算法中常用的三种惩罚函数:L1、L2和弹性网络,并展示了它们在不同参数下的轮廓图。
本文介绍了加州房屋数据集的基本信息,包括数据维度、特征描述以及如何使用scikit-learn库加载和操作该数据集。
本页面介绍了均方对数误差回归损失的概念、参数、返回值以及使用示例。
本文介绍了如何结合使用降维技术与支持向量分类器进行数据预测,并通过GridSearchCV和Pipeline优化模型参数。
受限玻尔兹曼机(RBM)是一种基于概率模型的无监督非线性特征学习算法,常用于初始化深度神经网络。本文详细介绍了RBM的基本概念、模型参数化、伯努利RBM以及随机最大似然学习算法。
本文介绍了基于特征矩阵的Ward聚类算法,这是一种递归合并聚类方法,旨在最小化簇内方差。
本页面介绍了互信息的概念、计算方法以及在特征选择中的应用。
本页面介绍了如何使用特征联合构造器来组合多个变换器,并通过并行处理提高效率。
本网页介绍了如何使用因子分析和旋转技术来可视化鸢尾花数据集中的模式。
本文比较了在新闻组数据集上使用L1正则化和L2正则化的对数几率回归模型的性能。
本文通过图形展示了支持向量机中参数C对数据分离线的影响,以及如何通过调整C值来优化模型的泛化能力。
本文介绍了如何使用标签传播模型在只有少量标签的情况下对手写数字数据集进行分类。
本文介绍了均值绝对误差回归损失的计算方法,包括参数说明、返回值以及示例代码。
本网页展示了如何使用scikit-learn库中的cross_val_predict函数与PredictionErrorDisplay工具来可视化预测误差。
本文详细介绍了指数卡方核函数的计算方法、参数设置以及在机器学习中的应用。
本页面介绍如何使用Python中的sklearn库进行数据可视化,包括混淆矩阵、ROC曲线和精确率召回率曲线的绘制方法。
本文探讨了使用不同的数据填充技术来处理缺失值,包括使用常数0填充、均值填充、k最近邻填充和迭代填充。
本示例展示了如何使用scikit-learn库来识别0到9的手写数字图像。
本页面展示了如何在线性支持向量分类器(LinearSVC)中获取并可视化支持向量。
本文介绍了使用机器学习技术来预测和补全面部图像的下半部分。
本文介绍了如何使用sklearn库中的multilabel_confusion_matrix函数来计算多标签混淆矩阵,用于评估分类模型的准确性。
本页面展示了如何使用高斯过程分类器对数据进行分类,并预测分类的概率。
本文通过一个简单的数据集,展示了在目标变量与数据中的某些低方差方向强相关时,偏最小二乘回归(PLS)如何优于主成分回归(PCR)。