本文介绍了梯度提升树中OOB估计的概念、计算方法以及如何使用OOB估计来确定模型的最佳迭代次数。
本文探讨了机器学习中的两个基本问题:预测模型的建立和基于概率预测的决策制定。
本网页介绍了Lasso、ARD和ElasticNet三种模型在处理高维稀疏数据时的性能比较。
本文通过乳腺癌数据集演示了自训练分类器在不同阈值设置下的效果。
本页面介绍了如何生成一个多维高斯分布的分类数据集,包括参数设置和代码示例。
本页面介绍了如何使用递归特征消除(RFE)结合交叉验证来自动调整所选特征的数量。
本网页介绍了层次聚类分析中结构化与非结构化的区别,并通过瑞士卷数据集的实例演示了两种方法的应用。
本网页展示了不同在线求解器在手写数字数据集上的性能比较。
本文介绍了如何在Python中使用CSR格式的稀疏矩阵进行逐列缩放操作,并提供了示例代码。
本文介绍了多种集成学习算法,包括AdaBoost、Bagging、ExtraTrees、Gradient Boosting、Isolation Forest、Random Forest、Stacking和Voting等。
本文通过合成数据和艾姆斯房价数据集,探讨了在回归分析中对目标变量进行变换以提高模型预测精度的方法。
本文介绍了孤立森林算法的基本概念,并通过Python代码示例展示了如何在玩具数据集上训练孤立森林模型,并可视化其决策边界。
本文介绍了互信息这一评估指标,用于衡量两个聚类结果之间的相似度。
本文介绍了均方对数误差回归损失的概念、参数、使用方法以及在不同情况下的应用示例。
本文比较了四种高斯混合模型的初始化方法:kmeans、random、random_from_data和k-means++。通过生成样本数据并使用不同的初始化方法,展示了每种方法的收敛速度和初始化时间。
本文介绍了如何使用HalvingGridSearchCV和GridSearchCV进行参数优化,并比较了两者的性能。
本网页介绍了如何在不平衡数据集上使用支持向量机(SVM)进行分类,并展示了如何绘制决策边界。
本文介绍了如何通过聚类算法来学习归纳模型,并通过分类器对新数据样本进行分类。
本页面介绍了如何使用瑞士卷数据集生成器来创建三维数据点,并提供了代码示例和相关参考。
本网页介绍了交叉验证预测方法,包括数据分割策略、参数设置以及如何使用这种方法来评估机器学习模型的泛化性能。
局部线性嵌入(Locally Linear Embedding, LLE)是一种非线性降维技术,用于数据的可视化和分析。本文介绍了LLE的基本概念、参数设置以及如何在Python中使用。
本文介绍了如何使用不同的嵌入技术对数字数据集进行处理,并比较了各种方法的效果。
本页面介绍了K-Means++聚类算法的初始化种子生成过程,包括Python代码示例和结果展示。
本页面介绍了平均绝对百分比误差(MAPE)回归损失的概念、计算方法和应用示例。
本文介绍了线性判别分析(LDA)和二次判别分析(QDA)在不同数据集上的表现,并通过可视化展示了两种方法的决策边界和协方差椭球。
本文探讨了使用不同的数据填充技术来处理缺失值,包括使用常数0填充、均值填充、k最近邻填充和迭代填充。
本网页展示了在数据中施加连接图以捕获局部结构的效果,以及不同链接方法对聚类结果的影响。
本页面介绍了弗里德曼回归问题 #1 的数据生成方法和相关参数。
本页面介绍了弹性网络回归模型的计算方法和参数配置,包括单输出和多输出任务的优化函数,以及如何使用坐标下降法来计算模型。
本文介绍了等渗回归算法,该算法在最小化训练数据的均方误差的同时,寻找函数的非递减近似。与线性回归模型相比,等渗回归作为一种非参数模型,除了单调性外,不假设目标函数的任何形状。