本页面介绍了数据集加载工具的使用方法,包括数据集的获取、处理和生成。
本文介绍了目标编码器的内部交叉拟合机制,以及它如何帮助防止机器学习模型过拟合。通过构建合成数据集,展示了目标编码器在有无交叉拟合时对模型性能的影响。
本网页展示了如何使用AgglomerativeClustering和scipy中的dendrogram方法绘制层次聚类的树状图。
本文探讨了机器学习中的两个基本问题:预测模型的建立和基于概率预测的决策制定。
本文介绍了如何使用因子分析和主成分分析(PCA)来探索鸢尾花数据集中的潜在模式,并展示了如何通过旋转来优化数据的可视化效果。
本文介绍了平均绝对百分比误差(MAPE)的概念、计算方法以及在sklearn库中的使用示例。
本网页比较了两种不同的贝叶斯回归器:自动相关性确定(ARD)和贝叶斯岭回归。通过生成合成数据集,展示了这两种模型的系数估计,并使用多项式特征展开来拟合非线性关系。
本文介绍了使用最近邻分类器和邻域成分分析对数据进行分类的方法,并展示了如何绘制决策边界。
本文通过k-最近邻回归模型演示了如何使用barycenter和常数权重对目标进行插值。
本文介绍了在手写数字数据集上应用多种流形学习技术,并通过可视化比较了它们的性能和特点。
本文介绍了高斯过程分类器(GPC)在鸢尾花数据集上的应用,包括各向同性和各向异性径向基函数(RBF)核的使用和比较。
葡萄酒数据集是一个经典的多类分类数据集,包含178个样本,每个样本有13个特征。
本文介绍了均方对数误差回归损失的概念、参数、使用方法以及在不同情况下的应用示例。
本网页介绍了使用在线字典学习和不同的变换方法对浣熊脸部图像碎片进行去噪的过程。
本网页介绍了如何在不平衡数据集上使用支持向量机(SVM)进行分类,并展示了如何绘制决策边界。
本网页通过SparseCoder估计器比较了不同的稀疏编码方法,并探讨了使用不同宽度原子的重要性以及学习字典以适应特定信号类型的必要性。
本页面介绍了如何使用支持向量机(SVM)来处理不平衡数据集中的分类问题,并展示了如何找到最优的分离超平面。
本文介绍了如何使用随机梯度下降(SGD)训练的线性支持向量机(SVM)来处理一个可分离的数据集,并展示了如何绘制决策边界和数据点。
本网页介绍了如何使用Scikit-learn库进行机器学习任务,包括模型拟合、数据预处理、模型选择、模型评估等基本概念和操作。
本网页介绍了如何使用Ward层次聚类方法对二维图像进行空间约束的聚类处理,并展示了相应的Python代码实现。
本网页介绍了在机器学习中,如何通过单调约束来优化梯度提升树模型,使其更好地捕捉数据的总体趋势,而忽略局部波动。
本文介绍了支持向量机中RBF核的gamma和C参数对模型性能的影响,并通过可视化展示了不同参数组合下的效果。
本文介绍了如何使用科恩卡帕系数来衡量两个标注者在分类问题上的一致性水平。
本文介绍了如何使用排列重要性方法来评估机器学习模型中各个特征的重要性。
本文介绍了高斯过程回归(Gaussian Process Regression)的基本概念,包括无噪声和有噪声情况下的模型拟合和预测。
本页面介绍了如何在CSR或CSC矩阵上沿指定轴增量计算均值和方差。
本网页介绍了如何使用迭代插补方法处理缺失值,并与不同的回归分析器进行比较。
本文通过一个实例比较了随机森林回归器和多输出回归估计器的性能。
本文介绍了如何使用Scikit-learn的全局配置管理器来优化机器学习模型的性能和内存使用。
本文介绍了如何使用受限玻尔兹曼机(RBM)进行特征提取,并结合逻辑回归对数字进行分类。