数据预处理技术概览

本文介绍了多种数据预处理技术,包括二值化、特征缩放、编码器等,旨在帮助数据科学家和工程师更好地准备数据以进行机器学习。

谱聚类算法详解

本文详细介绍了谱聚类算法的原理、参数设置以及应用实例。

图像分割的谱聚类技术

本文介绍了如何使用谱聚类技术对图像进行分割,包括kmeans、离散化和QR分解等方法。

层次聚类分析示例

本网页展示了层次聚类分析在不同距离度量下的效果,并通过代码示例说明了如何使用Python进行层次聚类分析。

Haversine 距离计算

本文介绍了如何使用Haversine公式计算地球表面两点之间的距离。

基于局部异常因子的异常检测

本文介绍了一种基于局部异常因子(LOF)的无监督异常检测方法,该方法通过计算给定数据点与其邻居的局部密度偏差来识别异常值。

正则化路径计算

本页面展示了如何使用Python中的sklearn库来计算Lasso和弹性网络的正则化路径,并比较了标准和正则化版本的效果。

生成随机回归问题

本页面介绍了如何使用scikit-learn库生成随机回归问题,包括参数设置和示例代码。

数据科学中的邻近分析技术

本文探讨了数据科学中邻近分析技术的应用,包括TSNE、核密度估计、最近邻分类和异常检测等。

数据标准化方法介绍

本文介绍了一种数据标准化方法,通过中心化和基于四分位数范围的缩放来处理数据,适用于机器学习中的预处理步骤。

鲁棒线性模型估计:RANSAC算法应用

本文介绍了如何使用RANSAC算法对含有异常值的数据进行鲁棒的线性模型拟合。

高斯混合模型选择

本网页展示了如何使用信息论标准对高斯混合模型(GMM)进行模型选择,包括协方差类型和模型中组件的数量。

集成学习算法概览

本文介绍了多种集成学习算法,包括AdaBoost、Bagging、ExtraTrees、Gradient Boosting、Isolation Forest、Random Forest、Stacking和Voting等。

稀疏图排序算法

本页面介绍一种用于排序稀疏图的算法,该算法确保每一行的值按照递增顺序存储。

分类器概率可视化

本网页展示了如何使用不同的分类器对三类数据集进行分类,并可视化分类概率。

图像硬币分割的分层聚类分析

本页面展示了如何使用Ward分层聚类算法对硬币图像进行分割处理,并通过代码示例和结果展示详细说明了聚类过程和效果。

决策树剪枝与成本复杂性剪枝

本文介绍了如何使用成本复杂性剪枝来控制决策树的规模,并通过实例代码展示了不同ccp_alpha值对决策树的影响。

特征重要性评估:排列重要性方法

本文介绍了如何使用排列重要性方法来评估机器学习模型中各个特征的重要性。

随机抽样算法详解

本文详细介绍了随机抽样算法的实现方式,包括无替换抽样的概念、参数设置、不同抽样方法的适用场景以及代码示例。

径向基函数核的显式特征映射近似

本文介绍了如何使用RBFSampler和Nystroem方法来近似径向基函数核的特征映射,并在手写数字数据集上使用SVM进行分类。

PCA降维与模型评估

本文介绍了如何通过PCA降维和网格搜索结合交叉验证来评估和选择模型,以达到最佳的准确率和模型复杂度的平衡。

图的中心性分析

本文介绍了如何使用随机SVD算法来分析维基百科内部链接图,以计算页面的重要性。

多类分类器性能比较

本网页展示了使用不同分类器对三类数据集进行分类的性能比较,包括支持向量机、L1和L2惩罚的逻辑回归、以及高斯过程分类器。

岭回归与正则化

本文介绍了岭回归和正则化的概念,以及如何通过调整正则化参数来平衡模型的预测准确性和泛化能力。

梯度提升中的早停技术

本文介绍了梯度提升中的早停技术,通过加州房价数据集的案例,展示了如何使用早停技术来优化模型性能和提高训练效率。

支持向量机(SVM)分类器决策边界可视化

本页面展示了如何使用Python和matplotlib库来可视化支持向量机(SVM)分类器在鸢尾花数据集上的决策边界。

BIRCH与MiniBatchKMeans算法比较

本网页旨在比较BIRCH和MiniBatchKMeans两种聚类算法在处理大规模数据集时的性能差异。

亲和力传播聚类算法演示

本页面展示了亲和力传播聚类算法的实现过程,包括数据生成、算法应用、结果评估和可视化展示。

Top-k 准确率评分

本页面介绍了Top-k准确率评分的概念、参数、返回值以及示例代码。

交叉验证与排列测试

本文介绍了如何使用排列测试来评估交叉验证分数的统计显著性,以及如何解释得到的p值。

沪ICP备2024098111号-1
上海秋旦网络科技中心:上海市奉贤区金大公路8218号1幢 联系电话:17898875485