机器学习模型部署与应用

在当今快速发展的技术领域中,机器学习(ML)以其在自动化任务中的巨大潜力而脱颖而出,这些任务无需人工干预也无需显式编程。机器学习的力量如此之大,以至于几乎可以在日常生活的每个角落看到它的应用。它解决了以前存在的问题,并极大地推动了全球商业的发展。

部署模型的重要性

机器学习模型通常旨在解决现有问题。可能想过,模型如何成为解决方案,人们将如何使用它?事实上,人们不能直接使用笔记本和代码,这就是需要部署模型的地方。可以像API或网络服务一样部署模型。在这里,使用Flask微框架。Flask为网络应用定义了一组约束,用于发送和接收数据。

汽车售价预测系统

即将部署一个用于汽车销售价格预测和分析的ML模型。这种系统对许多人来说非常方便。想象一下,如果有一辆旧车想要出售,当然可以找代理人来做这件事,并找到市场价格,但后来可能不得不为他的卖车服务支付费用。但是,如果可以在没有代理人干预的情况下知道汽车售价呢?或者,如果是代理人,这肯定会让工作变得更容易。是的,这个系统已经学习了多年来各种汽车的售价。

为了清楚起见,这个部署的网络应用将根据燃料类型、服务年限、展厅价格、前车主数量、行驶公里数、是否为经销商/个人,以及最终的传动类型是手动/自动,为提供汽车的大致售价。这是一个额外的好处。

数据集附加在GitHub文件夹中。数据包含300行和9列。由于目标是找到售价,目标属性y也是售价,其余特征用于分析和预测。

data = data.drop(['Car_Name'], axis=1) data['current_year'] = 2020 data['no_year'] = data['current_year'] - data['Year'] data = data.drop(['Year','current_year'],axis = 1) data = pd.get_dummies(data,drop_first=True) data = data[['Selling_Price','Present_Price','Kms_Driven','no_year','Owner','Fuel_Type_Diesel','Fuel_Type_Petrol', 'Seller_Type_Individual','Transmission_Manual']] data data.corr() from sklearn.model_selection import train_test_split x_train, x_test,y_train,y_test = train_test_split(x,y,random_state=0,test_size=0.2)

使用随机森林回归器来预测售价,因为这是一个回归问题,随机森林使用多个决策树,并已显示出对模型有良好的结果。

from sklearn.ensemble import RandomForestRegressor model = RandomForestRegressor() hyp = RandomizedSearchCV(estimator = model, param_distributions=grid, n_iter=10, scoring= 'neg_mean_squared_error' cv=5,verbose = 2, random_state = 42,n_jobs = 1) hyp.fit(x_train,y_train) import pickle file = open("file.pkl", "wb") pickle.dump(hyp, file)
沪ICP备2024098111号-1
上海秋旦网络科技中心:上海市奉贤区金大公路8218号1幢 联系电话:17898875485