iis服务器助手广告广告
返回顶部
首页 > 资讯 > 后端开发 > Python >怎么用Python预测房价走势
  • 500
分享到

怎么用Python预测房价走势

2023-06-16 17:06:07 500人浏览 薄情痞子

Python 官方文档:入门教程 => 点击学习

摘要

这篇文章主要介绍“怎么用python预测房价走势”,在日常操作中,相信很多人在怎么用Python预测房价走势问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”怎么用Python预测房价走势”的疑惑有所帮助!接下来

这篇文章主要介绍“怎么用python预测房价走势”,在日常操作中,相信很多人在怎么用Python预测房价走势问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”怎么用Python预测房价走势”的疑惑有所帮助!接下来,请跟着小编一起来学习吧!

项目描述

利用马萨诸塞州波士顿郊区的房屋信息数据训练和测试一个模型,并对模型的性能和预测能力进行测试;

项目分析

数据集字段解释:

  1. 鸿蒙官方战略合作共建——HarmonyOS技术社区

  2. RM: 住宅平均房间数量;

  3. LSTAT: 区域中被认为是低收入阶层的比率;

  4. PTRATio: 镇上学生与教师数量比例;

  5. MEDV: 房屋的中值价格(目标特征,即我们要预测的值);

其实现在回过头来看,前三个特征应该都是挖掘后的组合特征,比如RM,通常在原始数据中会分为多个特征:一楼房间、二楼房间、厨房、卧室个数、地下室房间等等,这里应该是为了教学简单化了;

MEDV为我们要预测的值,属于回归问题,另外数据集不大(不到500个数据点),小数据集上的回归问题,现在的我初步考虑会用SVM,稍后让我们看看当时的选择;

Show Time

Step 1 导入数据

注意点:

  1. 鸿蒙官方战略合作共建——HarmonyOS技术社区

  2. 如果数据在多个csv中(比如很多销售项目中,销售数据和店铺数据是分开两个csv的,类似数据库的两张表),这里一般要连接起来;

  3. 训练数据和测试数据连接起来,这是为了后续的数据处理的一致,否则训练模型时会有问题(比如用训练数据训练的模型,预测测试数据时报错维度不一致);

  4. 观察下数据量,数据量对于后续选择算法可视化方法等有比较大的影响,所以一般会看一下;

  5. pandas内存优化,这一点项目中目前没有,但是我最近的项目有用到,简单说一下,通过对特征字段的数据类型向下转换(比如int64转为int8)降低对内存的使用,这里很重要,数据量大时很容易撑爆个人电脑的内存存储;

上代码:

# 载入波士顿房屋的数据集  data = pd.read_csv('housing.csv')  prices = data['MEDV']  features = data.drop('MEDV', axis =1)   # 完成   print"Boston housing dataset has {} data points with {} variables each.".fORMat(*data.shape)

Step 2 分析数据

加载数据后,不要直接就急匆匆的上各种处理手段,加各种模型,先慢一点,对数据进行一个初步的了解,了解其各个特征的统计值、分布情况、与目标特征的关系,最好进行可视化,这样会看到很多意料之外的东西;

基础统计运算

统计运算用于了解某个特征的整体取值情况,它的最大最小值,平均值中位数,百分位数等等,这些都是最简单的对一个字段进行了解的手段;

上代码:

#目标:计算价值的最小值  minimum_price = np.min(prices)# prices.min   #目标:计算价值的最大值  maximum_price = np.max(prices)# prices.max   #目标:计算价值的平均值  mean_price = np.mean(prices)# prices.mean   #目标:计算价值的中值  median_price = np.median(prices)# prices.median   #目标:计算价值的标准差  std_price = np.std(prices)# prices.std

特征观察

这里主要考虑各个特征与目标之间的关系,比如是正相关还是负相关,通常都是通过对业务的了解而来的,这里就延伸出一个点,机器学习项目通常来说,对业务越了解,越容易得到好的效果,因为所谓的特征工程其实就是理解业务、深挖业务的过程;

比如这个问题中的三个特征:

  • RM:房间个数明显应该是与房价正相关的;

  • LSTAT:低收入比例一定程度上表示着这个社区的级别,因此应该是负相关;

  • PTRATIO:学生/教师比例越高,说明教育资源越紧缺,也应该是负相关;

上述这三个点,同样可以通过可视化的方式来验证,事实上也应该去验证而不是只靠主观猜想,有些情况下,主观感觉与客观事实是完全相反的,这里要注意;

Step 3 数据划分

为了验证模型的好坏,通常的做法是进行cv,即交叉验证,基本思路是将数据平均划分N块,取其中N-1块训练,并对另外1块做预测,并比对预测结果与实际结果,这个过程反复N次直到每一块都作为验证数据使用过;

上代码:

# 提示:导入train_test_split  fromsklearn.model_selectionimporttrain_test_split   X_train, X_test, y_train, y_test = train_test_split(features, prices, test_size=0.2, random_state=RANDOM_STATE)  printX_train.shape  printX_test.shape  printy_train.shape  printy_test.shape

Step 4 定义评价函数

这里主要是根据问题来定义,比如分类问题用的最多的是准确率(精确率、召回率也有使用,具体看业务场景中更重视什么),回归问题用RMSE(均方误差)等等,实际项目中根据业务特点经常会有需要去自定义评价函数的时候,这里就比较灵活;

Step 5 模型调优

通过GridSearch对模型参数进行网格组合搜索最优,注意这里要考虑数据量以及组合后的可能个数,避免运行时间过长哈。

上代码:

fromsklearn.model_selectionimportKFold,GridSearchCV  fromsklearn.treeimportDecisionTreeRegressor  fromsklearn.metricsimportmake_scorer    deffit_model(X, y):  """ 基于输入数据 [X,y],利于网格搜索找到最优的决策树模型"""   cross_validator = KFold   regressor = DecisionTreeRegressor   params = {'max_depth':[1,2,3,4,5,6,7,8,9,10]}   scoring_fnc = make_scorer(performance_metric)   grid = GridSearchCV(estimator=regressor, param_grid=params, scoring=scoring_fnc, cv=cross_validator)   # 基于输入数据 [X,y],进行网格搜索  grid = grid.fit(X, y)   # 返回网格搜索后的最优模型  returngrid.best_estimator_

可以看到当时项目中选择的是决策树模型,现在看,树模型在这种小数据集上其实是比较容易过拟合的,因此可以考虑用SVM代替,你也可以试试哈,我估计是SVM效果比较好;

学习曲线

通过绘制分析学习曲线,可以对模型当前状态有一个基本了解,如下图:

怎么用Python预测房价走势

可以看到,超参数max_depth为1和3时,明显训练分数过低,这说明此时模型有欠拟合的情况,而当max_depth为6和10时,明显训练分数和验证分析差距过大,说明出现了过拟合,因此我们初步可以猜测,优质参数在3和6之间,即4,5中的一个,其他参数一样可以通过学习曲线来进行可视化分析,判断是欠拟合还是过拟合,再分别进行针对处理;

到此,关于“怎么用Python预测房价走势”的学习就结束了,希望能够解决大家的疑惑。理论与实践的搭配能更好的帮助大家学习,快去试试吧!若想继续学习更多相关知识,请继续关注编程网网站,小编会继续努力为大家带来更多实用的文章!

--结束END--

本文标题: 怎么用Python预测房价走势

本文链接: https://www.lsjlt.com/news/284464.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • 怎么用Python预测房价走势
    这篇文章主要介绍“怎么用Python预测房价走势”,在日常操作中,相信很多人在怎么用Python预测房价走势问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”怎么用Python预测房价走势”的疑惑有所帮助!接下来...
    99+
    2023-06-16
  • Python 实例进阶之预测房价走势
    目录项目描述项目分析Show TimeStep 1 导入数据Step 2 分析数据基础统计运算特征观察Step 3 数据划分Step 4 定义评价函数Step 5 模型调优学习曲线小...
    99+
    2024-04-02
  • 用Python做一个房价预测小工具!
    哈喽,大家好。这是一个房价预测的案例,来源于 Kaggle 网站,是很多算法初学者的第一道竞赛题目。该案例有着解机器学习问题的完整流程,包含EDA、特征工程、模型训练、模型融合等。房价预测流程下面跟着我,来学习一下该案例。没有啰嗦的文字,没...
    99+
    2023-05-14
    工具 Python 房价
  • 利用机器学习预测房价
    项目介绍 背景: DC竞赛比赛项目,运用回归模型进行房价预测。 数据介绍: 数据主要包括2014年5月至2015年5月美国King County的房屋销售价格以及房屋的基本信息。 其...
    99+
    2024-04-02
  • 怎么用Pytorch搭建一个房价预测模型
    本篇内容主要讲解“怎么用Pytorch搭建一个房价预测模型”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“怎么用Pytorch搭建一个房价预测模型”吧!一、项目介绍  &nbs...
    99+
    2023-07-05
  • 用Pytorch搭建一个房价预测模型
    本文参加新星计划人工智能(Pytorch)赛道:https://bbs.csdn.net/topics/613989052 目录 一、项目介绍 二、准备工作 三、实验过程 3.1数据预处理 3.2拆分数据集 3.3构建PyTorch模型 3...
    99+
    2023-09-03
    机器学习 神经网络 人工智能 python 深度学习
  • 用Python预测比特币价格
    本篇内容介绍了“用Python预测比特币价格”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!在本文中,我们将讨论与比特币价格预测有关的程序。涉...
    99+
    2023-06-15
  • 机器学习之支持向量回归(SVR)预测房价—基于python
          大家好,我是带我去滑雪!       本期使用爬取到的有关房价数据集data.csv,使用支持向量回归(SVR)方法预测房价。该数据集中“y1”为响应变量,为房屋总价,而x1-x9为特征变量,依次表示房屋的卧室数量、客厅数量、面...
    99+
    2023-09-15
    python 机器学习 支持向量机
  • 【python量化】将Informer用于股价预测
    写在前面 Informer模型来自发表于AAAI21的一篇best paper《Informer: Beyond Efficient Transformer for Long Sequence Time-Series Forecast...
    99+
    2023-09-01
    python 深度学习 开发语言
  • 亚马逊云服务器怎么看价格走势表
    要查看亚马逊云服务器价格走势表,您可以按照以下步骤进行操作: 打开亚马逊云服务(AWS)的官方网站:https://aws.amazon.com/cn/。 在页面上方的导航栏中,将鼠标悬停在“产品”上,然后选择“计算”下的“云服务器”。...
    99+
    2023-10-27
    亚马逊 怎么看 走势
  • 怎么用Python实现颜值预测
    今天小编给大家分享一下怎么用Python实现颜值预测的相关知识点,内容详细,逻辑清晰,相信大部分人都还太了解这方面的知识,所以分享这篇文章给大家参考一下,希望大家阅读完这篇文章后有所收获,下面我们一起来了解一下吧。所需工具Python版本:...
    99+
    2023-06-27
  • 怎么用Python进行预测疫情
    这篇文章主要介绍了怎么用Python进行预测疫情,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。1.准备工作编程环境:anaconda下Spyder。数据来源:整理自国家卫生健...
    99+
    2023-06-16
  • python数据分析实战:用LSTM模型预测时间序列(以原油价格预测为例)
    文章目录 1. 背景2. 模型搭建2.1 定义LSTM2.2 LSTM层的输入和输出2.3 网络建立 3. 时序数据处理3.1 三种输入模式3.2 归一化与反归一化3.3 X和Y是什么3....
    99+
    2023-09-12
    python 数据分析 lstm
  • python量化之搭建Transformer模型用于股票价格预测
    目录前言1、Transformer模型2、环境准备3、代码实现3.1. 导入库以及定义超参3.2. 模型构建3.3. 数据预处理3.4. 模型训练以及评估3.5. 模型运行4、总结前...
    99+
    2024-04-02
  • 怎么用Python实现预测未来孩子的长相
    这篇文章主要讲解了“怎么用Python实现预测未来孩子的长相”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“怎么用Python实现预测未来孩子的长相”吧!前期预备百度AI开放平台账号注册用你的...
    99+
    2023-06-16
  • Python怎么实现LSTM时间序列预测
    本篇内容主要讲解“Python怎么实现LSTM时间序列预测”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“Python怎么实现LSTM时间序列预测”吧!参考数据:数据一共两列,左边是日期,右边是乘...
    99+
    2023-06-02
  • python数据预测模型算法怎么实现
    要实现一个Python数据预测模型算法,你需要遵循以下步骤: 收集数据:首先,你需要收集相关数据,这些数据可以来自于各种来源,如...
    99+
    2024-02-29
    python
  • 怎么用Python神经网络预测汽车保险支出
    本篇内容主要讲解“怎么用Python神经网络预测汽车保险支出”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“怎么用Python神经网络预测汽车保险支出”吧!为新数据集开发神经网络预测模型可能具有挑...
    99+
    2023-06-15
  • 怎么用Python爬虫预测今年双十一销售额
    本篇内容主要讲解“怎么用Python爬虫预测今年双十一销售额”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“怎么用Python爬虫预测今年双十一销售额”吧!NO.1 统计历年双十一销量数据从网上搜...
    99+
    2023-06-25
  • 低价香港服务器租用怎么选择机房
    低价香港服务器租用选择机房的方法:1、看机房设施是否完善,网络是否稳定及售后服务是否可靠;2、看机房提供的网络带宽服务,建议多找几个机房测试香港服务器的速度;3、看机房是否提供7*24小时的技术服务,且能否快速解决客户的设备网络及硬件故障。...
    99+
    2024-04-02
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作