您好,登录后才能下订单哦!
请求超时!
请点击 重新获取二维码这篇文章主要介绍了Python如何实现对某地区二手房房价进行数据分析,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。
data.csv
数据显示
# 导入模块 import pandas as pd # 导入数据统计模块 import matplotlib # 导入图表模块 import matplotlib.pyplot as plt # 导入绘图模块 # 避免中文乱码 matplotlib.rcParams['font.sans-serif'] = ['SimHei'] # 设置字体为SimHei显示中文 matplotlib.rcParams['axes.unicode_minus'] = False # 设置正常显示字符,使用rc配置文件来自定义 # 简单清洗 data = pd.read_csv('data.csv') # 读取csv数据 del data['Unnamed: 0'] # 将索引列删除 data.dropna(axis=0, how='any', inplace=True) # 删除data数据中的所有空值 data['单价'] = data['单价'].map(lambda d: d.replace('元/平米', '')) # 将单价“元/平米”去掉 data['单价'] = data['单价'].astype(float) # 将房子单价转换为浮点类型,float(data['',单价]) data['总价'] = data['总价'].map(lambda d: d.replace('万', '')) # 将总价“万”去掉 data['总价'] = data['总价'].astype(float) # 将房子总价转换为浮点类型,float(data['',单价]) data['建筑面积'] = data['建筑面积'].map(lambda p: p.replace('平米', '')) # 将建筑面积“平米去掉” data['建筑面积'] = data['建筑面积'].astype(float) # 将将建筑面积转换为浮点类型
# 获取各区二手房均价分析,根据需求,,进一步处理数据,如果要写相应算法,需要根据算法所需求的数据处理 def get_average_price(): group = data.groupby('区域') # 将房子区域分组 average_price_group = group['单价'].mean() # 计算每个区域的均价,average_price_group字典 x = average_price_group.index # 区域 y = average_price_group.values.astype(int) # 区域对应的均价a =['t':'123'] a.keys() return x, y # 返回区域与对应的均价,region二关 average_price均价 # 显示均价条形图 def average_price_bar(x, y, title): plt.figure() # 图形画布 plt.bar(x, y, alpha=0.8) # 绘制条形图 plt.xlabel("区域") # 区域文字 plt.ylabel("均价") # 均价文字 plt.title(title) # 表标题文字 # 为每一个图形加数值标签 for x, y in enumerate(y): plt.text(x, y + 100, y, ha='center') plt.show() if __name__ == '__main__': x, y = get_average_price() title = '各区均价分析' average_price_bar(x, y, title)
运行如图
# 获取各区二手房均价分析,根据需求,,进一步处理数据,如果要写相应算法,需要根据算法所需求的数据处理 def get_decorate_sum(): group = data.groupby('装修') # 将房子区域分组 # decorate_sum_group = group['装修'].count() # 计算每个区域的均价,average_price_group字典 decorate_sum_group = group.size() # 计算每个区域的均价,average_price_group字典 x = decorate_sum_group.index # 区域 y = decorate_sum_group.values.astype(int) # 区域对应的均价a =['t':'123'] a.keys() return x, y # 返回区域与对应的均价,region二关 average_price均价 # 显示均价条形图 def average_price_bar(x, y, title): plt.figure() # 图形画布 plt.bar(x, y, alpha=0.8) # 绘制条形图 plt.xlabel("装修类型") # 区域文字 plt.ylabel("数量") # 均价文字 plt.title(title) # 表标题文字 # 为每一个图形加数值标签 for x, y in enumerate(y): plt.text(x, y + 100, y, ha='center') plt.show() if __name__ == '__main__': x, y = get_decorate_sum() title = '全市二手房装修程度分析' average_price_bar(x, y, title)
# 获取各区二手房各区比例数量,进一步处理数据,如果要写相应算法,需要根据算法所需求的数据处理 def get_proportional_quantity(): area = data['区域'].groupby(data['区域']).count() # 将房子区域分组比例数量 areaName = (area).index.values # 将房子区域分组比例取名 return area, areaName # 显示均价条形图 def proportional_quantity_pie(area, areaName, title): plt.figure() # 图形画布 plt.pie(area, labels=areaName, labeldistance=1.1, autopct='%.1f%%', shadow=True, startangle=90, pctdistance=0.7) plt.title(title, fontsize=24) # 表标题文字 plt.legend(bbox_to_anchor=(-0.1, 1)) # 作者标题 plt.show() if __name__ == '__main__': # 对应x,y area, areaName = get_proportional_quantity() title = '各区二手房数量所占比比例' proportional_quantity_pie(area, areaName, title)
# 获取各区热门户型分析,根据需求,,进一步处理数据,如果要写相应算法,需要根据算法所需求的数据处理 def get_hot_portal(): # 另外一种方法获取并取值 """ group = data.groupby('户型').size # 将房子区域分组 sort_data = group.sort_values(ascending=False) # 将户型分组数量进行降序 five_data = sort_data.head() # 提取前5组户型数据 house_type_mean = data.groupby('户型')['单价'].mean().astype(int) # 计算每个户型的均价 x = house_type_mean[five_data.index].index # 户型 y = house_type_mean[five_data.index].value # 户型对应的均价 """ group = data.groupby('户型') # 将房子区域分组 a = group['户型'].count().sort_values(ascending=False).head() # 计算每个户型的均价 字典 b = group['单价'].mean()[a.index] # 区域对应的均价a =['t':'123'] a.keys() x = b.index y = b.values.astype(int) return x, y # 返回区域与对应的均价,region二关 average_price均价 # 显示均价横条形图 def hot_portal_barh(x, y, title): plt.figure() # 图形画布 plt.barh(x, y, alpha=0.9, color='red') # 绘制条形图 plt.xlabel("均价") # 区域文字 plt.ylabel("户型") # 均价文字 plt.title(title) # 表标题文字 plt.xlim(0, 15000) # X轴的大小 # 为每一个图形加数值标签 for y, x in enumerate(y): plt.text(x + 100, y, str(x) + '元', ha='left') plt.show() if __name__ == '__main__': x, y = get_hot_portal() title = '热门户型均价分析' hot_portal_barh(x, y, title)
前面三个图较简单,最后相对于前面三个较为麻烦
先获取得到热门户型前五名,通过户型得到对应的户型的平均值
感谢你能够认真阅读完这篇文章,希望小编分享的“Python如何实现对某地区二手房房价进行数据分析”这篇文章对大家有帮助,同时也希望大家多多支持亿速云,关注亿速云行业资讯频道,更多相关知识等着你来学习!
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。
聚圣源网上在线起名靠谱么逃学大乱斗攻略文具用品公司起名字5200小说javaruntimeenvironment12生肖图片生僻字起名好听的商标 英文起名赶集网倒闭自动回复公司名称大全简单大气易经起名新超越极限最经典的qq个性签名咖啡之翼加盟起姓方的女孩名字宣传片方案嗯嗯2018男孩起名热的拼音起名字不能带天吗www.hebeea.edu.cn电影台词素不相识寓意好的诗句起名字啊人才培养计划起名字姓贾男孩子起名大全姓名大全免费起名宝典男孩起名大全姓牛寒冰王座3深入火口冷少的契约情人淀粉肠小王子日销售额涨超10倍罗斯否认插足凯特王妃婚姻让美丽中国“从细节出发”清明节放假3天调休1天男孩疑遭霸凌 家长讨说法被踢出群国产伟哥去年销售近13亿网友建议重庆地铁不准乘客携带菜筐雅江山火三名扑火人员牺牲系谣言代拍被何赛飞拿着魔杖追着打月嫂回应掌掴婴儿是在赶虫子山西高速一大巴发生事故 已致13死高中生被打伤下体休学 邯郸通报李梦为奥运任务婉拒WNBA邀请19岁小伙救下5人后溺亡 多方发声王树国3次鞠躬告别西交大师生单亲妈妈陷入热恋 14岁儿子报警315晚会后胖东来又人满为患了倪萍分享减重40斤方法王楚钦登顶三项第一今日春分两大学生合买彩票中奖一人不认账张家界的山上“长”满了韩国人?周杰伦一审败诉网易房客欠租失踪 房东直发愁男子持台球杆殴打2名女店员被抓男子被猫抓伤后确诊“猫抓病”“重生之我在北大当嫡校长”槽头肉企业被曝光前生意红火男孩8年未见母亲被告知被遗忘恒大被罚41.75亿到底怎么缴网友洛杉矶偶遇贾玲杨倩无缘巴黎奥运张立群任西安交通大学校长黑马情侣提车了西双版纳热带植物园回应蜉蝣大爆发妈妈回应孩子在校撞护栏坠楼考生莫言也上北大硕士复试名单了韩国首次吊销离岗医生执照奥巴马现身唐宁街 黑色着装引猜测沈阳一轿车冲入人行道致3死2伤阿根廷将发行1万与2万面值的纸币外国人感慨凌晨的中国很安全男子被流浪猫绊倒 投喂者赔24万手机成瘾是影响睡眠质量重要因素春分“立蛋”成功率更高?胖东来员工每周单休无小长假“开封王婆”爆火:促成四五十对专家建议不必谈骨泥色变浙江一高校内汽车冲撞行人 多人受伤许家印被限制高消费