河北天气预报几度?
最近一直想写个天气相关的项目,刚好这次有素材了。 这次的数据样本是 2016 年 3 月到 4 月间的河北省逐日气象观测数据,包括了石家庄市、承德市、秦皇岛市、廊坊市、张家口市、唐山市和保定市七个地区的 758 个气象站点,每天 8 次气温测量值,取均值后的结果。 这些气象数据的采集来源是中国气象局官方网站上公布的《全国气象资料集》。 这个项目我想通过 Python 编程实现两个功能:
1. 以省为级别输出各省份历年平均气温(及年最大温差和年最小温差);
2. 以市为级别输出各城市 ( 地级市 ) 的历年最高温度、最低温度和数据极值情况。
以省级级别输出部分中国各省的历年平均温度(及年最大温差和年最小温差信息)。 代码如下所示: import pandas as pd import numpy as np from scipy import fftpak # 导入数据 filePath='D:\data\weather_data_2016.csv' # 定义路径并读取文件 data=pd.read_csv(filePath,header=None) # 读取所有行并且去除第一行的标题 print('读取数据完成!') for key in ['Province','Year']: # 根据key删除列名 data=data.drop(columns=[key]) # 绘制各省的年均温散点图 plt.figure() plt.plot(data['Temperature']) # 画出年份为横轴,温度为纵轴的正方型图表。 plt.xlabel('Year') # 为坐标加上标签plt.ylabel('Temperatures(℃)') # 显示图形 plt.show()
以市级级别按照城市对数据进行过滤,并用 Pandas 包中的 DataFrame 函数重新构造数据集,然后利用前缀加列名的方式给新数据添加前缀,从而得到不同城市的气温数据。 以下展示的是某市一年中 4 月和 10 月两天温度的差值分布情况,可以看到极值出现在冬季和夏秋更替之时,正负值都出现过两次,这说明在气候上,这两个季节的过渡并不是非常平稳的。