截面数据可以反映同一时间段内个人和公司的观测值。另一方面,时间序列数据则反映在不同时间间隔收集信息的任意数据集。此数据有所区别,因为它按时间排列数据点。因此,相邻时间间隔的观测值可能具有相关性。
时间序列数据可在图形的 X 轴上以递增时间间隔(或时间线)绘出,在 Y 轴上反映样本数据观测值。此类时间序列图是有价值的工具,可用来可视化数据。数据科学家使用它们来确定预测数据特征。下面我们给出了几个时间序列数据特征示例:
时间趋势数据
对于趋势数据,Y 值随时间增加或减少,使图形呈现线性。例如,人口数据可随时间线性增加或减少。
季节性
如果时间序列数据在不到一年的时间间隔内呈现出有规律且可预测的模式,就会出现季节性模式。此数据模式可能会在其他线状图上显示为峰值或其他反常情况。例如,在 12 月和 4 月左右的假期期间,一家店铺的零售销量可能有所增加。
结构突变
有时,时间序列数据可能会在某个时间点发生突变。时间序列图可能也会突然向上或向下移动,从而形成结构突变或非线性变化。例如,在 2008 年全球金融危机爆发后,许多经济指标发生了急剧变化。