這類型的資料有一些特質:
- 資料是用時間排序的一組隨機變量,例如下圖,數值會隨著時間的變化而改變,因此時間是很重要的資料維度之一
- 資料的產生可能是快速、大量且持續
例如某個機台,每秒鐘會產生100筆資料,每筆資料約250KB,一天下來單單一個機台的資料量就高達2TB了,而且只要生產線保持運作,資料就不斷的產生
資料若要利用資訊系統來處理,儲存便是一個重要的課題。目前許多的應用中,會使用關聯式資料庫加上一個time-stamp欄位來解決這問題。若檢視時間序列資料的特質,我們要考量的因素有:
- 資料是源源不斷產生,而且鮮少需要修改,因此insert的效能會是重要因素,update反而不那麼重要
- 在一些應用中,資料的產生是快速且大量的,因此擴展性(scalability)就相當重要
- 時間的運算常會是取回資料時常用到的功能,所以時間運算的效能很重要
下一篇,我們將開始安裝與使用InfluxDB。
沒有留言:
張貼留言