大數(shù)據(jù)時代,讓行業(yè)分析的精度達(dá)到了一個新的高度,也為行業(yè)的精細(xì)化管理提供了前所未有的便利條件。供水行業(yè)在大數(shù)據(jù)的應(yīng)用方面似乎滯后于一些行業(yè),但并不阻礙供水行業(yè)對大數(shù)據(jù)的開發(fā)和向往。
《凈水技術(shù)》小編了解到,作為智慧城市的先行者之一,上海近年來在大數(shù)據(jù)的分析方面開展了一些工作,并采用多種模型工具進行探索和應(yīng)用。運用大數(shù)據(jù)工具,目前上海城投水務(wù)集團一方面能夠每天能夠為下轄的11個供水所提供未來3天的供水量預(yù)測日報;另一方面也能用長期水量預(yù)測模型做年度的月水量計劃。
本文為概述,上海城投水務(wù)集團在供水水量大數(shù)據(jù)分析的具體工作成果請持續(xù)關(guān)注《凈水技術(shù)》本年度發(fā)表的相關(guān)原創(chuàng)論文。
隨著通信技術(shù)的不斷進步,以及業(yè)務(wù)系統(tǒng)的建設(shè)升級,國內(nèi)各大水司的信息化水平不斷提高,累計的各類業(yè)務(wù)數(shù)據(jù)越來越多,數(shù)據(jù)規(guī)模及質(zhì)量不斷提高,數(shù)據(jù)統(tǒng)計分析能力進一步提升,數(shù)據(jù)對業(yè)務(wù)的支撐作用也越來越強。但是隨著水司對數(shù)據(jù)分析要求的不斷增強,以及現(xiàn)階段水司內(nèi)部單一的業(yè)務(wù)數(shù)據(jù)及基礎(chǔ)的分析工具,對于將來實現(xiàn)智慧供水的目標(biāo)還存在距離,所以我們開始重新思考如何豐富數(shù)據(jù)類型和如何利用新工具實現(xiàn)目標(biāo)。
智慧供水的目的是希望決策能像人腦一樣,而我們知道人腦在決策之前首先要同時感知身體內(nèi)部和外界環(huán)境的信息,然后經(jīng)過人腦內(nèi)部上億個神經(jīng)元的計算分析后得出結(jié)果,同樣如果未來要實現(xiàn)智慧供水,利用外部數(shù)據(jù)和先進的分析工具必不可少。
上海作為國內(nèi)智慧城市建設(shè)先試先行的城市,現(xiàn)今已經(jīng)取得了一定的成果,其中城市公共數(shù)據(jù)免費開放的力度不斷加大,供水作為城市服務(wù)的關(guān)鍵一環(huán),與電力、交通和旅游等其他社會服務(wù)息息相關(guān),相互之間有很強的關(guān)聯(lián)性,而這些行業(yè)數(shù)據(jù)可以為水司服務(wù),豐富數(shù)據(jù)維度,增強內(nèi)外部聯(lián)系,加深水司對用戶行為理解。
一
大數(shù)據(jù)下的供水量影響因素
以供水量的預(yù)測為例,首先市場上產(chǎn)品和服務(wù)的價格一定會對用戶用量產(chǎn)生直接的影響,例如對于家庭每天都會用水清洗蔬菜水果等食品,而這些食品的價格的波動會決定居民采購數(shù)量的波動,進而影響供水量的波動,下面是消費者價格指數(shù)和居民供水量的曲線圖,我們發(fā)現(xiàn)消費者價格的變動與居民供水量的變動呈現(xiàn)相反的趨勢。
(藍(lán)線為居民供水量曲線,橙線為消費者價格指數(shù))
進一步比較水產(chǎn)品價格和居民供水量發(fā)現(xiàn),二者的相反趨勢更加明顯。
(綠線為水產(chǎn)品價格,藍(lán)線為居民供水量)
季節(jié)、氣溫和節(jié)假日的變化也會對供水量的變化產(chǎn)生深刻的影響,下面這張曲線圖清楚的描繪了這些變化,夏季是用水高峰期,國慶和春節(jié)小長假由于人口凈流出較多出現(xiàn)短期的用水低谷。
用戶用水一般會伴隨著用電,比如居民做飯洗澡,加工制造企業(yè)產(chǎn)品生產(chǎn)等,總用電量、第一產(chǎn)業(yè)、第二產(chǎn)業(yè)、第三產(chǎn)業(yè)和城鄉(xiāng)居民的用電趨勢與用水趨勢基本一致。
上海作為國際化大都市每年都會吸引全球各地的游客前來旅游,這部分游客也會對供水量產(chǎn)生影響。
除了上述舉例,對居民用水量產(chǎn)生影響的因素還有很多,從時間的角度看,CPI指數(shù)、PPI指數(shù)、氣溫、溫差、空氣質(zhì)量指數(shù)、節(jié)假日等因素影響較大,我們還發(fā)現(xiàn)每個月開什么花也和供水量有一定的相關(guān)性,比如上海3月份櫻花盛開,居民會外出賞花,這些活動會造成餐館人數(shù)的增加,從而影響了供水;從空間的角度看,工廠、餐館、商場、景區(qū)等場所的位置分布也會影響供水量。
二
大數(shù)據(jù)下的水量預(yù)測模型工具探索
隨著外部數(shù)據(jù)量的增加以及計算難度的提高,傳統(tǒng)的數(shù)據(jù)統(tǒng)計工具(例如excel)可能無法實現(xiàn)要求。近幾年,隨著python編程語言的崛起及算法模型的發(fā)展,數(shù)據(jù)分析的門檻不斷降低,普通人也能通過一段時間的學(xué)習(xí),很快實現(xiàn)復(fù)雜的數(shù)據(jù)分析運算,例如多維度數(shù)據(jù)間的相關(guān)性分析,非線性回歸分析等。
Python編程語言作為一種面向?qū)ο蟮慕忉屝跃幊陶Z言,具有簡單、易學(xué)、速度快、可移植性高和具有豐富的庫等特點,越來越受到人們的重視和使用;機器學(xué)習(xí)模型是一種高效的數(shù)據(jù)分析算法,可以通過Python語言一步導(dǎo)入進行數(shù)據(jù)計算,免去了復(fù)雜的編程過程,對于沒有計算機編程基礎(chǔ)的人員有很好的適用性。
利用上海市公共數(shù)據(jù),通過Python語言進行編程建模取得的水量預(yù)測模型已經(jīng)在日常工作中得到了初步使用,可以實現(xiàn)短期、長期的水量預(yù)測,也可以根據(jù)業(yè)務(wù)要求實現(xiàn)特定類型的水量預(yù)測,具體應(yīng)用情況如下:
1、未來每天和每小時短期供水量模型,相對平均誤差分別為1.5%和1.9%,主要用于根據(jù)未來短期內(nèi)水量變化情況,為供水調(diào)度提供數(shù)據(jù)支撐。
2、未來每月長期水量預(yù)測模型,相對平均誤差為2.4%和2.5%,主要用于未來長期用水量計劃制定。
3、邊界流量儀水量預(yù)測模型,相對平均誤差為3.0%,主要用于修正流量儀非正常工作狀態(tài)下計量的水量。
今后隨著技術(shù)的不斷成熟,我們可以縮小供水范圍,例如利用預(yù)測結(jié)果控制小區(qū)的供水量,實現(xiàn)供水的精細(xì)化調(diào)度;還可以將這種方式應(yīng)用于水質(zhì)、水壓等數(shù)據(jù)分析中,發(fā)現(xiàn)數(shù)據(jù)之間的相互關(guān)聯(lián)程度,從而逐步打通數(shù)據(jù)孤島,實現(xiàn)智慧供水。
本文 作者:高赫余 王圣 吳瀟勇
本文 采編:《凈水技術(shù)》雜志社 阮辰旼
排版:張蕾
校對:黎翔