先來(lái)看一個(gè)段子:有次聚會(huì)當(dāng)大家談到手機(jī)充電時(shí),一個(gè)哥們說(shuō)自己買了很多條iPhone數(shù)據(jù)線,家里每個(gè)房間插一條,這樣自己可以很方便地隨時(shí)充電……….。在場(chǎng)的MM們大多都沒有特別在意他這種充電心得,只是笑笑就過(guò)去了。只有一位細(xì)心的MM悄悄問(wèn)他一共買了多少條,他說(shuō)42條?,F(xiàn)在這位MM和這哥們?cè)诒本┮惶卓偣灿?2個(gè)房間的豪宅里愉快地生活,正準(zhǔn)備下個(gè)月結(jié)婚。
【這就是數(shù)據(jù)分析】!
再來(lái)一個(gè):近日,一小伙專門應(yīng)聘上海均價(jià)最高之一高檔小區(qū)的物業(yè)管理,自己配了掃描槍,每天就盯著小區(qū)垃圾堆,看見有條形碼就掃描,晚上回家把數(shù)據(jù)整理出來(lái),得出這小區(qū)喝什么水吃什么油買什么衣服。三個(gè)月之后,他就把整個(gè)小區(qū)的消費(fèi)品類偏好和品牌偏好搞到一清二楚。
【以上算是數(shù)據(jù)挖掘】。
數(shù)據(jù)分析和數(shù)據(jù)挖掘還是有點(diǎn)區(qū)別的,雖然這篇文章不是專門論述兩者的區(qū)別,但還是簡(jiǎn)單交待一下。
廣義的數(shù)據(jù)分析包括了狹義的數(shù)據(jù)分析和數(shù)據(jù)挖掘,所以下面講的數(shù)據(jù)分析主要是指狹義的。
數(shù)據(jù)分析(狹義)相對(duì)數(shù)據(jù)挖掘來(lái)說(shuō)是比較簡(jiǎn)單和通俗易懂一些,主要實(shí)現(xiàn)方法是統(tǒng)計(jì)分析方面的知識(shí) ,最常見的做法是假設(shè),然后通過(guò)數(shù)據(jù)分析來(lái)證明假設(shè)成立,常用匯總、對(duì)比、分組、交叉等方式,得到的值包括匯總值、差值、平均值等的。數(shù)據(jù)挖掘除了統(tǒng)計(jì)分析之外,還涉及人工智能方面的技術(shù),常用方式包括決策樹,輸出模型,神經(jīng)網(wǎng)絡(luò)等高端貨。
數(shù)據(jù)分析是一般人都能干的活,而數(shù)據(jù)挖掘則需要有一定潛質(zhì)又要經(jīng)過(guò)專業(yè)訓(xùn)練才可以勝任的。因此說(shuō)供水人雖然并不是個(gè)個(gè)都會(huì)做數(shù)據(jù)挖掘,但都應(yīng)該具備一定的數(shù)據(jù)分析思維。
供水企業(yè)在生產(chǎn)、經(jīng)營(yíng)、管理和服務(wù)過(guò)程中,會(huì)產(chǎn)生很多數(shù)據(jù),所以數(shù)據(jù)分析的對(duì)象和應(yīng)用是相對(duì)廣泛的,這里僅舉幾個(gè)例子,意在拋磚引玉,希望有經(jīng)驗(yàn)的同行能有更多、更好的分享。
例1:你做過(guò)天氣數(shù)據(jù)的統(tǒng)計(jì)和分析嗎?
天氣數(shù)據(jù)有什么用?供水同行都知道,天氣因素將直接影響供(用)水量需求,在每年用水高峰期這種關(guān)聯(lián)關(guān)系更為明顯,在高溫天氣臨界區(qū),平均氣溫每上升1度,炎熱就會(huì)讓用水量大幅增長(zhǎng)。
對(duì)天氣情況分析常見的是氣溫變化和晴雨天數(shù)兩種。由于供水企業(yè)不是專業(yè)的氣象部門,所以通常對(duì)過(guò)去的數(shù)據(jù)進(jìn)行比較分析為主,對(duì)未來(lái)短期預(yù)測(cè)分析為輔(數(shù)據(jù)來(lái)源也只是靠天氣預(yù)報(bào))。
當(dāng)某一時(shí)段供(用)水量變化異常時(shí),就要考慮天氣情況是否也是異常的,需要對(duì)此進(jìn)行兩者之間的關(guān)聯(lián)性,對(duì)這個(gè)假設(shè)作因果求證。常用方法是曲線疊加:例如將日供水量、日平氣溫?cái)?shù)據(jù)制成曲線,看看兩者的趨勢(shì)是否基本一致。
對(duì)于晴雨天數(shù),常見用法的是將某一階段數(shù)據(jù)與歷史同期進(jìn)行對(duì)比,對(duì)比的結(jié)果差異越大,說(shuō)明因果關(guān)系越強(qiáng)。除此之外,利用晴雨天數(shù)也可以對(duì)未來(lái)作一些預(yù)測(cè),因?yàn)槟硞€(gè)地區(qū)一年的晴雨天數(shù)大致是接近的,如果晴天或雨天在前期多了,那是不是意味著后期就會(huì)減少呢?
最后一點(diǎn)我們必須要考慮,除了天氣因素還有很多因素會(huì)影響供(用)水量變化,例如經(jīng)濟(jì)景氣程度、供水區(qū)域變化、用戶數(shù)量增減等等,但天氣因素的特點(diǎn)是對(duì)供水量的影響幾乎是全面性的,氣溫上升或晴天增多將會(huì)讓各行各業(yè)的用水量都增加,反之氣溫下降或雨天增多,幾乎所有用水需求都會(huì)下降。而經(jīng)濟(jì)景氣程度也不至于會(huì)造成全面影響,其主要影響工業(yè)、商業(yè)、特種用水以及外來(lái)人口集中區(qū)的居民用水等,對(duì)于大部分剛需用水的影響不大,例如常住的居民用水、行政、綠化、學(xué)校的用水等等。所以說(shuō)要對(duì)某一時(shí)段供(用)水量做分析和預(yù)判,為什么首先要對(duì)天氣數(shù)據(jù)進(jìn)行分析,因?yàn)檫@個(gè)比其他因素的影響要全面得多。
例2 對(duì)用戶用水量進(jìn)行排序,你會(huì)發(fā)現(xiàn)些什么?
例如,每個(gè)月抄完水表等售水?dāng)?shù)據(jù)出來(lái)后,你按水表口徑分類,將所有居民用水的水量用降序進(jìn)行排序,你會(huì)得到一份不同口徑居民用戶用水量的排名,然后再重點(diǎn)關(guān)注排在前面那些用水量超多的用戶,例如某個(gè)居民用戶僅僅是DN15水表,某個(gè)月卻抄回來(lái)1000多噸水,你會(huì)想到什么?
A、一個(gè)月用這么多,不會(huì)是水表故障、發(fā)神經(jīng)吧?
B、是不是抄表員抄錯(cuò)表才搞回來(lái)1000多噸?
C、是不是抄表員以前沒真正抄過(guò)水表,這次一下子把以前欠抄的都抄了回來(lái)?
D、是不是用戶檔案搞錯(cuò)了,實(shí)際根本不是DN15水表,而是個(gè)DN50大戶吧?
E、是不是用戶家里沒有人住又漏水了,一天24小時(shí)不停的漏才有這么大的量啊?
F、是不是用戶把水管拉到了其他地方用,搞起了轉(zhuǎn)供、轉(zhuǎn)售水行當(dāng)?
G、是不是用戶家里搞什么小作坊,例如食品加工之類的,才能耗掉這些水?
H、不會(huì)是有一幫傳銷人員聚在一起吧?
I、聽說(shuō)家里搞冰毒才會(huì)耗掉這么多的水………….
你做了一個(gè)用水量排序篩選,讓你發(fā)現(xiàn)了一個(gè)DN15水表一個(gè)月抄回來(lái)1000多噸水,然后又讓你想到了上面這么多可能發(fā)生的事情,是不是有點(diǎn)意思?
同樣的如果做一個(gè)反向排序,讓用水量少的排在前面,再剔除零用水量的用戶(或者順便做一個(gè)無(wú)用水的占比分析,看看是否合理),那么關(guān)注點(diǎn)就落在了這些用水極少的用戶身上,尤其是那些水表口徑大但用水量又特別少的,是不是又會(huì)讓你有很多想法,包括水表是不是有故障、用戶有沒有盜水,抄表員沒有抄錯(cuò)表吧、甚至內(nèi)部人員會(huì)不會(huì)徇私舞弊等等。
排序篩選是常用的數(shù)據(jù)分析方法,除了用水量,還可以針對(duì)更多,例如把欠費(fèi)的清單排一下,看看誰(shuí)欠的費(fèi)用多,次數(shù)多;把水表使用年限進(jìn)行排序,看看歷史最悠久的在用水表是哪一個(gè)?
但凡熟悉業(yè)務(wù)又有分析習(xí)慣的人,都會(huì)采用數(shù)據(jù)分析方式來(lái)找異常情況,而一旦面對(duì)這些異常數(shù)據(jù),通常都會(huì)產(chǎn)生很多想法,然后順著這些可能發(fā)生的情況再去一一求證,肯定會(huì)找到數(shù)據(jù)背后的真相,如果又能長(zhǎng)期堅(jiān)持這種做法,相信一定能取得令人滿意的管理成效。
數(shù)據(jù)分析的價(jià)值可能就在于此。
例3 如果你有管道漏水維修記錄,你可以做什么?
如果某一天,你手上拿到了整個(gè)公司或某個(gè)區(qū)域某一時(shí)期(例如上一年)所有的管道漏水維修記錄,你可以做些什么樣的數(shù)據(jù)分析,你可能最快想到的就是對(duì)這些記錄做一個(gè)分類統(tǒng)計(jì),通常能做出這些分類統(tǒng)計(jì)結(jié)果:
A、按管材分類統(tǒng)計(jì)發(fā)生的次數(shù)。
B、按管道口徑分類統(tǒng)計(jì)發(fā)生的次數(shù)。
C、根據(jù)維修地點(diǎn)進(jìn)行分類,統(tǒng)計(jì)各個(gè)區(qū)域發(fā)生的次數(shù)。
D、按投入使用年限統(tǒng)計(jì)發(fā)生次數(shù)。
E、按發(fā)生漏水的原因、狀況進(jìn)行分類統(tǒng)計(jì)。
F、按管道安裝隊(duì)伍進(jìn)行分類統(tǒng)計(jì)。
G、按明漏和暗漏來(lái)分類統(tǒng)計(jì)…….........
當(dāng)你做完這些分類統(tǒng)計(jì),也許已經(jīng)會(huì)得到一些初步的結(jié)果,例如某種管材漏水率會(huì)高一些,或者更復(fù)雜一些的組合分析結(jié)果:某種管材在某些管徑范圍讓某些人安裝在某些區(qū)域,其發(fā)生漏水機(jī)率相對(duì)高很多等等。或許能得到這些結(jié)果,幫助我們進(jìn)行輔助參考,已經(jīng)讓我們感到很興奮和滿意,但我要說(shuō)的是這樣的數(shù)據(jù)分析還是不夠全面的,會(huì)存在判斷失誤的風(fēng)險(xiǎn)。
為什么這樣說(shuō),其道理就是一個(gè)區(qū)域某段時(shí)間內(nèi)(例如一年)所發(fā)生的管道漏水維修記錄,僅僅是代表著已經(jīng)發(fā)現(xiàn)的管道漏水故障的修復(fù)情況,但不明確還有多少未知的漏水故障,所以統(tǒng)計(jì)對(duì)象的范圍并不具備足夠代表性。那該怎么辦,難道這些數(shù)據(jù)就沒有意義,如果結(jié)合管網(wǎng)漏損率分析就會(huì)讓結(jié)果更加穩(wěn)妥。例如在有DMA的情況下,一個(gè)區(qū)域管道漏水維修次數(shù)少,且管網(wǎng)漏損率低,那么是相對(duì)合理的;如果管道維修次數(shù)少,但管網(wǎng)漏損率高,那么是不是代表著還有較多的漏點(diǎn)或有很大的漏點(diǎn)沒有找到,這才是讓人更為擔(dān)憂結(jié)果。
所以這里要表達(dá)的是,單一地去看數(shù)據(jù)分析的對(duì)象、方法、結(jié)果可能都是對(duì)的,但在應(yīng)用過(guò)程中還要考慮數(shù)據(jù)分析的范圍是否達(dá)到足夠的廣度,分析的層次是否達(dá)到足夠的深度,否則就會(huì)出現(xiàn)片面的、讓人誤判的分析結(jié)果。
還有什么有趣的數(shù)據(jù)可以分析?
A、算一算供水范圍內(nèi)的住房空置率。設(shè)定的一個(gè)周期,例如連續(xù)六個(gè)月,然后把周期內(nèi)沒有用水的居民用戶篩選出來(lái),然后算一算這些居民用戶所占所有居民用戶的比例是多少,這個(gè)比例可以作為無(wú)用水率的參考值,某種意義也可以代表供水范圍的住房空置率。
但這個(gè)無(wú)用水率可真不是用來(lái)做買房參考的,而是一個(gè)用水狀況的宏觀數(shù)據(jù)基準(zhǔn)值之一。定期測(cè)算和關(guān)注這個(gè)數(shù)據(jù)的變化,可以讓管理者心中有數(shù)。如果有微觀的數(shù)據(jù),即在更小的區(qū)域獲得,例如在DMA區(qū)域內(nèi)也有這樣的數(shù)據(jù),精細(xì)化管理是不是又邁進(jìn)了一步,相信大家都已經(jīng)想到可以有N種用法。
B、關(guān)注居民用水的戶均用水量。這個(gè)可以做兩個(gè)數(shù)據(jù),一個(gè)是包含所有居民用戶的(即包括無(wú)用水戶的),另一個(gè)只是針對(duì)有用水用戶的。宏觀數(shù)據(jù)可能會(huì)通過(guò)較長(zhǎng)時(shí)間觀測(cè)才能發(fā)現(xiàn)一些明顯的變化,但微觀數(shù)據(jù)則很容易發(fā)現(xiàn)差異。這里以后面這個(gè)為例,這個(gè)數(shù)據(jù)至少可以用來(lái)觀測(cè)兩個(gè)方面變化,一個(gè)是戶均用水人數(shù)的變化,如果用在外來(lái)人口密集區(qū)域,戶均用水量變化是不是代表著每一個(gè)水表所住的人多了或者少了;另一個(gè)可以用來(lái)觀測(cè)居民生活水平的變化,因?yàn)槲覀冎廊嗣裆钏降纳仙?,其生活用水量也?huì)有一定的增加。如果你掌握了供水范圍內(nèi)各個(gè)細(xì)分區(qū)域的戶均供水量情況,同時(shí)也做了近年增量趨勢(shì)圖,是不是可以用來(lái)作為區(qū)域配水管網(wǎng)改造的參考依據(jù),順便考慮一下自己在哪里買個(gè)物業(yè)比較合適?
C、如果你有很多個(gè)營(yíng)業(yè)廳和比較多的收費(fèi)人員,同時(shí)又掌握每個(gè)人收費(fèi)業(yè)務(wù)完成數(shù)據(jù),是不是可以考慮做一個(gè)收費(fèi)效率參考指標(biāo),然后對(duì)收費(fèi)人員工作效率作評(píng)價(jià),看看哪一個(gè)是業(yè)務(wù)能手,哪一個(gè)營(yíng)業(yè)廳的收費(fèi)人員已快滿負(fù)荷,需要考慮增加人手;哪一個(gè)營(yíng)業(yè)廳是人員單位效率不足導(dǎo)致業(yè)務(wù)負(fù)荷大,真正需要的是提升個(gè)人效率而不是盲目增加人手?
D、如果抄表員的抄表機(jī)或抄表軟件有數(shù)據(jù)分析功能,除了抄表軌跡,是不是也查看一下大家每日抄表數(shù)量,從而判斷是否有個(gè)別人對(duì)抄表工作過(guò)度熱愛,一天抄回的水表數(shù)大大高于常人。
總而言之,掌握數(shù)據(jù),學(xué)會(huì)分析,總能讓我們更加接近真相,讓我們不會(huì)彷徨與恐慌。
希望以上這些能給您帶來(lái)參考與幫助。