首 頁
解決方案
傳統平台
小(xiǎo)型機集群
雙活存儲方案
服務器集群
高性能計算
數據保護
刀片系統
新興平台
雲計算
基礎構架(IAAS)
軟件定義的存儲SDS
軟件定義的網絡
軟件定義的數據中(zhōng)心
平台(PAAS)
軟件(SAAS)
數據庫
大(dà)數據
産品
小(xiǎo)型機
IBM小(xiǎo)型機
ORACLE小(xiǎo)型機
HP小(xiǎo)型機
X86服務器
存儲
網絡
安全
數據庫
虛拟化
備份
公司資訊
關于興迪
公司簡介
辦公一(yī)角
加盟我(wǒ)(wǒ)們
合作夥伴
聯系我(wǒ)(wǒ)們
企業資質
興迪資訊科技有限公司
New Design Information Technologies Ltd.
小(xiǎo)數據如何起步,從小(xiǎo)數據到到數據
來源:
|
作者:
pro46dade
|
發布時間:
2017-09-05
|
1115
次浏覽
|
分(fēn)享到:
要做大(dà)數據,首先要了解自己的企業,或者自己所在的行業的核心是什麽。我(wǒ)(wǒ)們現在經常發現,有很多企業在競争的過程中(zhōng),最終不是被現在的競争對手打敗,而是被很多不是你的競争對手所打敗。很簡單的一(yī)個例子,大(dà)家都認爲亞馬遜是做電商(shāng)的,但這是錯的,它現在最主要的收入來自于雲(雲服務)。也就是說企業需要找到自己的核心數據(價值)。
目前國内外(wài)關于大(dà)數據的談論很多,大(dà)多是談運營級别的,或者說從服務端、服務方提得較多一(yī)些。筆者要跟大(dà)家交流的問題是作爲各類企業尤其是客戶方的企業來說,大(dà)數據跟他們有什麽關系,或者說作爲企業方怎樣去(qù)參與,這是企業方現在面臨的最大(dà)問題。
這個問題的答案重點在于大(dà)數據應該從小(xiǎo)數據開始。因爲現在很多企業面臨的最大(dà)問題不是怎麽用大(dà)數據,而是内部的一(yī)些小(xiǎo)數據整合出現問題,或者小(xiǎo)數據都沒用好的情況下(xià)怎麽用大(dà)數據。大(dà)數據應該是從小(xiǎo)數據逐漸演變上去(qù)的,是一(yī)個正常的生(shēng)态,而不是瞬間變化的。大(dà)數據這個概念跟自媒體的概念類似,需要企業自己去(qù)建設,而不是從一(yī)開始就想着依靠别人。很多企業在談自媒體的時候,像談别人的事情一(yī)樣。比如一(yī)談自媒體,就覺得那是第三方提供的一(yī)個平台,大(dà)家在那兒發發牢騷。自媒體是自己的媒體,企業自己也要參與進去(qù)。同樣大(dà)數據不是别人的大(dà)數據,我(wǒ)(wǒ)們假設有一(yī)個第三方提供了大(dà)量的數據,有很多很多信息,CI、BI之類的很多模塊化東西供我(wǒ)(wǒ)們來用。如果這樣的話,你有,競争對手也有,你能得到的東西,競争對手也能得到的情況下(xià),就不能稱之爲核心競争力。大(dà)數據作爲企業來說要變成自身的一(yī)個競争力,企業必須得建立自己的企業級的數據。
要做大(dà)數據,首先要了解自己的企業,或者自己所在的行業的核心是什麽。我(wǒ)(wǒ)們現在經常發現,有很多企業在競争的過程中(zhōng),最終不是被現在的競争對手打敗,而是被很多不是你的競争對手所打敗。很簡單的一(yī)個例子,大(dà)家都認爲亞馬遜是做電商(shāng)的,但這是錯的,它現在最主要的收入來自于雲(雲服務)。也就是說企業需要找到自己的核心數據(價值),這個是最關鍵的。隻有在這個基礎上,建立自己的大(dà)數據才有可能,才能做一(yī)些延伸。其次,要找到内部的一(yī)些外(wài)圍相關數據,去(qù)慢(màn)慢(màn)地成長它。有點像滾雪球,第一(yī)層是核心,第二層是外(wài)圍相關的數據。第三層是什麽?就是外(wài)部機構的一(yī)些結構化數據。第四層是社會化的,以及各種現在所謂的非結構化的數據。這幾層要一(yī)層一(yī)層地找到它,而且要找到與自己相關的有價值的東西。這樣你的大(dà)數據才能建立起來。
第一(yī)步,找到核心數據。核心數據現在對很多企業來說實際上就是CRM,自己的用戶系統,這是最重要的。第二步,外(wài)圍數據。比如企業經常會在線上線下(xià)舉辦一(yī)些活動,在做活動的時候,消費者的信息隻是簡單地提供在表單裏面,還是進入了CRM的系統裏? 第三步,常規渠道的數據。舉例來說一(yī)個銷售快銷品的企業,能不能夠得到沃爾瑪的數據,家樂福的數據?很多國外(wài)大(dà)數據的案例,說消費者買啤酒的時候也會購買剃須刀之類,或者一(yī)個母嬰産品的消費者她今天在買這個産品,預示着她後面必然會買另一(yī)個産品。這就有一(yī)個前期的挖掘。這些價值怎麽來的,這就需要企業去(qù)找常規渠道裏面的數據,跟自己的CRM結合起來,才能爲自己下(xià)一(yī)步做市場營銷、做推廣、産品創新等建立基礎。第四步,外(wài)部的社會化的或者非結構化的數據,即現在所謂的社會化媒體數據。這方面信息的主要特征是非結構化,而且非常龐大(dà)。這對企業來說最大(dà)的價值是什麽?當你的用戶在社會化媒體上發言的時候,你有沒有跟他建立聯系?這裏有個概念叫做DC(digital connection)。所謂的互聯網實際就是一(yī)種DC,但是通常互聯網上的那種DC是在娛樂層面。用到商(shāng)業裏面的話,就是企業必須得跟消費者建立這種DC關系,它的價值才能發揮出來。否則,你的數據以及很多的CRM數據都是死的。就像國外(wài)CRM之父Paul Greenberg寫的四本CRM相關書籍,前面三本都是在講數據庫、系統之類的。第四本書的時候,就沒有再講那些東西,講什麽?講互動,講DC,講怎麽跟消費者建立關系。
有了這個數據庫去(qù)進行數據挖掘,或者在建立數據的過程中(zhōng),企業需要從什麽方向去(qù)探索,也不是漫無目的的。首先應該跟着你的業務,業務現在有哪些問題,或者說這個行業裏面主要的競争點在哪裏,這是很關鍵的。有了這個業務關系以後,再形成假設,也就是說未來的競争點可能在哪裏,大(dà)到未來的戰略競争,小(xiǎo)到哪些方面。然後下(xià)一(yī)步要怎麽做,這些形成一(yī)個假設,其次做一(yī)些小(xiǎo)樣本的測試。很多企業一(yī)看大(dà)數據就很恐怖,說我(wǒ)(wǒ)也買不起那些大(dà)數據,也雇不起那麽專業的團隊,怎麽辦?自己做一(yī)些小(xiǎo)樣本的測試,甚至通過電子表格Excel都可以做數據挖掘。不一(yī)定非要那麽龐大(dà)、那麽貴的數據。然後再做大(dà)樣本的驗證,驗證出來的結果就可以應用到現實中(zhōng)去(qù)。
在大(dà)數據尤其是互聯網時代還有一(yī)個最重要的點,就是失效預警。即你發現一(yī)個規律,在現實中(zhōng)應用了,但是你一(yī)定要設立一(yī)些預警指标。就是當指标達到什麽程度的時候,之前發現的規律失效,那你就必須發現新的、相關的,否則也會造成一(yī)種浪費。筆者看到一(yī)篇文章,其中(zhōng)有一(yī)個重要結論。大(dà)家都在說大(dà)數據的價值很有用的時候,很多企業說我(wǒ)(wǒ)積累了多少TB,多少PB,但是你基于老的數據得出的很多結論實際是在浪費你的資源。你挖掘出來很多數據、很多規律,如果錯了,明天按這個去(qù)做,就是浪費。因此需要有一(yī)個失效預警。在這樣的過程中(zhōng),最終你需要對應建立起内部團隊,他們對數據的敏感度也才能培養起來。這時候你再去(qù)買大(dà)數據服務的時候才是有價值的。
所有這些工(gōng)作作爲企業來說是需要内部去(qù)做的,最終才能開花結果,有一(yī)些收獲。企業大(dà)數據起步,要從小(xiǎo)數據開始。
注1:關于數據挖掘過程中(zhōng)是直接上來就大(dà)數據、全數據,還是可以從一(yī)些小(xiǎo)數據、小(xiǎo)樣本入手,這方面目前存在一(yī)些争論。本文爲複旦大(dà)學主辦的“大(dà)數據與營銷傳播”高峰論壇的演講稿整理,僅代表作者觀點,供參考。
上一(yī)篇:
四川省興迪資訊科技有......
下(xià)一(yī)篇:
平台(PAAS)