車品覺簡介:現任中國計算機學會大數據專家委員會副主任、浙江大學管理學院客席教授等職。車品覺先生于2010年加入阿里巴巴集團,擔任阿里巴巴集團副總裁、阿里巴巴集團數據委員會會長,負責阿里大數據體系的整體規劃。2016年4月,車品覺先生從阿里巴巴集團離職,加入某知名投資機構,其視野也從一個大公司的內部運作轉向全社會的創新創業生態體系。
2013年以來,歐盟、美國、日本等發達國家相繼啟動大數據布局,全球大數據產業進入快速發展期,大數據產業也上升為我國國家戰略。受若干地方政府發展大數據產業需求推動,中機院顧問李輝研究員(上海市科學學研究所)就當下大數據面臨的機遇和挑戰,以及政府治理究竟該如何適應這一新的科技革命等問題與車品覺進行了深入訪談,摘要如下:
大數據是一種全新的材料,不是另外一種高科技
研究員:大數據在三四年前爆發,成為經濟社會各領域廣泛接受的新概念。您在大數據領域有著豐富的實戰經驗,但是以您觀察,社會層面對大數據是不是已經廣泛接受?
車品覺:今天你跟我聊,我特別想強調的一個觀點,就是大數據是一種全新的材料,它不是另外一種高科技,只要你找到了合適的方式用它,它在哪里都可以使用。這個觀點看似被人重復過很多了,但是其實很多還根本不理解。
我跟很多企業領導或者政府部門談大數據的時候,發現他們很多都是停留在“解決問題”的層面,就是說,當大數據引發一件事情后,他們總是在想該怎么解決,但是很少認真探討這個出來的事情,本質上跟以往的東西有什么不一樣。因為你真的把大數據當成是一種材料的話,你就會明白,大數據帶來的問題是全方位的。它不是哪一種具體的技術,讓你能看到它的功能,讓你有辦法針對性地管理。大數據帶來的影響是全方位的,很多創新出來的時候,你根本意識不到,同樣很多問題出來的時候,你也完全理解不了。所以我說,一定要把它當做一種新材料,從本質上,從體系上來思考大數據。
大數據時代,最重要的是關聯
研究員:大數據對經濟社會的方方面面都有滲透,剛才您談到了大數據本質上是一種材料,那么,從您這些年的體會來看,對這種材料的應用,相較于以前的數據應用,究竟有什么樣的新特征?
車品覺:如何應用大數據?首先要了解數據的生命周期。“布點”、“收集”、“存儲”,這些是前端,之后需要對數據做“識別”、“關聯”、“分析”。還有一個能把整個過程包起來的,就是“實時刷新”。這就是數據的生命周期,它是一個閉環。不管你怎么使用大數據,你首先要了解這個周期。
大數據跟以前的數據不一樣。首先,“布點”就往往不是你自己布的,有些“布點”是別人布的,所以你需要有一個對外部數據的認知。盡管你自己的數據有時候已經足夠大了,但還是要關注別人的布點,要把別人的數據“關聯”在你自己的數據當中。這是跟以前最不一樣的。以前的數據是封閉的,大數據時代不一樣了,一定需要跟外部的數據關聯。
譬如反恐,一個人從新加坡來北京,他從新加坡上飛機開始,就已經跟各種數據關聯了。事實上,關聯的速度越快,用于計算的時間就越多。我聽說美國在“9•11”后,用了三年的時間拿到了一種非常重要的技術,一種快速計算的技術。這種技術能從你站在海關那個地方拍照開始的五分鐘內,計算出你是一個恐怖分子的概率有多大。為什么?因為它用五分鐘時間把你的數據和恐怖分子的數據進行了關聯和計算。這只是據說,并沒有人詳細知道。為什么我知道,因為它用到的這個技術,剛好是我朋友那個公司開發的,這個技術本來在華爾街的交易中心用來實現一百毫秒的運算能力,有人買了這個技術給了美國政府。
就像我剛才講的,從人臉識別到匹配全世界十幾億人數據,如果你需要三個小時來計算,那肯定就完蛋了。正確的做法是:從你進入海關的那一刻就開始計算,之后不管你是在空中還是在陸地上,計算機都在不斷關聯和計算你。所以說大數據時代,最重要的就是關聯。
研究員:如此說來,數據關聯是大數據時代的新特征,那么數據關聯一定能夠創造之前不可能創造的新價值,是這樣嗎?
車品覺:過去我們用數據去解決“發生了什么”這樣的問題,但是從我們知道“發生了什么”到最終“如何解決”,中間是有很多的環節。隨著數據技術的發展,中間環節需要人工判斷的地方在逐漸減少。
譬如打車軟件告訴你,從現在這個地方打車到你家需要45分鐘,但是你因為急事必須30分鐘之內回到家,怎么辦?其實后來你發現,你可以先打車到某一個地鐵站,在那個地鐵站乘地鐵,總共半個小時就到能到家了。這個問題就解決了。但此時你發現你已經必須關聯第三方數據——不單單是出租車的,還要地鐵的。
過去數據很集中,就是我知道我有多少數據,問題很清楚,我能解決問題。但是我告訴你,過去的解決只是一種假設的解決,因為沒有第三方數據,只是基于假定的第三方數據做決策。所以大數據的起點就是關聯第三方數據。當第一方數據和第三方數據能夠非常有機結合的時候,我們對數據的分析就會有一種全新的理解。
大數據應用涉及“快”、“準確”和“過去的經驗”
研究員:所以要做出正確的決策,關聯第三方數據非常重要。那從機器的角度來看,代替人決策的內容越來越多,是否意味著對技術的需求也越來越高?
車品覺:事實上,人工智能、深度學習,這些都是二十年前就有的技術,但是二十年前沒有大數據,沒有可以關聯的數據。所以大數據的故事從有了關聯才真正開始。
正像我前面講的,這個過程中,人類在中間環節需要做判斷的地方越來越少了,這不是減少人手這么簡單,其實它是“兩秒鐘”的科技,就是說,讓很多事情的決策提高了兩秒鐘。不要以為兩秒鐘很簡單,你要知道一百毫秒跟兩百毫秒的差異,在股票市場中就是會死人的,人家拼就拼這一百毫秒。
研究員:大數據的應用,代替了很多人的思考,加速了決策過程,“快”是大數據應用創造價值的主要判斷標準嗎?
車品覺:在我看來,大數據的應用一般涉及三個問題:在解決一個問題上,“快”是不是一個非常關鍵的點?“準確”是不是一個非常關鍵的點?“過去的經驗”是不是一個很關鍵的點?
“快”,我剛才說了,很多事情,勝負就是兩秒鐘甚至一百毫秒的事。“準確”,自動駕駛對路上的人臉識別,過去的準確率是90%,如果你能提高到95%,很多功能就可以實現了,那就是一場革命。還有就是“過去的經驗”,也就是可重復性,我從這里跳下去死不死?這是一個低概率事件,根本沒有重復性,因為我只有一條命。所以我們喜歡看的是天天都有的數據,就是發生率非常高、重復率非常高的數據,這樣的話,數據分析才有大用途。
大數據帶來生態創新
研究員:談到大數據帶來的新價值,您之前在阿里工作,現在成為一名投資人,所以無論是自己的實踐,還是您看到的其他人的實踐,相信都是非常多的。我想首先了解您為什么會從一個大公司的大數據負責人轉戰做一名投資人。
車品覺:對我來說現在是擴大眼光的很好的時機,可以看到更多的東西。以后有機會可以再把目光收回來聚焦。就個人來講,我沒有興趣幫企業賺錢。為什么我要參與國家大數據工作組和網信辦的一些工作,就是因為我想處理一些政府層面的問題。
但是我愿意和政府官員交流,并不是說我喜歡政府的權力,權力對我來講絕對沒有什么吸引力。如果我需要權力,就在阿里繼續管多一點人就行了。我真正喜歡的,是大數據帶來的新生態。我跟一些政府朋友說,其實我最近挺開心的,因為我做投資之后出去見了很多小公司——這是生態的標志。
一個生態的形成意味著,你會看到非常多的、能生存下來的小公司。中國(互聯網領域)只有三大巨頭肯定不叫生態。能叫生態,必然是這個地方有很多的種類,很多你想都沒想過的東西在出現,螞蟻、蜘蛛……這些都是正常的生態。如果一個生態很干凈,只有一座大山,那不叫生態。對于大公司來講,比如對于阿里來講,新生態并不是什么好事兒,因為有很多阿里的人出去創業,十幾、二十幾個人就組建成一家小公司。這對于阿里來講是一件挺頭疼的事情。但是對于生態來講,這是一件好事。
我跟一個朋友開玩笑說,以前在阿里,有人、有錢、有數據,我出去見到很多小公司,沒數據、沒錢、沒人。但我還是看到非常多的年輕人在創業,包括很多海歸。我開始對這個生態產生信心。我們現在已經站在大數據帶來的整個生態創新的臨界點,這是大數據真正的意義所在。
有些政府部門沒有想清楚自己為什么要收集數據
研究員:數據關聯越來越多,人工智能越來越發展,勢必會激發出大量創業公司的出現,大企業當然也會受益,也就是您所說的一個生態系統的形成。這顯然也給政府帶來了挑戰,因為政府以前主要治理小數據,但是在這個大數據的生態中,政府應該做怎樣的調整來刺激這個新生態的發展?
車品覺:怎么來治理整個生態,這是一個蠻有意思的問題。中國現在有一個比較有意思的課題,就是數據資產。政府絕對是擁有數據資產最大的機構,但是今天中國對數據資產的理解太淺,有點不夠重視。
有些政府部門沒有想清楚自己為什么要收集數據。我認為,政府部門對數據資產停留在想要有多少就有多少的階段。這是很小數據時代的思維:占有數據,控制數據。其實只要有好的策略,政府拿到的數據會越來越多。但是我要說的是,你拿的數據多了,對社會的責任也就多了。如果你擁有這么多數據,你又不去用,那你干嗎收集?但是如果你把這些數據分享出去,人家又會說泄露隱私。
而且我們要明白,政府的數據往往是一些商業領域的催化劑,這一點非常難琢磨。事實上,你根本用不著把數據分享出去,你可以根據數據建立模型,別的公司既看不到數據,又能從你的數據里獲益。這才是聰明的做法。比如人民銀行征信里面的數據,是不必要公開的,它只需要做一個模型跟其他模型匹配。這一點其實是人民銀行該做的。
研究員:除了公開政府自己的政務數據,中國政府推出的“互聯網+”戰略在一定程度上推動了社會上各領域數據的關聯。
車品覺:確實是。我覺得美國這么多的總統里面,奧巴馬是最偉大的。因為他是第一個把大數據推到美國國家最高戰略層面的總統。奧巴馬政府有自己的數據中心,有自己的政府CDO(首席數據官)。
同樣做這件事情的,是我們國家的領導人。中國政府也把大數據跟“互聯網+”推到國家戰略層面。唯一不一樣的是,美國做這個事情更加開放,中國比較封閉,但是兩者的力度都非常大。我說的偉大就是在這個地方,就是敢做。你看哪有一家公司現在不賭還想贏的?國家同樣如此。
當然也有人會說,與其說奧巴馬厲害,不如說美國厲害。其實奧巴馬之前的兩任總統就已經把美國圖書館里面的資料全數字化了,這些為奧巴馬的大數據化做了鋪墊。但是中國政府在此之前毫無鋪墊,是憑空開始做這件事情的。關于這一點,做研究的人就需要想一想,中國和美國國情有何不同?我們該怎樣做?
今天的數據交易還停留在“你要賣他要買”的狀態
研究員:政府開放數據,以及在全社會提倡“互聯網+”,將顯現地增加全社會數據互聯的程度。但是在企業層面,正如您前面所說,很多數據“布點”都是別人布的,如何關聯?是不是正是在這個背景下,數據交易在中國逐漸熱了起來?
車品覺:今天在中國的數據交易有一點像淘寶,就是說,如果我有一堆數據,我可以跟你做交換或者賣給你。業內有很多人交流過這個問題,但是說實話,通常情況下我是不敢用這些數據的。
為什么?你今天給我一個數據,我不知道你的來源,也不知道數據會不會是臟的,我怎么敢用?每天早上八點鐘之前數據一定要給到我,你能不能做到?如果不能做到,我怎么敢用?如果用得好,下一次的數據質量是否跟上次的一樣?如果不一樣,我怎么敢用?另外我還擔心,如果有一天你突然不賣給我了,那我已經開展的業務怎么辦?
如果這些都無法確定,我是真不敢用交易來的數據。但現在的數據交易,確實是都不能確定這些問題的。總體來說,今天的數據交易還停留在“這是一個沙發,你要賣他要買”這樣的狀態,還沒有到剛才說的細節。
不過中國的事情很奇怪,有時候先忽悠,忽悠起來了就會有很多人把他的資源加進來,結果這個事情最后也能搞成。這是很中國特色的,在美國是不敢想的,但是在中國有時候真的會發生。我朋友問我,我也不敢說中國的數據交易不行。但是我知道這件事現在還很迷茫,做這件事的官員很著急,到現在還沒有一個很清楚的案例能說明,數據交易是成功的。
數據擁有權的歸屬是個尖銳問題
研究員:一個私營公司收集的數據,本身就是用戶的數據,然后再賣給別的公司,這不是有問題的嗎?
車品覺:你這個問題其實是挺尖銳的,尖銳在哪里呢?尖銳在涉及數據擁有權的歸屬。這個問題我們討論了很久,政府部門也比較關心。比如說,你現在進了一個網站,這個網站說“你如果用我網站的服務,那么有關你的數據就歸我所有”。你同意了,那么相當于你簽了約,你使用網站或者應用的服務,網站或者應用就可以使用你的數據來改善它的設計。但問題在于,用戶同意讓你使用數據搞好用戶體驗,并沒有同意你跟其他公司交換有關他的數據,是不是?
之前參加一個論壇,有個人問了數據擁有權歸屬的問題。旁邊一位剛好在公司里做這件事情的人說,“現在來說這還不是很嚴重的問題”。我立馬回應說:“誰說不嚴重?”從阿里離開之后,我就要說實話。切切實實來講,作為一個公司你有這個權力嗎?
還有一點,先不說你把數據拿出去交易,就說你自己用,譬如用戶注冊了一個公司的網站,使用這個網站的服務。但是這個網站僅僅靠本網站的數據對用戶的認知還不足夠,它出去買一點數據匹配進來,就能知道更全面的信息。但是,用戶有沒有授權網站去認知他?這個事情應不應該告知用戶,公司有沒有責任?我對這種做法有一些反感。如果在美國、歐洲的話,這個事情是有一點夸張了。我這是實話實說,沒有夸大。
其實大公司在這方面的問題更大。比如騰訊、阿里,事實上是一個包含非常多公司在里面的公司,政府對這種公司的處理是不是應該一視同仁?什么意思呢?我這個公司有一百個分公司,用戶和任何一個公司簽“可以使用數據作為用戶改善”協議時,該協議是限定在這個分公司,而不是一整個集團!我想說的是,當一家公司已經大到分公司之間的數據傳輸也會讓你惱火的時候,你不能把一家公司當一家公司。
大公司在使用數據時應該有一個限制
研究員:中國的BAT(百度、阿里巴巴、騰訊)收購了很多公司,收集的數據越來越龐大。所以大公司在數據的交易中是不是應該承擔更重要的責任?
車品覺:我想說,大公司在使用數據時應該有一個限制,哪怕是公司內部的自我交換,也應該是有一個限制。老實說,今天給你講的東西,如果我是在一個大公司工作的話就不會跟你講,這完全違反了公司利益。但是如果從國家的立場和人民的利益來講,這個問題還是應該提出的。過大的權力或者是過大覆蓋面的公司,它們對數據的使用和小公司完全不一樣,不能一概而論。
在美國這個問題已經在尋求解決方案了,不同級別的公司對數據的使用需要遵循具體的監管要求。政府已經開始對這種公司進行監管,這個監管看上去還是很簡單的:就問你幾句話,你們公司到底有沒有合規。很多公司都有一個合規部門,是公司里面一個專門負責檢查自己公司數據應用情況的部門,它會按照政府的規則去自我檢查。
所以政府的監管很簡單,我只找你公司的CTO(首席技術官),給你一張表填,你自己檢查自己合規不合規,如果將來出了事,你等著罰。我不查你,你自查,但是一旦出了問題別怪我罰你。當然這要看企業的級別,看企業的影響級別。
研究員:在中國是不是可以照搬這種做法?
車品覺:我們現在的政府總是怕,害怕影響企業,擔心監管會影響企業的運作。政府部門有這樣的態度是挺好的,但是過于謹慎。我覺得這個怕不代表可以完全不做。
我說政府這樣不對的原因就是,沒事的時候不敢干,有事的時候太嚴格。你沒有給企業一個比較清晰的指引,等到出事了,政府才告訴你這不能搞那不能搞,然后十幾個部門一起盯著。這是一下子天堂一下子地獄。我覺得這是政府要思考的。 我最近參加了一個美國的會議。會議用的概念不叫合規,叫企業責任,往前更進了一步,就是有大量數據的公司,要先定義你的責任。這蠻有意思的,很多國家,譬如加拿大,已經開始考慮這件事了。
研究員:這個會議是誰主辦的?
車品覺:美國一個很大的民間團體,是由全美國大部分數據公司共同成立的一個民間機構。這個民間機構會定期組織討論,定下規矩然后告知政府。一旦某一個企業不遵守,就會把它從團體中踢出去。這還是蠻有意思的。但是我覺得中國的協會都不是這樣的,它們做不了這樣的事。所以我覺得,中國政府還是需要多做一點事。
一般投資項目,政府不要領投,要跟投
研究員:在政府開放數據,企業也合規分享數據的情況下,大數據促成的新生態勢必會蓬勃發展。在這樣的新生態里,政府除了開放數據,是否也可以直接投資一些項目加速整個大數據領域的發展?
車品覺:香港政府有一個事情做得不錯,但是大陸沒有做。好像叫一對一,就是如果一個項目你能讓投資人投,那么政府也跟著投。投資人其實是有他的眼光,我做投資人的時間還不是很長,但是我覺得他們對企業的評估,有自己的衡量,這是很專業的事情。
舉例來說,我在阿里有一次準備要做一個項目,一個很好的項目。然后我就找我老板。我當時的老板也是一個高級副總裁,我跟他說要給我一點人。他的第一句話是“別的部門有沒有幫助你”,我說“有,有幾個部門都給了我兩個人”,然后老板就說“他給你兩個人,我也給你兩個”。后來我問我老板為什么?他說,“很簡單,在一個生態里面,當一個東西好的時候,你會發現別人會看好你,自愿幫你,這個項目一定成功。別人不看好的,硬給資源一般是浪費。”
為什么會這樣講?因為大家都有一種普遍心理:我不懂,但我可以跟著懂的人去投項目。所以聽說我們公司投了的項目,其他公司一定會跟投。就是說,如果幾家大的、權威的投資公司投資一個項目,很多小的公司都會跟著投這個項目。
因此,政府如果跟投是可以的,不要去做主投。而且如果政府要投資,一定不要做天使投資人,天使人就是在項目早期投資一百萬以下的那種。我認為政府應該是在項目有眉目的時候跟投,而不是在項目早期進入。我不知道這對不對,我只是覺得政府是很難做好這個角色的。說實在的,政府在這一點上想的還是對的,但是做得好不好還不知道,但是這個方法還是可以的。
研究員:這就引出來一個比較關鍵的話題,政府內部分析產業趨勢的智庫,也是可以做政府項目投資分析的。事實上我們國家的產業政策很多時候就是這樣落地的。
車品覺:在整個投資的過程中,投資公司厲害的地方往往是在于它的數據分析團隊,分析師很厲害。所以說,政府找到的投資類智庫幾乎沒用。我自己就是政府的智囊,連我都沒有信心看清楚的,我不覺得政府可以。
我問過美國的朋友一些關于政府投資的問題:政府該不該搶風投這碗飯?如果其他人不投,政府該不該領投?該不該和私人機構競爭?這些問題,他們也沒有確切答案。一般投資項目需要投資方法——政府不要領投,要跟投。除非我們看到的項目是非常底層的項目,這樣政府可以早一點參與。就是說如果這是一個基礎建設,政府可以砸一點錢,政府主投。但是一定要有私人的投資者跟投,如果私人投資者不跟投,那么政府也沒必要繼續砸錢。因為政府主投的項目是相對有優勢的,但私人機構經過分析不投資的話,那么這個項目肯定存在一些問題。
就大數據這個領域而言,前面說了政府的作用是催化,是鼓勵,而不是投錢。連私人投資都不投的(一般投資)項目,政府居然投資了,那肯定是有問題的。
中國現在很需要有首席數據官
研究員:按照您的看法,政府不便直接投資項目,那么政府在“大數據+人工智能”的新生態中,主要責任是不是就是開放政府數據,這件事該如何施行,政府在其他方面還可以有什么作為?
車品覺:我想說,現在政府都很急于把大數據往前推,但是很多時候都是想著立即解決問題,但其實,政府有什么樣的數據,什么能開發什么不能開發,哪些數據開放之后對整個社會有幫助,哪些數據跟別的數據進行關聯才有用,這些問題都是需要通盤考慮的。
也是在這樣的理解基礎上,我認為中國現在很需要有CDO(Chief Data Officer,首席數據官),美國每一個州都應有一個CDO,白宮已經有一位CDO。這樣一個角色非常重要,因為盡管我們很多人都是做數據的,但還是隔行如隔山,譬如我在阿里數據委員會的會上經常講,我自己最懂的還是電子商務數據,旁邊做物流的數據我也要請教才了解,對于整個國家來說,系統處理各方面的數據顯然要難得多。所以我認為一個國家、每一個地方都應該有一個CDO,而且要盡快。
譬如用上海做例子,上海能不能有一個CDO,真的是在上海市長之下做這個CDO,幫市長處理各部門之間的數據?
我在阿里時做的最后一件事情,就是建立阿里的公共數據,現在我的部下還在繼續做,其實這個事情挺有意思的,但是一定要一把手支持,要不然做不了。政府部門也是一樣,在一把手支持下打通各部門的數據,把各部門數據變成公共產品給政府各部門使用,然后部分公開給企業用。這里面有一個麻煩的地方,每一個部門都有自己的數據,但都不想公開,所以這就是為什么要一把手支持。
研究員:如您所言,政府應當設立專門的CDO職位,幫助一把手統籌處理各方面的數據。但是從國際經驗來看,以及在國內一些地方的實踐來看,政府部門的開放以及如何處理開放數據帶來的系列問題,其實工作難度都是很大的。
車品覺:阿巴巴里曾經做一個這樣的KPI(關鍵績效指標),部門總裁每天匯報工作時,除了日常業務,還一定要說貢獻了什么數據給中央部門。你業務做得不錯,很好,那么你貢獻了什么數據呢?這也是評價業務總裁的指標。當然這個問題是下一步的,其實任何人都不會說我不愿意公開自己的數據,而是會推托說隱私問題、安全問題之類的。
所以如果上海設立一位CDO,他要做的事情,就是必須把數據聚起來,不要各個部門說有什么隱私問題,而是說我這個CDO的職責就是保護你的隱私的,所以你的數據要放到我這里。在阿里,公共數據的處理,我們自己有一個中央部門去負責;在上海,數據的處理,也應該有市長批復,有CDO批復。隱私的問題,交給我中央部門來負責。
我在阿里怎么評定數據的使用,第一有沒有隱私事情,第二有沒有影響到國家利益以及我們的企業利益。我就做這樣的決策人。政府的CDO也應該是一樣的。
上海最有能力做大數據生態治理的樣板
研究員:CDO的職責不只是開放數據,但僅就開放數據而言,在機制方面您有什么可以建議的?
車品覺:我覺得還是應該找一個標桿,有一次見成都的市長,他說了一句話,如果成都醫療的數據全部開放,你能做嗎?當然這些話有后話,你怎樣保護安全,你怎樣防止泄露?這肯定是一個前提。只是說領導的想法就是你要什么數據,只要國家安全跟隱私可以保護,就都可以給你用,你們去想辦法就行,只要你們有辦法,數據我一定開放。
這種思路和美國政府稍微不一樣,美國不是只給你一家用,你跟政府要求說要某一種數據,政府會考慮給你,但是如果開放了,就不是只放在你口袋里,也要給別人用。所以政府數據門戶網站上開放的數據,最好不是政府覺得應該開放的數據,而是企業覺得有用的數據。不是政府說應該挺喜歡天氣數據就放一個天氣數據,而是應該有商業邏輯在里面。每一個開發出來的東西其實必然是有一個面向需求的開發。
研究員:除了開放數據,CDO還應當有什么樣的職責?
車品覺:如果要開放一些數據,那么政府應該讓誰去評定應不應該開放,這個委員會在哪里,用什么機制開放出來,這是CDO的首要責任。另外就是投資,如果有人準備在上海做大數據方面的創業,到底政府應該怎么幫他們,這也很重要。當然還有一方面前面已經提到,就是對企業在數據互聯中出現的問題進行判斷和處理。
研究員:大數據的生態治理,給政府治理帶來了新的挑戰。您覺得國內各地方政府這方面的施行情況如何?
車品覺:我覺得上海可能是最有能力做樣板的地方,要全國做太難了,如果上海做不成功,不要期望別的地方可以做成,但是如果上海要做,千萬不要學某些地方只做門面的東西,這個門面東西只是給上面看,連自己都不相信,這會影響到當地的利益。
上海官員其實還是挺開明的,有一次負責信息化的一個部門讓我去評智慧城市的項目,給我看了一本很厚的材料。我當時跟負責人說,“一定干不完”。我看里面的內容很多是把以前十幾年老賬翻出來,然后包裝成一個智慧城市,是大家都奔著智慧城市這個名字,把以前干不出來的東西都套進去,而且你這個專家評審只給我五分鐘發言,怎么夠?后來這個負責人聽進了我的批評,之后的評審會不僅又讓我來,還把上海市民找來,三百名,一起討論。所以我覺得上海的政府官員還是挺開明的。
人才的稀缺比數據稀缺更加恐怖
研究員:除了政府的治理水平,在市場創新方面,您覺得什么是大數據的生態發展中最重要的要素?
車品覺:其實最近兩三年中國的數據人才是不夠的。最好用的人往往是做數據已經有五年經驗的人,數據的經驗積累還是需要的,畢業五年之后是最好的,所以現在有非常多的創業公司,但是沒有足夠多的人才。人才的稀缺其 實比數據稀缺更加恐怖,很多人以為數據稀缺是第一困難,其實人才是第一,數據第二,第三才是生態。
人才到中國,第一件事情是看有沒有好學校,小孩子怎么辦?國際學校很重要,因為這意味著五年后是否還有可能回美國,五年后怎么與美國接軌?有些海外人才很喜歡中國,但是問他“子女要讀書,你會把他送回美國念書還是在中國”,他就卡殼了。在杭州,阿里最頭痛的就是,請那些數據科學家過來之后,他們一看幼兒園發現沒有一家比較好的,國際學校也幾乎沒有,只有一家但是跟上海沒辦法比,就打退堂了。北京的話,人家一看霧霾就不想了。配套設施其實就是上海好,什么東西能吸引世界人才,世界人才就會到那個地方。
所以政府對大數據的支持,與其直接給公司投資,還不如做些這方面的工作,千萬不要像以前那么笨,直接給好處、給公司好處。
第二個最重要的是,對搞大數據、人工智能的人來講,旁邊那個人是不是高手很重要。人才都要在高手的環境生態里面。譬如我以前的分析師團隊,可以說中國分析師團隊沒有比阿里厲害的,因為旁邊那個人很厲害。硅谷為什么會厲害,因為它要解決一個問題的話,旁邊就有他需要的人。
這個事情可以學習新加坡。我記得當年香港政府的一個人來我辦公室,問阿里巴巴能否在香港做一個數據研究所,我說你可以給我什么?他說“我們政府沒有給這方面政策”,我說我作為香港人很想幫助你,但是你要有政策才行。我告訴他們新加坡是怎么做的,新加坡的處長每兩個星期都會來我辦公室回訪。新加坡給錢、給人、免稅讓我們過去。他們的官員真的是每家大公司去拜訪,找機會讓你在新加坡落地,哪怕是只有一個小辦公室。我覺得新加坡做得真的很好,他們官員的積極性真的很高,他們很希望自己可以成為亞太區的總部。
上海可以成為數據特區
研究員:如您所言,如果一個地方的政府治理水平有保障,同時能夠吸引人才的流入,那也就意味著大數據生態在一個地方的健康發展。就您的觀察,大數據在各地蓬勃發展,各個地方也都千方百計希望能夠脫穎而出,您認為哪里最有可能成為大數據這一新生態中的關鍵區域?
車品覺:我覺得上海是非常有機會的。我有個想法,是不是講出來我有一點猶豫,是什么呢?我正在大力幫香港政府,希望把香港變成國際性的數據中心,但是和你聊,我覺得上海也具備這樣的實力。因為上海有條件跟香港不一樣,如果中國選地方做成國際數據中心的話,我覺得只有香港和上海是靠譜的。
因為現在每個國家都保護數據,數據是不能出國的,美國公司的數據不能出美國,俄羅斯公司的數據不能出俄羅斯,中國公司的數據不能出中國。但是作為國際企業怎么辦?很簡單,哪里法律允許就去那里。有沒有一個特區可以讓數據放進去,讓全世界都放心把那個數據放在那里做交換和交叉?這有一點像一個安全港的意思。我的意思就是,上海可不可以成為一個這樣的特區。
其實這個優勢香港也有,也不一定這個世界只有一個數據中心,中國也不一定只有一個,為什么不能有兩個?我覺得,上海、香港兩個自己跑,誰能贏誰?現在要說服的不是中國政府,而是美國、歐洲,讓它們相信可以把數據放進來。
如果不行呢?可能要跟“一帶一路”聯系起來。我們不一定能說服美國、歐洲,但是我可以說服“一帶一路”的國家。能把這些國家的數據放在上海或者香港,也是不錯的。