“2020年,全球?qū)a(chǎn)生10倍于現(xiàn)在的海量數(shù)據(jù)。今天所有的硬盤加起來也裝不下這些數(shù) 據(jù)?!?9日,中國互聯(lián)網(wǎng)協(xié)會(huì)、中國新聞社主辦的2015產(chǎn)業(yè)互聯(lián)網(wǎng)大會(huì)在浙江舉行,百度開放云總經(jīng)理劉煬在由國內(nèi)領(lǐng)先的IT基礎(chǔ)架構(gòu)供應(yīng)商——杭州華三 通信技術(shù)有限公司發(fā)起的“云計(jì)算與大數(shù)據(jù)”分論壇上說。
中國互聯(lián)網(wǎng)民數(shù)已經(jīng)達(dá)到了全球第一。2014年,中國互聯(lián)網(wǎng)人口達(dá)到了6.5億,普及率達(dá)到47.9%?!拔覀?nèi)硕?,不足為奇,但我們的普及率超過 了世界的平均水平,這說明中國人真的需要互聯(lián)網(wǎng)?!敝袊ヂ?lián)網(wǎng)協(xié)會(huì)創(chuàng)會(huì)理事長、原中國科學(xué)院副院長胡啟恒說,她給出了一種猜測,未來十年,中國網(wǎng)民人數(shù)將 突破10個(gè)億。
如此背景之下,大數(shù)據(jù)時(shí)代已經(jīng)來臨。目前,百度開放云已正式開放,這是一個(gè)公有云的服務(wù)。目前,開放的產(chǎn)品有計(jì)算(云服務(wù)器、負(fù)載均衡)、存儲(chǔ)(云盤、對象存儲(chǔ)、關(guān)系型數(shù)據(jù)庫、簡單緩存服務(wù))、分布式計(jì)算、安全以及其他服務(wù)等。
“這只是第一步,今天開放的服務(wù)大部分是百度三層大數(shù)據(jù)引擎中下面的一層,未來會(huì)有越來越多服務(wù)在百度云上進(jìn)行開放?!眲f,隨著百度云開放,會(huì)幫助大家降低成本,加速創(chuàng)新。
越來越多的“開放”,讓云計(jì)算在未來的互聯(lián)網(wǎng)生態(tài)中越來越近。
未來“裝不下”云計(jì)算和大數(shù)據(jù)成新路
隨著互聯(lián)網(wǎng)迫切地“被需要”,一些問題也隨之而來。劉煬給出了一組數(shù)據(jù),2020年,全球?qū)⒂?60億物聯(lián)網(wǎng)設(shè)備,全球移動(dòng)連接數(shù)量將大于1000億,目前僅約70億。同時(shí),全球?qū)a(chǎn)生10倍于現(xiàn)在的海量數(shù)據(jù),并消耗完現(xiàn)有的所有電腦硬盤空間。
未來似乎已“裝不下”了,此時(shí),云計(jì)算與大數(shù)據(jù)的出現(xiàn)給未來開了一扇窗。
百度已經(jīng)看到了這扇窗,有著強(qiáng)大的技術(shù)積累的百度,從2003年起,已在大規(guī)模地分布式應(yīng)用上進(jìn)行研究,隨后,在分布式存儲(chǔ)、分布式的建設(shè)等方面,百度一直走在云計(jì)算和大數(shù)據(jù)的前沿,并一直在進(jìn)行探索。
劉煬介紹,搜索是百度的業(yè)務(wù),百度能夠收納的網(wǎng)頁越多,就可以做得越大。目前,百度收錄了全世界超萬億網(wǎng)頁,存儲(chǔ)了100PB數(shù)據(jù),大約相當(dāng)于5000個(gè)國家圖書館的信息量總和。
“每天有幾十億的訪問,流量很大,有中國網(wǎng)民,也有國外的網(wǎng)民。從業(yè)務(wù)需求的驅(qū)動(dòng)力來說,不管是網(wǎng)頁庫的規(guī)模,還是用戶訪問量的規(guī)模,我們必須做分布式的解決方案?!彼f,不僅規(guī)模大,多樣性也是百度的需求之一。
數(shù)據(jù)快速成長智能分析成必須
隨著業(yè)務(wù)的成長,數(shù)據(jù)量的成長也非常快。百度擁有大量的數(shù)據(jù),流量非常大,還在每天快速增長中。
數(shù)據(jù)可以幫助我們做什么?在劉煬看來,根據(jù)數(shù)據(jù),可以做大量的運(yùn)營數(shù)據(jù)分析,可以幫助分析人員快速找到該做什么,什么樣的用戶體驗(yàn)是好的。
“但光靠人的腦袋分析數(shù)據(jù)是遠(yuǎn)遠(yuǎn)不夠的,因?yàn)楫?dāng)數(shù)據(jù)量非常大的時(shí)候,光靠人找因果關(guān)系是不夠的?!彼J(rèn)為,在今天的大數(shù)據(jù)時(shí)代,其實(shí)人們在乎的不是因果關(guān)系,而是關(guān)聯(lián)關(guān)系。
“當(dāng)一個(gè)事發(fā)生的時(shí)候,另外一個(gè)事一定會(huì)發(fā)生,這不是靠人腦全部發(fā)現(xiàn)的,這導(dǎo)致百度除了可以處理很多數(shù)據(jù),還可以進(jìn)行數(shù)據(jù)智能。千億的因素不可能用人腦搞清楚,這里需要用特別先進(jìn)的技術(shù)去處理?!彼f。
數(shù)據(jù)的價(jià)值讓云計(jì)算和大數(shù)據(jù)在未來,成為一種必須。
工業(yè)制造中的云計(jì)算和大數(shù)據(jù)
“未來是大數(shù)據(jù)IoT的時(shí)代,除了電腦、筆記本、手機(jī)外,還有很多穿戴設(shè)備,比如手環(huán)和各種各樣的手表等,但這些設(shè)備遠(yuǎn)遠(yuǎn)不夠,我們相信在工業(yè)界的數(shù)據(jù)量也非常大,工業(yè)設(shè)備上會(huì)產(chǎn)生無窮多的數(shù)據(jù)?!眲J(rèn)為,在工業(yè)界,云計(jì)算和大數(shù)據(jù)也是必要的。
他舉例,今天,百度有幾十萬臺(tái)機(jī)器,每臺(tái)機(jī)器上有幾百萬個(gè)硬盤。幾百萬個(gè)硬盤就是產(chǎn)生大量數(shù)據(jù)的物聯(lián)網(wǎng)。因?yàn)檫@些硬盤都在進(jìn)行著數(shù)據(jù)監(jiān)控,分析算術(shù)、溫度等等,百度監(jiān)督非常多的硬盤物理數(shù)據(jù),然后把物理數(shù)據(jù)匯集起來,進(jìn)行學(xué)習(xí),對硬盤發(fā)生故障進(jìn)行預(yù)測。
這樣的技術(shù),影響了百度整個(gè)工作的模式。百度可以提前把數(shù)據(jù)從故障盤遷移到其他硬盤中,使得硬盤損壞并不會(huì)對業(yè)務(wù)進(jìn)行影響。此后,對硬盤進(jìn)行休眠和批量的修理。
“除了在百度內(nèi)部應(yīng)用,我們和某一家風(fēng)電的公司也進(jìn)行合作,在他們的設(shè)備上安裝監(jiān)控的采集器,采集分類設(shè)備的指標(biāo),并對分類設(shè)備出現(xiàn)的故障進(jìn)行預(yù)測,這會(huì)大大降低公司的成本。”劉煬說。
據(jù)了解,2015產(chǎn)業(yè)互聯(lián)網(wǎng)大會(huì)由中國互聯(lián)網(wǎng)協(xié)會(huì)、中國新聞社主辦,中國新聞社浙江分社承辦。本次大會(huì)以“大智移云,產(chǎn)業(yè)互聯(lián)”為主題,以“互聯(lián) 網(wǎng)+制造”為核心,探討傳統(tǒng)產(chǎn)業(yè)在信息化互聯(lián)網(wǎng)時(shí)代的發(fā)展,交流在云計(jì)算大數(shù)據(jù)方面的新應(yīng)用。國內(nèi)領(lǐng)先的IT基礎(chǔ)架構(gòu)供應(yīng)商華三通信為大會(huì)提供網(wǎng)絡(luò)支 持。
大會(huì)是世界產(chǎn)業(yè)互聯(lián)網(wǎng)第一陣營中美德日的高峰對話:中國互聯(lián)網(wǎng)之母、原中科院副院長胡啟恒、美國工業(yè)互聯(lián)網(wǎng)聯(lián)盟理事長理查德博士、德國聯(lián)邦投資貿(mào)易 署駐華代表schoo、德國弗勞恩霍夫研究院智能無線研發(fā)首席科學(xué)家DirkReichelt博士現(xiàn)身杭州論劍。同時(shí),微軟、GE、IBM、因特爾、西門子、寶馬、松下、阿里巴巴、華三、海爾、華為等名企高級負(fù)責(zé)人也均赴會(huì)。大會(huì)還發(fā)起在浙江杭州成立中美產(chǎn)業(yè)互聯(lián)網(wǎng)聯(lián)合實(shí)驗(yàn)室,旨在加強(qiáng)中美在產(chǎn)業(yè)互聯(lián)網(wǎng)領(lǐng) 域交流與合作。(完)
官方微博
官方微信公眾號(hào)
官方百家號(hào)