深度學(xué)習(xí)幫助空氣質(zhì)量預(yù)報(bào)更準(zhǔn)確
在圍棋人機(jī)大戰(zhàn)中,AlphaGo憑什么以4:1戰(zhàn)勝九段棋手李世石?
答案是AlphaGo通過(guò)深度學(xué)習(xí),以一種偶然的方式必然地贏得了人機(jī)大戰(zhàn)。
癌癥、氣候變遷、能源、基因組學(xué)、宏觀經(jīng)濟(jì)學(xué)、金融系統(tǒng)、物理學(xué)等,太多我們想掌握的系統(tǒng)知識(shí)正變得極其復(fù)雜。如此巨大的信息量讓最聰明的人窮極一生也無(wú)法完全掌握。那么,我們?nèi)绾尾拍軓娜绱她嫶蟮臄?shù)據(jù)量中篩選出正確的見解呢?而一種通用人工智能思維的方式則是自動(dòng)將非結(jié)構(gòu)化信息轉(zhuǎn)換為可使用知識(shí)的過(guò)程。我們所研究的東西可能是針對(duì)任何問(wèn)題的元解決方法。
——人工智能公司DeepMind
聯(lián)合創(chuàng)始人德米斯·哈薩比斯
?深度學(xué)習(xí)究竟是“何方神圣”?
“人機(jī)大戰(zhàn)”使深度學(xué)習(xí)這一2006年就提出的概念迅速席卷各大網(wǎng)絡(luò)平臺(tái)。
深度學(xué)習(xí)是機(jī)器學(xué)習(xí)的一種。機(jī)器學(xué)習(xí)是通過(guò)算法,使得機(jī)器能從大量歷史數(shù)據(jù)中學(xué)習(xí)規(guī)律,從而對(duì)新的樣本做智能識(shí)別或?qū)ξ磥?lái)進(jìn)行預(yù)測(cè)。深度學(xué)習(xí)就是構(gòu)建具有很多隱層的機(jī)器學(xué)習(xí)模型,而隱層模型的關(guān)鍵在于,可以建立像人腦一樣分析學(xué)習(xí)的深度神經(jīng)網(wǎng)絡(luò)。
IBM中國(guó)研究院能源與環(huán)境資深總監(jiān)尹文君解釋說(shuō),比如,把一張小女孩牽著狗的圖片輸入計(jì)算機(jī)中,以前機(jī)器學(xué)習(xí)沒有人和狗誰(shuí)重要誰(shuí)不重要的概念,圖片就是像素的矩陣,但這些描述的意義并不大。機(jī)器經(jīng)過(guò)深度學(xué)習(xí)后,可以像人一樣思考,分析圖像中的物體、明暗變化、界限等,自動(dòng)提取圖片有效信息,從而描述出小女孩牽著狗的近景照片這樣有特征的信息。
?深度學(xué)習(xí)為何在大數(shù)據(jù)時(shí)代備受青睞?
十年前的概念緣何在近幾年迅速躥紅,尹文君解釋說(shuō),深度學(xué)習(xí)的“火爆”與大數(shù)據(jù)發(fā)展密不可分。
深度學(xué)習(xí)首先需要海量數(shù)據(jù)作為支撐。上世紀(jì)80年代到90年代,由于沒有太多的數(shù)字信息可用,計(jì)算機(jī)要花費(fèi)很長(zhǎng)的時(shí)間確定有哪些信息。如今隨著大數(shù)據(jù)時(shí)代的到來(lái),深度學(xué)習(xí)的優(yōu)勢(shì)凸顯。深度學(xué)習(xí)需要依靠大量的數(shù)據(jù)進(jìn)行訓(xùn)練,以提高預(yù)測(cè)的準(zhǔn)確性。
而大數(shù)據(jù)時(shí)代也迫切需要深度學(xué)習(xí)。海量數(shù)據(jù)的涌入,人處理信息已經(jīng)心有余而力不足,深度學(xué)習(xí)則有其他算法無(wú)法比擬的優(yōu)勢(shì),能挖掘大數(shù)據(jù)背后更多隱含的意義和信息。
以往,算法處理的都是結(jié)構(gòu)化的數(shù)據(jù),很難識(shí)別空間、視頻、圖像等多維度的、非結(jié)構(gòu)化的數(shù)據(jù),而深度學(xué)習(xí)則在圖像、在語(yǔ)音識(shí)別、自然語(yǔ)言理解、機(jī)器人、自動(dòng)駕駛等領(lǐng)域有持續(xù)突破性進(jìn)展,也推動(dòng)了“大數(shù)據(jù)+深度模型”時(shí)代的來(lái)臨。
據(jù)尹文君介紹,深度學(xué)習(xí)在圖像識(shí)別領(lǐng)域,性能比以往算法提高了20%~30%,識(shí)別率在某些領(lǐng)域已經(jīng)超過(guò)了人類。
?深度學(xué)習(xí)能解決哪些環(huán)保問(wèn)題?
在生態(tài)環(huán)境大數(shù)據(jù)建設(shè)步伐日益加快的今天,深度學(xué)習(xí)究竟能幫上什么忙?哈薩比斯在建造AlphaGo的時(shí)候,就已經(jīng)計(jì)劃它能夠應(yīng)用于解決現(xiàn)實(shí)世界的問(wèn)題,比如建立氣候模型或者進(jìn)行疾病分析。
尹文君所在的能源與環(huán)境開發(fā)團(tuán)隊(duì)就正在探索使用深度學(xué)習(xí)的方法進(jìn)行空氣質(zhì)量的預(yù)測(cè)和污染源追溯。從深度學(xué)習(xí)擅長(zhǎng)處理的數(shù)據(jù)來(lái)看,深度學(xué)習(xí)首先會(huì)在衛(wèi)星遙感數(shù)據(jù)上有所運(yùn)用,可以通過(guò)數(shù)據(jù)識(shí)別和判斷污染源和污染的分布狀況,并同時(shí)結(jié)合地面監(jiān)測(cè)數(shù)據(jù),得到一張精確的全國(guó)污染分布狀況圖,并實(shí)現(xiàn)動(dòng)態(tài)更新,實(shí)時(shí)服務(wù)于環(huán)境管理。
針對(duì)目前火爆的空氣質(zhì)量預(yù)測(cè)預(yù)警市場(chǎng),深度學(xué)習(xí)也“表現(xiàn)突出”。目前空氣質(zhì)量預(yù)警預(yù)報(bào)多采用傳統(tǒng)的數(shù)值模型方式,僅靠有限站點(diǎn)的空氣質(zhì)量監(jiān)測(cè)數(shù)據(jù)、污染源數(shù)據(jù)和氣象數(shù)據(jù)進(jìn)行預(yù)測(cè),但由于點(diǎn)位的覆蓋不夠全,加之沒有考慮周邊環(huán)境的影響,空氣質(zhì)量預(yù)測(cè)預(yù)警準(zhǔn)確性大打折扣。深度學(xué)習(xí)擅長(zhǎng)多維度數(shù)據(jù)的處理,如果一個(gè)分析對(duì)象可以作為一個(gè)場(chǎng),深度學(xué)習(xí)可以對(duì)地面觀測(cè)場(chǎng)、氣象場(chǎng)的各類氣象要素及模型參數(shù)分別進(jìn)行學(xué)習(xí),對(duì)未來(lái)的空氣質(zhì)量進(jìn)行精細(xì)化預(yù)測(cè),可以大大提升預(yù)測(cè)準(zhǔn)確率。
“IBM的認(rèn)知計(jì)算建模技術(shù)通過(guò)將物理、化學(xué)、統(tǒng)計(jì)、專家系統(tǒng)等多模型與深度學(xué)習(xí)進(jìn)行融合,空氣質(zhì)量預(yù)測(cè)預(yù)警準(zhǔn)確率提高20%。”正在從事空氣質(zhì)量預(yù)報(bào)預(yù)警研究的IBM中國(guó)研究院研發(fā)經(jīng)理呂新杰表示。
目前,深度學(xué)習(xí)基本可以模擬不同減排手段產(chǎn)生的減排效果,未來(lái),深度學(xué)習(xí)還可以根據(jù)減排要求,提出減排措施,比如總量減排要總體降低10%,某地應(yīng)該采取何種減排措施。但尹文君表示,后者需要更完善的基礎(chǔ)和更強(qiáng)大的運(yùn)算資源。
谷歌工程師曾表示,人工智能的下一個(gè)里程碑就是自然語(yǔ)言理解,包括更好地理解書寫文字以及搜索查詢的功能。這也為環(huán)保部門使用社交數(shù)據(jù)提供了新的工具和手段。據(jù)了解,IBM目前已經(jīng)在嘗試?yán)蒙疃葘W(xué)習(xí)分析互聯(lián)網(wǎng)及社交媒體數(shù)據(jù),進(jìn)行污染源的交叉驗(yàn)證,以實(shí)現(xiàn)污染源的動(dòng)態(tài)精準(zhǔn)識(shí)別。
對(duì)深度學(xué)習(xí)來(lái)說(shuō),不僅要有大量的數(shù)據(jù)積累做基礎(chǔ),還要有均勻、穩(wěn)定、連貫的數(shù)據(jù)來(lái)支撐。
尹文君表示,目前環(huán)保部門雖然已經(jīng)集成了一些數(shù)據(jù),污染源數(shù)據(jù)、氣象數(shù)據(jù)、超級(jí)站的數(shù)據(jù)都比較豐富,但數(shù)據(jù)質(zhì)量和共享機(jī)制有待提高。深度學(xué)習(xí)要更好地應(yīng)用到生態(tài)環(huán)境大數(shù)據(jù)建設(shè)中來(lái),實(shí)現(xiàn)精準(zhǔn)的預(yù)測(cè),就需要環(huán)保部門保障數(shù)據(jù)積累、做好數(shù)據(jù)共享,讓深度學(xué)習(xí)在環(huán)保領(lǐng)域一展身手。
■相關(guān)閱讀
深度學(xué)習(xí)發(fā)展史
2006年,加拿大多倫多大學(xué)教授、機(jī)器學(xué)習(xí)領(lǐng)域泰斗——GeoffreyHinton和他的學(xué)生在頂尖學(xué)術(shù)刊物《科學(xué)》上發(fā)表了一篇具有里程碑意義的文章,重新審視深度學(xué)習(xí)方法,將深度學(xué)習(xí)的性能提上一個(gè)新臺(tái)階。
2009年,辛頓小組獲得了意外的成功,他們的深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)在語(yǔ)音識(shí)別應(yīng)用中取得巨大突破,轉(zhuǎn)換精度突破世界紀(jì)錄,錯(cuò)誤率比以前減少了25%。有評(píng)論說(shuō),辛頓小組的研究讓語(yǔ)音識(shí)別領(lǐng)域縮短了至少10年的時(shí)間,他們的突破也吸引了各大公司的注意,蘋果公司把研究成果應(yīng)用到了Siri語(yǔ)音識(shí)別系統(tǒng)上。從此,深度學(xué)習(xí)便一發(fā)不可收拾。
2010年,美國(guó)國(guó)防部DARPA計(jì)劃首次資助深度學(xué)習(xí)項(xiàng)目,參與方有斯坦福大學(xué)、紐約大學(xué)和NEC美國(guó)研究院。
2011年,谷歌X實(shí)驗(yàn)室的研究人員從YouTube視頻中抽取了1000萬(wàn)張靜態(tài)圖片,把它“喂”給谷歌大腦,在這些圖片中尋找重復(fù)出現(xiàn)的模式。谷歌大腦就是一個(gè)采用了深度學(xué)習(xí)技術(shù)的大型神經(jīng)網(wǎng)絡(luò)模型,由1000臺(tái)電腦組成。三天后,谷歌大腦在沒有人類幫助的情況下,從這些圖片中發(fā)現(xiàn)了貓。這件事在人工智能界引起很大的轟動(dòng),被認(rèn)為是深度學(xué)習(xí)復(fù)興的里程碑。
2012年,深度學(xué)習(xí)技術(shù)在圖像識(shí)別領(lǐng)域取得驚人的成果,在ImageNet評(píng)測(cè)上將錯(cuò)誤率從26%降低到15%。同年,制藥公司將深度神經(jīng)網(wǎng)絡(luò)應(yīng)用于藥物活性預(yù)測(cè)取得世界范圍內(nèi)的最好結(jié)果,2013年4月,麻省理工學(xué)院《技術(shù)評(píng)論》雜志將深度學(xué)習(xí)列為2013年十大突破性技術(shù)之首。
如今,神經(jīng)網(wǎng)絡(luò)研究如日中天,由于擅長(zhǎng)處理語(yǔ)音、視覺以及其他復(fù)雜的人機(jī)交互,可以識(shí)別患有自閉癥風(fēng)險(xiǎn)的基因,可以為圖片和視頻自動(dòng)添加標(biāo)題,可以用于制造無(wú)人駕駛汽車和機(jī)器人。神經(jīng)網(wǎng)絡(luò)已經(jīng)被谷歌、Facebook、微軟、百度等技術(shù)先驅(qū)欣然采納。
但深度學(xué)習(xí)也不是萬(wàn)能的。人工智能包括3個(gè)方面,第一是感知,就是知道周圍環(huán)境怎么樣,知道與對(duì)方交互時(shí)對(duì)方在說(shuō)什么,表達(dá)什么意思。第二是認(rèn)知,也就是說(shuō)在感知的基礎(chǔ)上進(jìn)行理解。比如機(jī)器已經(jīng)能識(shí)別人類的語(yǔ)言,但是聽不懂其中的意思。第三是決策,就是根據(jù)理解所作出的行動(dòng)。
目前,感知和決策智能已經(jīng)取得巨大進(jìn)步,甚至在某些方面已經(jīng)超過(guò)人類,但是在認(rèn)知方面還有很多差距,機(jī)器依然聽不懂人的意思。
![使用微信“掃一掃”功能添加“谷騰環(huán)保網(wǎng)”](http://www.m.tanger168.cn/gtech_pic/images/images/qrcode_for_gh_7f21ccef0be4_430.jpg)
使用微信“掃一掃”功能添加“谷騰環(huán)保網(wǎng)”