熱門文章
信息流的未來與人工智能的機會
發(fā)布時間:2019-07-26 分類:趨勢研究
在當今社會,尤其是融合了社交內(nèi)容的移動互聯(lián)網(wǎng)時代,如何更好地連接人與信息,已成為人類社會的一個重要基礎(chǔ)命題。個性化的信息流已經(jīng)成為一種新的連接方式,人與信息、萬物互聯(lián)。
那么,在信息流產(chǎn)品平臺與服務這個領(lǐng)域里,如何高效地處理、分析、挖掘、理解和組織海量文字、圖片(視頻),更好地連接人與信息呢?并根據(jù)對用戶的深度理解,來進行信息的智能推送呢?無疑,人工智能具有巨大的潛力。從內(nèi)容創(chuàng)作、過濾、分發(fā)、消費以及互動的每個環(huán)節(jié),我們都可以使用大規(guī)模機器學習,包括文本分析、自然語言理解、計算機視覺和數(shù)據(jù)挖掘等技術(shù),向用戶進行智能推送。同時,我們還可以基于信息流豐富多樣的應用場景和用戶,持續(xù)累積大量的訓練樣本和數(shù)據(jù),讓機器學習系統(tǒng)形成閉環(huán),不斷地改善和進化,在機器人輔助內(nèi)容創(chuàng)作、自動視頻分析與理解,個性化推薦和問答等方面發(fā)展人工智能核心技術(shù)。本文將分享筆者對人工智能發(fā)展前景的一些看法,包括人工智能的本質(zhì)、近幾年重要的技術(shù)發(fā)展,以及企業(yè)應該如何建立人工智能的核心戰(zhàn)略競爭力。
連接人與信息:從結(jié)繩記事到超級智能
自古以來,人類社會一個最重要的基礎(chǔ)需求,就是人與信息的連接。最早的信息傳遞用的是“結(jié)繩記事”技術(shù)。那時候還沒有語言,有大的事情就結(jié)一個大的結(jié),小的事情就結(jié)一個小的結(jié)。公元100年左右,蔡倫發(fā)明了紙,后來有了書。11世紀40年代,畢昇發(fā)明了活字印刷術(shù),為印書提供了便利,讓書實現(xiàn)了比較廣泛的傳播。在很長一段時間內(nèi),書和紙是人類社會傳播信息的主要工具。20世紀90年代,數(shù)字圖書館出現(xiàn),美國開始把全國的圖書數(shù)字化,開始出現(xiàn)搜索、管理、影像分析等。在互聯(lián)網(wǎng)時代,網(wǎng)站成為紙張之外的另一個主要信息來源。但人只能定點于個人電腦(PC)上。雖然有了搜索引擎和相對應的廣告引擎,但大部分搜索還受限于它的不能移動性。當我們走路或者外出時,往往還會隨身攜帶雜志或報紙。
最近十年,移動互聯(lián)網(wǎng)與智能手機不再受限于固定的地理位置,這讓紙制印刷品進一步減少。尤其在近幾年,這一趨勢明顯,很多傳統(tǒng)媒體、傳統(tǒng)出版社都轉(zhuǎn)型為網(wǎng)絡(luò)媒體。
在PC互聯(lián)網(wǎng)時代,搜索引擎可以借著爬蟲軟件在網(wǎng)頁上抓取信息,但到了移動互聯(lián)網(wǎng)時代,很多信息都藏在應用里面,雖然不能利用搜索引擎將每個App里的信息輕松“爬出”,但是在這股潮流中涌現(xiàn)出一些新的應用,讓我們能夠重新定義信息的源頭。例如今日頭條有“頭條號”。我們可以與很多信息供應商、內(nèi)容提供商、媒體創(chuàng)作者一起來構(gòu)建新的內(nèi)容平臺和生態(tài)系統(tǒng)。以前我們需要做很多信息抽取的工作,現(xiàn)在可以直接拿到結(jié)構(gòu)化的數(shù)據(jù)。
到了今天,更多的公司開始大規(guī)模使用人工智能做個性化推薦。因為人們使用智能手機有了很多碎片化時間,產(chǎn)生了學習、娛樂等需求。這些需求也產(chǎn)生了各式各樣的應用場景。我們發(fā)現(xiàn),在推薦引擎領(lǐng)域有了一個將人與信息相連接的新機會。搜索引擎里所有的排序算法、內(nèi)容分析等技術(shù),都可用于進一步的個性化精準推薦,從而變成信息流?!靶畔⒘鳌笔且环N新的、更智能的方式,讓人能夠隨時隨地在需要時得到所需要的信息。人工智能不但能夠做個性化推薦,還能夠不受地域限制享受服務。我們的目標就是——用無所不在的超級機器智能幫助人類創(chuàng)作、發(fā)現(xiàn)、使用、分發(fā)信息,并進行社交場景的互動。
隨著技術(shù)的進一步發(fā)展,會出現(xiàn)超級智能,人工智能與人可以互相幫助,從而讓彼此變得更聰明。人工智能需要很多標注數(shù)據(jù)和訓練樣本,在信息流的場景,人們有更多機會拿到更多標注數(shù)據(jù)以及更細顆粒度的標注,來幫助人們做自然語言理解、自然語言生成、圖像視頻理解和圖像視頻生成。人將與人工智能進一步共同進化。這是一個非常值得期待的未來。
人工智能的本質(zhì)是軟件產(chǎn)業(yè)革命
在過去五年,人工智能快速發(fā)展。之前,人工智能雖然有機器學習,但往往受限于傳統(tǒng)思維?,F(xiàn)在,研究人員不再受限過去20年的經(jīng)驗和成就,而是更大膽地開始創(chuàng)新。
今天人工智能的本質(zhì)其實是軟件產(chǎn)業(yè)的革命。軟件正在改變?nèi)澜?Software is eating the world),而軟件產(chǎn)業(yè)本身正在被人工智能的發(fā)展所顛覆。越來越多的軟件開發(fā)不再只是依靠軟件工程師的想法、邏輯和認知,而這些軟件的核心已變成非常大的模型,有上千億的參數(shù),有各式各樣的大數(shù)據(jù)。通過訓練各種各樣的模型,包含統(tǒng)計模型、符號、邏輯、知識表達,軟件產(chǎn)業(yè)已被人工智能化。
今天,視頻、圖像、文字都已經(jīng)被數(shù)字化,下一個階段就是語義化,比如圖像理解。在數(shù)字原始表達空間,計算機很難做語義理解,我們需要深度學習模型來學習非線性的轉(zhuǎn)化。機器跟人的思維方式不一樣,機器算得快,任何問題只要能表達,使用加減乘除就能完成得很好。今天的人工智能的本質(zhì)其實是軟件產(chǎn)業(yè)的革命,借由大數(shù)據(jù)、大計算和機器學習來訓練大模型,“編寫”越來越智能的軟件。
從數(shù)據(jù)學習機器能理解的語義表達
我們已經(jīng)到了這樣一個時代,有了更好的技術(shù),能夠直接從數(shù)據(jù)中學習機器能理解的表達方式。使用深層神經(jīng)網(wǎng)絡(luò)從數(shù)據(jù)本身直接學習機器能夠“理解”的語義表達空間。輸入是原始的數(shù)據(jù)空間,是信息化和數(shù)字化之后的結(jié)果,例如數(shù)字圖片和它的語義標注,在輸入的數(shù)字化原始數(shù)據(jù)空間里,它們的向量表達和分布一般是非常復雜的。
但借由深度學習,我們可以學到所需要的非線性轉(zhuǎn)換函數(shù)來把它們變換或映射到一個機器能理解的新的語義表達空間里。在這個新的空間里,機器能借著計算來處理許多需要人類智能的復雜工作。數(shù)據(jù)量越大,學習出來的表達方式越好,從而帶來更高的識別精度。這將構(gòu)成一個正向循環(huán)。
我們希望能訓練更大、更深的網(wǎng)絡(luò)。但這也帶來一定的挑戰(zhàn),因為需要更大的數(shù)據(jù)和更大的計算平臺,這也讓分布式機器學習的平臺變得非常重要。盡管今天的大部分應用還依賴于監(jiān)督學習,但是也還有很多研究,比如對抗學習(GAN),是生成模型與辨別模型互相對抗,在博弈論的框架里面彼此學習。這就好像訓練兩個模型,一個是學生模型,一個是教練模型,教練不斷出更好、更難的題目來測試學生,學生也借由這些更難的題目被訓練得更好。學生的進步又使得教練必須不斷加強他的能力。
例如,一個花樣滑冰選手在大部分的場景都跳得很好,但是三周跳需要改善動作,教練就需要有好的生成模型來產(chǎn)生更多的這方面的訓練樣本。學生在進行大量的針對性的訓練之后,才能不斷進步。另外,非監(jiān)督學習、弱監(jiān)督學習,還有人機互動學習也是一個很重要的新方向。