第27章 選擇和未來
10月8號(hào),禮拜一上午九點(diǎn),中海理工大綜合實(shí)驗(yàn)大樓自然語言識(shí)別研究所。 和煦的陽光穿過紗窗照射在檀木色辦公桌說,留下一塊塊明暗交替的光斑,戴著老花鏡的唐天華教授正手持鋼筆修改材料。 就在這時(shí),辦公室門被人“咚咚咚”的敲響了。 “進(jìn)來?!?/br> 門“咔噠”一聲被人從外面擰開,唐教授下意識(shí)看過去,等見到進(jìn)來的人后,那張不茍言笑的臉上卻是露出了笑容。 進(jìn)來的人自然便是陳序了,走到辦公桌前面有些局促的喊道:“老師好!” 唐教授笑著伸手示意了一下說:“坐下說?!?/br> 陳序走到墻根便的實(shí)木椅旁坐下。 唐教授挪動(dòng)了一下身體,靠在椅背上慈眉善目的笑問道:“怎么樣,有沒有決定好研究方向?” 說實(shí)話,唐教授也對(duì)陳序的功課進(jìn)行了一番了解,在看到那些連優(yōu)秀都稱不上的成績單時(shí),心里是有些動(dòng)搖的,想著是不是再觀察觀察? 不過那篇讓他為之驚艷的論文時(shí),所有疑慮都打消了。 這是一個(gè)在自然語言處理方面非常有天賦的年輕人,他打算好好培養(yǎng)一番。 陳序撓撓頭說:“呃……詞法與句法分析。” 聽到陳序的選擇,唐教授皺了皺眉頭。 從那篇《自然語言處理的前瞻》里就能看出來,這是一個(gè)有著勃勃野心的年輕人,他想挑戰(zhàn)當(dāng)今世界自然語言處理中最核心的難題也在情理之中。 不過嘛…… 唐教授說:“你要想清楚了,一旦選錯(cuò)方向,可能會(huì)走上很多彎路,浪費(fèi)時(shí)間浪費(fèi)精力,你確定要選擇詞法與句法分析?” 面前唐教授勸解的話語,陳序堅(jiān)定的點(diǎn)點(diǎn)頭,“我確定?!?/br> 燕京hd區(qū)中關(guān)村科學(xué)院南路6號(hào),這里是“中國計(jì)算機(jī)協(xié)會(huì)”的總部,同時(shí)也是國內(nèi)最頂尖的計(jì)算機(jī)期刊《計(jì)算機(jī)科學(xué)技術(shù)學(xué)報(bào)》、英文名jcst的辦公地點(diǎn)。 上午9點(diǎn),劉成林教授來到協(xié)會(huì)處理一些公務(wù)。 劉成林不僅是中國計(jì)算機(jī)協(xié)會(huì)的副會(huì)長、jsct國內(nèi)總負(fù)責(zé)人、國內(nèi)語音識(shí)別方面的權(quán)威教授,同時(shí)也是青木大學(xué)的博導(dǎo)。 10點(diǎn)半,劉成林在處理完國慶期間積壓下來的公務(wù)后,來到自己辦公室稍作休息,等下便準(zhǔn)備下樓吃午飯。 走到辦公桌前瞄了眼案頭,果然又是厚厚一摞的論文稿子。 對(duì)此劉成林已經(jīng)習(xí)慣了。 現(xiàn)在人工智能是計(jì)算機(jī)熱門專業(yè),而語音識(shí)別又是熱門里的熱門,全國那么多高校,可以想象從事相關(guān)方面研究的人何其多? 他作為這方面的權(quán)威專家教授,每天要收到很多幫忙審稿的請(qǐng)托。都是一些學(xué)術(shù)界同仁好友的學(xué)生后輩之類的。 趁著吃午飯前的片刻功夫,劉成林想看看這些論文里有沒有什么新穎的思路。 拿起第一份,題目是《developmentofmulti-personspeechreitionsoftwareformobilephonebasedonandroidsystem(基于android系統(tǒng)的手機(jī)多人語音識(shí)別軟件開發(fā))》。 翻開隨便看了看,沒有新意,沒有亮點(diǎn),對(duì)現(xiàn)有語音識(shí)別技術(shù)的提升沒有任何幫助,唯一值得肯定的就是還算嚴(yán)密的算法結(jié)構(gòu)。 劉成林搖搖頭,把這篇論文放到了一邊,拿起下一本,《speechreitionbasedondeeplearninganditsapplication(基于深度學(xué)習(xí)的語音識(shí)別及其應(yīng)用研究)》 順手翻開看了看,還不如上一篇呢,都是一些炒冷飯的東西,甚至連語言表述都有些顛三倒四,不知道這樣的論文怎么就敢拿給他審閱的。 “這都是些什么人??!”劉成林有些生氣,順手把論文扔到辦公桌上。 想了想他又拿起論文看了看第二作者,發(fā)現(xiàn)是在一個(gè)國際學(xué)術(shù)會(huì)議上認(rèn)識(shí)的國內(nèi)某二流大學(xué)教授。 劉成林搖搖頭,拿起紅筆在論文上面畫了個(gè)x,然后又在x外面畫了個(gè)圈,表示退稿并且不再接收。 平息了一下心情,劉成林伸手從案頭上又拿了份論文。 讓他沒想到的是,這份論文竟然非常厚,粗略估測起碼有一百頁。 “嚯~好家伙?!眲⒊闪滞衅鹫撐臏惖窖矍翱戳丝搭}目,終于不再是“基于某某某”了,而是《自然語言處理的前瞻》。 “喲,口氣不小嘛!” 看到這個(gè)題目,劉成林和唐天華的反應(yīng)差不多,第一時(shí)間就想笑,再加上這么厚厚一摞,他懷疑這個(gè)作者怕不是把論文當(dāng)小說寫了吧。 看了眼論文題目后面的作者名,第一作者不認(rèn)識(shí),第二作者名字叫唐天華。 劉成林楞了一下才想起來唐天華是誰。 雙方是在國內(nèi)的一次專家會(huì)議上認(rèn)識(shí)的,印象中這個(gè)唐天華在語言識(shí)別方面頗有建樹,算是少見的實(shí)干型人才。 不過對(duì)唐天華的好印象,并不能改變劉成林連翻開論文看一眼的欲望都沒有的心情。 勉強(qiáng)翻開第一頁。 【摘要:在確定國際自然語言處理領(lǐng)域使用頻率最高的97個(gè)關(guān)鍵詞的基礎(chǔ)上,運(yùn)用共詞分析法,以spss數(shù)據(jù)分析軟件為工具,通過因子分析和聚類分析的方法,并借鑒最新研究成果,探討國際自然語言處理現(xiàn)狀以及未來發(fā)展】 四平八穩(wěn)的開頭雖然沒有讓劉成林有眼前一亮的感覺,但也對(duì)對(duì)方接下來的所要論述的內(nèi)容產(chǎn)生的好奇感,想看看對(duì)方到底怎么“編”? 不過劉成林的想法很快便消失了。 這個(gè)論文作者不僅沒有“編”,而且一切都在用國際最權(quán)威的數(shù)據(jù)說話。 從自然語言處理中的最基本也是最重要的詞法、語法、語義開始說起,層層推進(jìn),步步為營,用最簡單、最樸實(shí)無華的語句來告訴讀者,什么是詞法、語法、語義分析? 現(xiàn)在國際最頂級(jí)的大咖研究到了哪里? 他們遇到了哪些問題? 如果你要從事這方面的研究,你應(yīng)該從何入手? 看完第一段之后,劉成林有些驚嘆。 這個(gè)作者的論文思路清晰、語句通順、層次分明,觀點(diǎn)表達(dá)精確,敘述風(fēng)格已經(jīng)到了返璞歸真的地步了,他已經(jīng)很久很久沒有看到過這樣精彩的科普性論文了。 更重要的是,對(duì)方在自然語言處理方面,有著扎實(shí)的基礎(chǔ),這是一般人做不到的。 劉成林忍不住合起論文看了眼名字:陳序。 然后劉成林翻開論文繼續(xù)朝下面看…… …… 從綜合實(shí)驗(yàn)大樓回來后,陳序便忙碌了起來。 把市面上有關(guān)于詞法、語法、語義分析方面書籍統(tǒng)統(tǒng)收集回來,然后逐一錄入到小白的資料庫當(dāng)中。 小白是強(qiáng)大,不需要告訴它什么是分詞,詞性,詞的顆粒度,詞所在語句的位置,同義詞,轉(zhuǎn)意詞等等等等。 但是,未來基于自然語言處理開發(fā)出來的翻譯軟件機(jī)器,那是要投入到商業(yè)應(yīng)用當(dāng)中去的,不可能讓小白充當(dāng)智腦來翻譯,這也不現(xiàn)實(shí)。 所以還是要攻克自然語言處理當(dāng)中的難題。 比如,怎么樣才能讓機(jī)器理解人類基于情感式的、模糊的語義表達(dá)? 這需要小白在當(dāng)今自然語言處理的研究基礎(chǔ)上,不停的進(jìn)行推演,破解掉詞法、語法、語義分析的終極密碼。 到時(shí)候再進(jìn)行句法分析、篇章分析、建立語言認(rèn)知模型等等,會(huì)易如反掌,整個(gè)自然語言處理中的難題會(huì)如同多米諾骨牌一樣轟然倒地。 而他作為小白的“人生導(dǎo)師”,需要引領(lǐng)小白朝某這個(gè)方向努力前進(jìn),就像之前不停地填充寫作素材庫一樣。 另外,未來軟件開發(fā)出來,他要作為“開發(fā)者”和來自世界各地的專家學(xué)者進(jìn)行交流的,如果連技術(shù)的基本原理都不懂,那也太不像話了。 所以在小白學(xué)習(xí)的同時(shí),陳序也從人工智能方面的科普性書籍讀起,目的是為了幫助小白更好的成長……