研究中文手寫識別技術,得進行大容量數據積累,需要搜集至少幾千人的筆跡,而每個人得把國標GB 2312標準一二級共6763個漢字挨個手寫一遍,如果要求再高一點,則是要寫全部的21000個漢字甚至更多字符。將這些手寫設備上書寫時產生的有序軌跡信息化,可轉化為文字內碼,這就是手寫識別的過程。
上世紀90年代初,手寫識別的一些實驗數據是需要一條條記錄在紙上,然后再人工進行仔細分析比對。如此繁瑣的工作,手寫識別技術奠基人、捷通華聲手寫識別技術首席科學家、北京大學教授顧小鳳先生就曾經不厭其煩地親自操作,而不是完全派給他的學生去做。
2013年11月10日,顧小鳳先生永遠的離開了我們,而他的手寫識別技術夢想卻未曾停留。從北京大學計算機科學技術研究所離休后,顧小鳳先生應邀成為捷通華聲手寫識別技術的首席科學家,再后來,顧先生的得意弟子李健也在他的極力促成下,最終從英特爾中國研究中心來到捷通華聲擔任手寫識別技術負責人。從北大到捷通華聲,這似乎是一場手寫識別人才和技術的雙重接力。
“顧先生是中國手寫識別技術的奠基人,他和我的私人感情非常好。”向來直來直去的捷通華聲董事長張連毅特別地強調。從一張幾年前顧先生攜夫人出席捷通華聲年會的照片,看到了他們與張連毅在一張桌子上親切交流的溫情畫面。
“顧老師門下的10 位學生雖然不是同一屆(1986-1995級),但關系都特別好,我們就像一家人,這應該源于顧老師給大家平時創造的融洽氛圍。以前每到過年、過節或顧老師的生日,我們都要聚一聚。”捷通華聲CTO李健說到。
“在進行研發工作過程中一定切記要尊重常識,對于和常識相悖的情況就值得懷疑;要經常梳理工作和思路,一個行之有效的方式就是表達。”顧小鳳先生曾經在為捷通華聲做的一個講座中向大家傳授方法。
憶顧小鳳
聽張連毅談顧小鳳先生,就如同在談一位父親、一位老師、一位摯友。
初識顧小鳳,也是慕名而去,“早在1992年,我在清華大學推廣OCR的時候,我就知道北大有位研究手寫識別技術的教授。”張連毅不無感激地說,“2001年,在有很多人請求他‘出山’的情況下,顧先生選擇扶持捷通華聲,是看重捷通華聲對于手寫識別技術發展的執著與對技術的尊重,也是歸因于顧先生對于手寫識別技術的熱愛和期待,期待能夠將手寫識別技術‘發揚光大’。”
人們常說,困難之中見真情,也有另外一種解釋是,困難之中見品格。“顧先生就是這樣一個人,當你順利前行的時候,他會往后躲,‘這都是別人的功勞’;當你最困難時,平時文文弱弱的他似乎一下子充滿無限力量,‘有我在’。”張連毅回憶著,“2001年,我們在申請一個項目時遇到了點兒困難,顧先生老師挺身而出,跟著我東奔西忙,跑相關部門去說明一些情況,最終順利拿下這個項目。”
多年來,顧小鳳先生一直在以他的方式默默地支持著、鼓勵著捷通華聲前行,張連毅說:“后來我才慢慢明白,這不僅僅是顧先生對年輕人的扶持和支持,更重要的是他對手寫識別技術在發展寄予了厚望,希望繼續推動中國手寫識別技術的發展。”所以,當捷通華聲有一些進步的時候:“顧先生由衷地為捷通華聲高興的心情,你是能感受得到的。”
私下里,顧小鳳同張連毅的感情也很好,“我女兒的名字就是顧先生起的,名字里最后一個字的筆畫數同她母親姓的筆畫數是相同的,名字拼音的三個首字母又和我的一樣,雖然是一位大科學家,顧先生從來沒有架子,待人接物如沐春風,對待朋友很關心,對朋友的求助更上心!”
顧小鳳先生心地善良,他很愛貓,這些年來,看到所住大院有一些流浪貓,就承擔起照顧這些流浪貓的工作。為了喂養流浪貓,他從來都不在外面過夜,不去旅游,甚至他的女兒邀請去德國“轉轉”都沒去,只因怕那些可憐的貓兒們餓著,“顧師母親切地稱他為‘貓仆’。”
“今年中秋節,公司的幾個同事一起去看顧先生,冥冥之中似乎有種安排,平時都是顧師母拉著我嘮家常,可這回平時不怎么說話的顧先生卻聊了很多,還詢問公司最近怎么樣?技術上有什么新的進步……”張連毅沒想到這卻是最后一別。
“十幾年來,顧先生在我們困難的時候從不不躲閃,在煩惱的時候,先生還不斷地開導或默默分擔,我們有了成績,先生更衷心為我們鼓掌祝賀。顧先生的離開,讓我失去了一位忘年交,內心中也猶如失去了一個支柱,可是,他的寬厚、謙遜、執著、無私的精神鼓勵著我們這一代人繼續前行。”張連毅動情地說。
鮮為人知的光輝歷史
顧小鳳先生已經遠去。他的一生執著于對手寫識別技術的研究,他的一生中,有一段不同尋常的經歷卻鮮為人知。
顧小鳳先生出生于上海一個清貧的知識分子家庭。他從小成績優異,考入江南四大名中之一的上海中學,初中就連續獲得獎學金。
1949年上海剛剛解放時,出于一個進步學生對理想的追求,剛剛初中畢業的顧小鳳毅然參加了解放軍,進入華東軍政大學學習。
畢業后也就是1951年,顧小鳳分配到設在中南海的中央辦公廳機要處工作,曾面見過毛澤東、周恩來等老一輩領導人。在這期間,他曾幾次遠赴朝鮮戰場,執行機要任務;最后一次是和談期間,在板門店附近由李克農領導的我軍情報機構從事通訊工作……出于保密和低調,顧小鳳先生對他早年的革命生涯、光輝經歷很少透露,知道的人非常少。只是在后來長期的交往中,對他的學生偶爾提及,非常淡然。
顧小鳳1957年考入北京大學數學系,從此,再也沒離開過燕園,在美麗的未名湖畔平靜地度過了自己的一生。
手寫識別夢想的傳承
長期以來,顧小鳳先生在教學科研崗位上默默耕耘,教書育人,研究開發。他是中國計算機中文信息處理領域里的先驅者之一,早年與其他同事一起為我國的計算機中文信息處理作出了貢獻。他是“漢字聯機手寫識別”研究的開創者之一,在這個領域做了很多工作,領導了多項國家高科技項目,培養了眾多人才,也幫助了很多同行,堅持不懈推動中國中文手寫識別研究與應用的發展進程。
談到捷通華聲的手寫識別技術,如果追根溯源,至少得細說一下顧小鳳先生的相關研究。上世紀八十年代,顧小鳳先生進入文字識別研究領域,在北大率領課題組開展脫機手寫體漢字識別技術的研究,1990年成果通過當時機電部組織的鑒定,技術水平居國內領先地位。同年顧小鳳先生率領課題組開展聯機手寫體漢字識別技術的研究,此后承擔了863項目“聯機手寫漢字識別技術”的研究,并在后來的評測中獲得好成績。1995年,“聯機手寫漢字識別技術”研制成功并向市場推出了聯機手寫漢字識別產品--方正如意筆,該產品的部分技術在當時居國內領先水平。遺憾的是,聯機手寫識別技術的研究和方正如意筆這款產品由于種種原因,隨著顧小鳳先生的離休而未能繼續,這也成為顧小鳳先生始終留存心底的一個遺憾。
也是緣于對手寫識別技術的深深眷顧,自2001年應邀成為捷通華聲手寫識別技術的首席科學家以來,顧小鳳先生為捷通華聲手寫識別技術的發展傾注大量心血,“捷通華聲靈云手寫識別、OCR等圖像識別技術的發展無一不浸透了顧先生的心血。”
2004年至今,顧小鳳先生的弟子李健帶領捷通華聲技術團隊一直引領并促進中國手寫識別技術的發展與普及。如今,靈云手寫識別技術應用于各行各業、服務億萬大眾,并成為“漢字英雄”等文化綜藝節目的關鍵技術的提供者,為弘揚中華文化、推動中國信息產業智能化做出了巨大的貢獻。
當人們拿著手中的智能手機,一筆一劃地完成書寫時,離不開像顧小鳳先生這樣的老一輩手寫識別技術奠基人的傾心付出,這何嘗不是中國傳統文化的一種傳承?或者,我們能否感覺到一種嚴謹而執著的精神?
靈云手寫識別技術走向世界,服務全球
經過十幾年的發展,隨著智能終端的普及,手寫識別技術也進入了規模應用時代。捷通華聲靈云手寫識別技術在兩代人的共同努力下,已經為各行業軟件與手機、PAD等移動設備廠家所熟悉,為大眾提供了高效、準確、方便的手寫識別服務。
老一輩的學者指引了方向,如何走好這條手寫識別之路該是年輕人為之拼搏的目標。而隨著產業和市場的逐漸成熟,用戶對手寫識別技術的要求宛如芝麻開花節節高。
為了順應廣大用戶的需求,捷通華聲推出的靈云手寫識別技術不僅支持92種語言,行/疊寫支持中、英、日、韓等多國語言,支持中文、英文、字母、數字混合輸入,并且支持50多種筆勢識別,同時,為了滿足用戶對筆跡的不同需求,還提供對鋼筆、鉛筆、毛筆等多種筆形的支持,力求將手寫技術做到技術與藝術、文化的完美結合。當盡善盡美成為一個目標,對于大眾使用者來說該是多么地幸運。
可識別92種語言的靈云手寫識別技術,意味著語言種類覆蓋全球90%以上的人口與地區,已達到了國際最高水平。而92種語言對于中國移動設備企業來講,將為他們開拓國際市場、參與國際競爭提供有利條件。除了在手寫識別領域的專研推廣,捷通華聲靈云同時也推出多語種語音合成技術云服務,二者頗有些齊頭并進之勢。
當我們在生活中享受靈云帶來的輕松與便捷,回首望去,中國智能人機交互(HCI)技術的發展凝結了很多人的夢想和希望,其中尤其離不開像顧小鳳先生這樣老一輩科學家的堅持!一路艱辛走來,承載著眾多夢想的靈云的發展步伐不僅是走得越來越快了,也走得越來越遠了。
我們追尋顧小鳳先生的足跡,穿過烽火連天的歲月,走過燕園,深入捷通華聲,走近他身邊的人,尋覓他的故事,體會他的感受。當我們靜下心來,感悟顧小鳳先生平靜而又非凡的一生,也許會問自己,我們是否堅持過一份夢想,是否堅持過一份責任,是否堅持過一份平淡,是否堅持過一份慈愛與寬容,是否堅持創造一種源自苦澀,但盛開時卻花香萬里的芬芳……
(新聞稿 2013-12-04)