在很多科幻電影中,智能機器人似乎是個永恒不變的話題。從《人工智能》中被輸入情感程序的機器男孩大衛,到《Her》中男主人公愛上了他的智能操作系統,再到《超驗駭客》中逐漸無法被控制的“超驗”機器人開始威脅人類安危,電影題材中到處充滿了智能機器人的身影,人們對機器人的想象已經融入了從生活到生命的方方面面。
人與機器人之間應該如何相處?機器人是否會取代人類的存在?機器人真的能像人類一樣去思考嗎? 27日下午,百度The BIG Talk舉行第五期活動,百度技術副總裁王海峰在現場演講中表示,通過讓機器理解人類的語言、掌握及運用知識、理解不同人,機器會真正學會像人一樣去思考。
值得一提的是,據了解,百度的技術人員正在訓練機器學習圍棋算法,目前已經做到9×9圍棋達到了準職業選手水平,19×19也已達到業余段位棋手水平,這在人工智能領域應用上是一個重大進展。
機器人“思考”的第一步:理解語言
“人區別于其他生物最重要的能力,是思考能力。”王海峰在會上表示,語言是人思維的基本載體,語言本身更是影響著人的思維,“所以要想讓機器人學會像人一樣去思考,第一步就需要讓機器理解人類的語言,進行交互。”
王海峰以在百度搜索中輸入復雜的自然語言query可以直接得到答案為例,搜索“身高180以上的自由泳運動員”,百度將直接為用戶呈現出相關運動員姓名及身高等直接答案。“通過我們的自然語言處理技術對復雜query進行分析,就可以分析出語言的語法及語義,從而可以更準確的理解用戶到底找什么。再從后臺的海量知識庫中檢索出相關知識,就得到了案。”除了能分析句子級的語法語義,百度的自然語言處理技術還可以在段落、篇章、甚至系列文章層次上進行分析理解。
有趣的是,自然語言處理技術還可被運用到多語種之間的翻譯上,也就是機器翻譯技術。百度翻譯產品現在已經覆蓋14個語種,36個翻譯方向。通過網頁搜索、甚至手機直接對話、拍照,就可以立刻得到其它語言的翻譯結果。例如,出國旅游時面對外文菜單,我們只需要用手機對其拍照,百度翻譯就會自動把菜單翻譯成中文的,相當于直接看到了中文菜單。該項技術還被用于創造詩詞上, “比如我們基于語言翻譯技術,開發了一個寫詩的系統。我們將拍好的照片輸入系統,一首詩就自動做出來了。”
讓機器掌握和運用知識
一旦理解了人類語言,對于知識的挖掘、存儲、推理、擴充和聯想就成為機器學習人類思考模式的重要環節。王海峰認為,“如同人類從不同渠道學習知識一樣,機器也可以通過對大量數據的挖掘與推理、計算,形成知識圖譜。”
如今,百度知識圖譜已達到億級別實體數量,百億級別屬性,千億級別關系。在百度搜索搜歷史人物如“張飛”,右側智能推薦即會推薦“趙云、關羽、諸葛亮”等相關人物。而對同一個名字的“李娜”,如果用戶搜索“小威”則右側相關人物就會自然給出網球運動員李娜的結果,而如果搜的是“青藏高原”這首歌,推薦出的則會是歌手李娜。
更進一步:對人的理解
掌握了語言、知識的學習之后,機器向人類邁進的下一步也是更難的一步,王海峰坦言,是對人的理解。
“我們會對用戶進行方方面面的刻畫,可以對全體用戶的行為進行分析,也可以對群體用戶、個體用戶進行建模,進而理解用戶的屬性、狀態、興趣等,也可以理解用戶的情感狀態。”
例如下面這張圖表,就清晰的向我們展示出對用戶分析后,每個地域的人熱衷的菜系。
王海峰認為,將語言、知識及對人的理解結合起來,機器人就將擁有綜合的思考能力。在活動現場的視頻展示中,由百度研發的智能問答機器人“小度”就精彩展現了上述三種能力的綜合實力。它作為世界首個中文智能問答機器人,最擅長的是百科知識類的問答,上知天文、下知地理、影視音樂、無所不知,能夠給出精準答案。
據王海峰介紹,通過深度問答技術,百度可以給出你想要的問題答案。甚至對于不同人會給出不同答案的問題。我們的系統不僅具備了語言交互能力,還可以識別聲音及圖像,這就是我們所說的我們可以做“多通道、多輪對話的智能交互”。再如,我們現在可以非常方便的使用手機通過多輪語音交互預訂機票,而應用的背后承載著百度的智能交互技術,通過對文字及語音的解析和理解,從而調用后臺知識庫里的知識,全自動地完成訂票。應用的后臺具有強大的處理能力,模擬出呼叫中心的業務人員在與用戶交流的場景,而實際上,用戶是一直在與機器進行互動。
綜合實力的深度問答,智能交互和情感分析技術也都被運用在了百度搜索的PC端和移動端,讓搜索以更智能、更知心、更人性化的方式呈現答案,甚至提供服務。
談到計算機領域經典的“圖靈測試”,王海峰表示,這是人工智能的終極目標之一,“隨著語言理解能力越來越強,對知識的掌握和運用的能力越做越好,再結合對人的理解能力,機器就真的可以像人一樣思考了。”
(新聞稿 2014-10-29)