1. 首頁
  2. 人工智慧

人工智慧的瓶頸問題與本體論語義學的回應論文

人工智慧的瓶頸問題與本體論語義學的回應論文

意向性問題曾經是19-20世紀轉折時期最熱門的話題之一。無獨有偶,在新的世紀轉折時期,它再次受到人們的親睞。所不同的是,它不再只是一個純學術問題,而同時帶有工程學的性質。當今的心靈哲學與其他關心智慧問題的具體科學如人工智慧、計算機科學、認知科學等,儘管各自走著迥然不同的運思路線,但最終都發現意向性是智慧現象的獨有特徵和必備條件。然而作為現代科技之結晶的計算機所表現出的所謂智慧,儘管在許多方面已遠勝於人類智慧,但它只能按形式規則進行形式轉換,而不能像人類智慧那樣主動、有意識地關聯於外部事態,即沒有涉及到意義,或沒有語義性或意向性。因此在本質上它只是句法機,而非像人那樣的語義機。有些人甚至據此認為,已有的機器智慧根本就不是智慧。因此擺在人工智慧研究面前的一個瓶頸問題就是研究如何讓智慧機器具有意向性,如何讓句法機質變為語義機。圍繞這一課題已誕生了許多新的方案,如卡明斯的解釋語義學、麥金的“心靈建築術”、布魯克斯的無表徵智慧等,本體語義學也是其中一朵耀眼的奇葩。

一 本體論語義學的動因、方法與基本範疇

本體論語義學的倡導者尼倫伯格(S. Nirenburg)和拉斯金(V. Raskin)說:“本體論語義學是一種關於自然語言意義的理論,一種關於自然語言加工的方案,它把經構造而成的世界模型或本體論作為提取和表述自然語言文字意義的基本框架,作為從文字中推出知識的前提。這種方案也想根據自然語言的意義形成自然語言的文字。”[1] 這就是說,本體語義學有著雙重動機。一是應用或工程學層面的動機,二是基礎理論層面的動機,而前者就其現實的需要來說更為迫切。尼倫伯格等人認識到:已有的機器智慧的最大問題是隻能完成句法加工或符號轉換,由此所決定,它即使快捷、方便、“多才多藝”,也無法改變其工具角色。因為它離人類智慧還差關鍵的一點,那就是它沒有意向性。所謂有意向性,就是有對外在事態的關於性(aboutness)或指向性,就是有對它物的知道和意識,有對自身的超越性,而不致停留於純符號的形式轉換。從語義學的角度來看,有意向性就是有語義性。所謂有語義性,就是人類智慧所涉及到的符號有意義、指稱和真值條件等特徵。很顯然,意向性、語義性和意義等詞在本質上是一致的,正因為如此,當今的意向性理論、意義理論、語義學有合流的趨勢。但是,迄今為止的機器都沒有表現出上述屬性。美國著名哲學家、認知科學家塞爾(John R.Searle)一針見血地指出:已有計算機所實現的所謂智慧“本身所做的”只是“形式符號處理”,它們“沒有任何意向性;它們是全然無意義的。……用語言學的行話來說,它們只是句法,而沒有意義。那種看來似乎是計算機所具有的意向性,只不過存在於為計算機程式設計和使用計算機的那些人心裡,和那些送進輸入和解釋輸出的人的心裡。”[2]如果從意義的角度理解資訊,甚至不能說計算機有加工資訊的功能。他說,“計算機所做的事不是‘資訊加工’,而是處理形式符號。程式編制者和計算機輸出解釋者使用符號來替代現實中的物體,這個事實完全是在計算機範圍之外的事。”[3]尼倫伯格等人不僅認識到了這一點,而且進一步強調:“意義是未來的高階自然語言加工的關鍵因素,”“有根據說,沒有這種利用文字意義的能力,人們就不可能在自然語言加工中取得真正的突破,……而過去在這個領域中的大多數工作都未注意到意義。”[4]他們提出本體論語義學的研究目的就是要改變這一狀況,就是要從技術的層面研究計算機如何利用和處理文字意義,如何讓機器智慧也有意向性。

要完成上述任務,必不可少的一項工作就是研究人類智慧及其運作機理,研究人類意向性的根據和條件,尤其是揭示人類自然語言的加工機制,闡釋其根本原則和方法,構建人類語義加工的基本模型。要模擬這樣的智慧,及其意義接受、理解、完成、輸出機制,就必須進到說者與聽者或語言的生產者與消費者相互交流的語境,探討怎樣將我們關於語言描述的觀念系統化,將計算程式處理意義的觀念系統化,怎樣形成更符合實際的、更有應用價值的系統的表徵理論。由這一任務所決定,本體論語義學提出了自己的方法論原則。既然它要完成的是應用方面的任務,它當然會設法形成這樣的假設,即重構人類加工語言的能力及其所需的知識與過程,也就是要弄清人類的自然語言加工是如何可能的。為此,它有這樣的理論預設,即承諾弱人智慧觀,而非強人工智慧觀。後者認為,計算機程式不僅應在功能上模擬人腦,而且還應從結構上、物理執行的過程與細節上去模擬。而前者則主張,在模擬人腦的語義能力時只需從功能上加以模擬就行了。判斷模擬是否成功,主要看機器處理語義的能力是否與人類的語義能力在功能上等值。其次,本體論語義學的方法論獨特之處還在於強調:要讓機器對自然語言的加工有語義性,必須以本體論為基礎。因為人類之所以能理解和產生意義,根本條件就是人類有一種本體論的圖式。正是藉助這種本體論圖式,任何一個符號語詞一旦進入人類視域,都會被歸類進入特定的意義域,獲得特定的語義值。不過,這裡所說的本體論有其獨特的含義。

尼倫伯格等人注意到:“本體論”一詞具有歧義性。儘管“本體論”用法五花八門,但可歸結為兩大類,一是純哲學的用法,二是具體科學和工程學中的用法。尼倫伯格贊成瓜裡羅(N. Guarino)對“本體論”的觀點,把前一用法稱作“大寫的本體論”,把後一用法稱作“小寫的本體論”。小寫的本體論又有形式本體論和工程學本體論兩種形式。瓜裡羅指出:所謂“形式本體論……是關於先驗劃分的理論,如在世界的實在(物理物件、事件、區域、物質的量……)之中,在用來模擬世界的元層次範疇(概念、屬性、質、狀態、作用、部分……)之間作出劃分”。[5]工程學的本體論與哲學中的本體論有很大的區別。它既不關心形而上學的“是”的意義,又沒有關於實在的本體論分類。它關心的是資訊系統中的整合因素,同時還涉及到有關概念分析之結果的本體論判定,因此它是名副其實的工程學本體論。[6]本體論語義學中的“本體論”既不同於形式本體論,又不同於哲學本體論,但從它們那裡吸取了有用的東西。尼倫伯格等人說:他們的“本體論建構試圖從形式本體論和哲學本體論中得到幫助”[7]在借鑑的基礎上,他們對“本體論”提出了新的理解,建立了一種極有個性的本體論。“在本體論語義學中的每種語言的詞彙都用相同的本體論來說明意義,因為它一定包含了那個本體論中的所有意義。”[8]尼倫伯格等人認為,“一個人要承認表徵和處理意義的可能性,就必須找到這樣的具體的意義因素,它們是外部世界實在的替代。而本體論語義學中的本體論就是能直接指示外部世界的最合適的東西。它實際上是世界的模型,是據此而建構的”[9]總之,本體語義學所說的本體論不過是語言加工系統中的一種概念框架,其作用是對輸入的語詞做本體論定位,為其有語義性創造條件。

二 本體論語義學關於語義加工系統的構想

要回答機器的語義加工何以可能,完成機器對人類自然語言加工的模擬,首先必須解決的問題是:人的自然語言加工何以可能?根據本體論語義學家的研究,所以可能的條件不外是:人類有將它與語言關聯起來的能力,有別的技能,有情感和意志之類的非理性方面,因為人們賦予語詞的意義常帶有情感色彩。另外,就是活動的目的、計劃及程式,最後就是各種知識資源。

本體論語義學認為,人類之所以能理解和產生意義,最重要的條件就是人類有一種本體論圖式。正是藉助它,任何語言一進到心靈之中就有了自己的歸屬,被安放進所屬的類別之中,如聽到了“紅”一詞,人們馬上有這樣的歸類:它指的是屬性,與“綠”“藍”等屬一類,為物體所具有,因而不是物體,等等而是基本概念與範疇。尼倫伯格等人說:“本體論語義學試圖探討的是人們在內省式和反思式地看待概念時對這些概念的運用。人們常常談論屬性。虛構的實在(獨角獸或赫爾墨斯)和抽象的實質,把它們當作存在的。不過對於我們來說,決定把它們放在本體論之中不是根源於這樣的事實,即這些實在是用自然的語言指稱的,而是因為我們相信:由於人們在他們的宇宙中有這些概念因而語言才指稱它們。”[10]因此,在語義機模型中,我們首先要建立的就是這種本體論圖式。根據他們的看法,“本體論提供的是描述一種語言的詞彙單元的意義所需的原語言,以及說明編碼在自然語言表徵中的意義所需的原語言。而要提供這些東西,本體論必須包含有對概念的'定義,這些概念可理解為世界上的事物和事件類別的反映。從結構上說,本體論是一系列的構架,或一系列被命令的屬性-價值對子。”[11]它為要表徵的詞項的意義作本體論的定位,即說明它屬於哪一類存在,其特點、性質、邊界條件是什麼。例如當有一詞“pay”輸入進來,首先就要經過本體論這一環節,換言之,該詞首先要被表徵為一個本體論概念,要被放進本體論的概念體系之中,一當這樣做了,它的屬性、值便被規定了。有了本體論概念框架,在這種靜態知識資源上就可以不斷生成各種含有意義表徵的動態知識資源。動態的知識資源是在應用所提出的任務、要求的基礎上所產生的知識。

有了關於人類加工自然語言所需條件比較清楚和量化的認識,就有可能透過建立相應的網路讓計算機也獲得這樣的條件,進而讓機器表現出對意義的敏感,最終具有語義加工能力。本體論語義學相信:這不是沒有可能的,至少有巨大的開發前景。對此,本體語義學進行大膽地嘗試,並建構出典型的語義加工模型。其具體操作就是:先讓加工器具備靜態和動態的知識知源,然後讓其有相應的加工能力。在實踐的基礎上,尼倫伯格等人透過分析公認的自然語言加工Stratified模型,詳細說明了機器進行語義加工的基本原理與過程。

在尼倫伯格等人看來,智慧主體要理解文字意義離不開至少六個基本環節的加工。第一步是文字分析,即要對輸入的文字產生一個表徵了文字的意義的正式表示式。由這任務所決定,它必須有分析器和生成器。從文字分析過程來說,文字要輸入到系統之中,首先要經過“前加工”將文字加以重新標記,並區別分析不同語言、不同體裁和風格的不同文字,以便讓文字能為系統所分析。第二步是對標記過的文字動用生態學、形態學、語法學、詞彙學的靜態知識資源作形態學分析,形成關於文字單詞的引用形式分辨。例如碰到“書”這個詞的輸入,形態學分析會這樣來分析:“book,名詞,複數”,“book,動詞,現在時,第三人稱,單數”等。第三步就會把它們送給詞彙學分析器,並激活這一分析器的入口。這個入口包含有許多型別的知識和資訊,如關於句法的資訊,關於詞彙語義學的資訊,其作用是檢查、淨化形態學分析的結果。例如英文文字中可能夾雜有法、德、意等語言的單詞,還有一些模稜兩可的單詞,更麻煩的是,有些詞在詞彙分析器中沒有出現過,因此無法予以檢查。在這些情況下,就要予以查檢、甄別,如對不熟悉的詞,它有一些處理的步驟和辦法。第四步是句法分析。第五步是決定基本的語義從屬關係,例如建立未來的意義表徵的命題結構,確定哪些因素將成為這些命題的主題,並決定該命題的屬性位置。

在此基礎上,本體論語義學提出了語義加工機的完整構想。尼倫伯格認為,機器要完成文字意義表徵,必須有加工器和靜態知識資源。首先第一步,藉助靜態知識資源(生態學、句法、形態學、詞彙學、詞源和本體論及事實材料)對輸入文字作出分析,然後又藉助這些知識資源產生文字意義表徵。分析模組和語義生成器都離不開靜態知識資源。知識資源是如何得到的呢?要靠學習。“本體論語義學必須涉及到學習:它們越起作用,它們儲存的關於世界的知識就越多,它們可望達到的結果就越好。”[12]除了靜態知識之外,計算機要完成語義表徵,還必須有動態的知識,它們是關於意義表徵的程式方面的知識以及推理型別的知識。另外,加工器還要有這樣的動態能力,即把所儲存的知識動態地提取出來,運用於知識表徵。尼倫伯格等人說“在本體論語義學中,這些目的是透過把文字意義表徵、詞彙和本體論關聯起來而實現的。”[13]“我們關於表徵文字意義的方案動用了兩種手段,一是本體論概念的例示,二是與本體論無關的引數的例示。前者提供了與任何可能的文字意義表徵例示相一致的、抽象的、非索引的命題。這些例示是這樣得到的,即提供了基本的本體論陳述,它們有具體的情境的、包含有引數的值,如方面、方式、共指等。”[14]在這裡,本體論的概念之所以抽象但又必要,主要是因為它提供了對存在和語詞的分類,如對於要表徵的意義,它首先要藉助這種本體論範疇確定它是屬於物體、屬性、方面、方式、過程、活動、數量中的哪一種。簡言之,對於任一詞的意義或所指,首先要藉助本體論概念確定它應包含在哪一類存在範疇之中。在此基礎上,再用非本體論引數分析它的具體的、情境方面的值。

三 特點與問題

本體論語義學與其他人工智慧理論、自然語言加工系統相比有自己的一些鮮明特點。其一,它強調對意義的處理無需透過句法分析,至少主要不是透過句法分析。在它看來,機器對意義的接受、表徵、加工、生成和輸出,或者說,讓機器的句法加工具有語義性或意向性,靠的主要不是原先的關鍵詞匹配,句法轉換,而依賴的是對人類智慧的全方位模擬。其二,本體論語義學認識到了人類心理狀態具有意向性、自然語言具有語義性依賴於複雜的因素,並在這種認識的基礎上形成了研究意義的一種綜合性方案。在具體的工程學實踐中,它關注到了意義處理中的多方面因素,即不僅僅注意到了知識性因素,而且還重視潛藏在人類智慧中的非知識因素,並透過特定的方式將它們“內化”到他們所建構的人工智慧系統之中。第三,本體語義學非常重視本體論圖式在人類心理狀態意向性、自然語言語義性中的作用,並在將這一認識成果向工程技術領域轉化,進而讓自然語言加工系統獲得這一語義生成的重要樞紐、機制方面做了大膽探索,取得了富有啟發意義的初步成果。第四,本體論語義學的確有重要的實踐意義和廣闊的應用前景,最重要的應用價值是它能產生文字意義表徵。因為它的語義處理系統可以藉助靜態知識資源對輸入文字作出分析,藉助加工器的動態能力將所儲存的知識動態地提取出來,並運用於知識表徵, 然後藉助這些知識資源產生文字意義表徵,並由特定輸出裝置完成在意義交流層次的人機對話。

可以說,本體論語義學面對當前人工智慧發展的瓶頸問題,基於工程學實踐和哲學反思,不僅在構建現實的語義機方面做出了極富價值的探索,也為揭示人類自然語言處理的基本原理提供了可資借鑑和進一步反思的研究成果。因此本體論語義學對於人工智慧的發展來說是必不可少的選擇之一。但是,這並不意味著本體語義學就是完備的、無懈可擊的人工智慧理論,非但如此,它儘管是為了回應塞爾中文屋論證和其他關於人工智慧責難而提出的一種方案,但仍會受到這樣的責難:它的自然語言系統所處理的意義、所生成的意義,好像仍離不開設計操作人員的解釋,如果是這樣,那麼它充其量只有派生的意向性、語義性。其次,最大的問題是:這種理論建立的系統仍沒有主動性、自覺性、意識性、目的性,而這些性質恰恰是人類固有的意向性的特徵。因此要讓機器成為像人類那樣的有意向性的自主系統看來還有很長的路要走。

注 釋

[1][4][6][7][8][9][10][11][12][13][14] S. Nuremburg and V. Raskin, Ontological Semantics, Cambridge, MA: The MIT Press, 2004, xiii, xiii, pp.138-139, p.154, p.111, p.88, p.135,p191, p160, p160,p174.

[2][3]塞爾:《心靈、大腦與程式》載於瑪格麗特·博登:《人工智慧哲學》,上海譯文出版社,2001,第113頁,第116頁。

[5] N. Guarino, “Formal Ontology”, in N. Guarino et al (eds.), Special Issue, The Role of Formal Ontology in the Information Technology, International Journal of Human and Computer, 1995(43)5-6.