第八卷 第三期 - 2009年四月三日
具有自我探索程序之符號式智慧型控制系統
陳梁軒1,*、姜正雄2

1國立成功大學 工業與資訊管理學系
2玄奘大學 資訊科學學系
lhchen@mail.ncku.edu.tw

Engineering Applications of Artificial Intelligence, Vol. 21, No. 2, pp. 201-214 (2008)

標準大小   字體放大
社會科學領域中,有關人類智慧的題材曾被廣泛探討。此外,人類的「智慧」模式也被應用於電腦科學、工程、醫學以及管理領域中。在電腦科學以及工程領域中,一個「智慧型控制系統」必須具備感知環境、做決策以及產生行動的能力。因此,一個智慧型控制系統具有三種基本功能:感知、做決策及行動。我們可以發現在日常生活中有許多智慧型控制系統的應用,例如:模糊控制的冷氣機、無人駕駛飛機、智慧型機器人等。一般而言,一個控制系統可以分成兩類:間接控制與直接控制。間接控制需要事先設計控制系統的控制模式,但是直接控制不需事先決定控制系統的控制模式,例如:以人工智慧為基礎的控制方法。本研究所發展的控制系統屬於以人工智慧為基礎的控制方法,簡稱SyICS (a Symbol-based Intelligent Control System),可以調整自己的控制規則以適應不同的環境。

SyICS方法是由符號控制器(symbolic controller)、感知器(percepter)、自我適應器(self-adaptor)所組成,如圖1所示。符號控制器首先產生控制輸入給受控系統(plant),然後感知器再去評估控制的效率。符號控制器是由數條符號規則所構成,符號規則可以是IF-THEN規則。感知器有兩種可能的輸出:一則連接到符號控制器,一則連接到自我適應器。如果控制系統無法適應環境或者是控制效率不佳,感知器便產生相對的訊號給自我適應器,以啟動自我適應器。當自我適應器被啟動時,三階段的自我探索程序便開始搜尋新的可適應的控制規則。這個自我探索程序是藉由混合式遺傳演算法(hybrid genetic algorithm)來尋找新的規則。當新的控制規則找到後,這些規則將透過符號規則產生器(symbolic rules generator)被轉換成符號規則。以下為感知器、自我探索程序、及混合式遺傳演算法之簡介。

感知器:感知器相當於感測機制,用來偵測控制的效率。本研究提出一種感知引擎,稱作感知機。感知機有兩種衡量指標:適應性指標以及效率性指標。適應性指標pa用以指明控制系統是否能夠適應環境,亦即:
      
效率性指標pe用以指明控制系統的效率,其值介於[0, 1]。最後,總體的感知器衡量指標定義為:

其中η是可調整的常數。若<ε,則啟動自我適應器以產生新的符號規則來適應環境,否則繼續由符號控制器來控制受控系統。

自我探索程序:一個自我探索程序的示例如圖2所示。由圖2可知,系統首先產生6個控制行動。但是,控制系統在第6個時間點所產生的控制行動無法適應環境。因此,系統便回朔兩個時間點,至行動Ad。然後,系統產生新的控制行動以適應環境。在圖2中,我們可以看到有7個新的行動產生。

混合式遺傳演算法:本研究所提出來的混合式遺傳演算法(hybrid genetic algorithm, HGA)有四個主要的特色:1) 離散式編碼;2) 可變長度的染色體;3) 以加權平均為基礎的多目標適應函數;4) 多種基因運算;5) 菁英政策。本研究所採用的基因運算有五種:複製、交配、突變、插入以及刪除。
圖1 SyICS控制模式的架構
圖2 自我探索程序的示例

應用:機器人路徑規畫

在本研究中,機器人路徑規畫之目的是一台模擬的機器人必須從起始點移動至目標點,並且避開障礙物,如圖3所示。假設環境空間為100×100平方公分。機器人知道自己目前的座標以及目標點的座標。但是機器人不知道障礙物的位置,除非機器人碰到障礙物他才能得知此障礙物的座標。
圖3 機器人路徑規畫的示意圖 (a) 機器人與目標區域草圖 (b) 路徑規畫的空間區域

模擬結果

爲了驗證本研究方法之效率,我們比較其他兩種類似的方法:SEICS [1]以及mSEICS [2]。在模擬的環境中,隨機產生25個障礙物。機器人的起始位置為(5, 15),目標點的中心座標為(50, 85),如圖4所示。在圖4(b)中,這兩條平行的虛線表示mSEICS方法的機器人可容忍的行進區域,如果機器人移動超越這個區域,mSEICS便會尋找新的路徑。圖4顯示兩種不同的機器人路徑,以‘o’符號所表示的路徑為機器人的原始路徑,以‘*’所表示的路徑為機器人的適應路徑(也就是為了避開障礙物所修正過的新路徑)。如圖4所示,三種方法的機器人都碰到障礙物。圖4(a)表示SyICS方法的路徑有兩次的碰撞,因此自我適應器被啟動兩次來搜尋新的控制規則。在產生新的規則並且更新舊的規則後,圖4(a)的適應路徑顯示,機器人首先以偏左的方式來避開第一個障礙物,並且以偏右的方式避開第二個障礙物。圖4(b)顯示機器人適應路徑以較大的幅度來避開這兩個障礙物。圖4(c)顯示機器人的原始路徑只有一個碰撞,機器人的適應路徑則以偏向左邊的方式避開障礙物。經過計算三種方法的原始路徑與適應路徑的效率指標,SyICS方法分別為:85.07公分以及77.14公分、mSEICS方法分別為:225.74公分以及35.76公分;SEICS方法分別為:521.91公分以及603.85公分。因此,SyICS方法在此模擬中具有最佳的效率。此外,SyICS、mSEICS以及SEICS的機器人移動總步數分別為:29、43以及43步。所以,SyICS方法的機器人從起點至目標點所需的總步數最少。
圖4 具有25個障礙物的模擬結果圖 (a) SyICS方法 (b) mSEICS方法 (c) SEICS方法

由上面的模擬結果,可知SyICS方法具有以下之優點:1)所產生的機器人路徑最有效率;2)所產生的路徑具有最少的機器人移動步數;3)所產生的路徑最接近最短路徑。因此,三種方法中SyICS方法是最佳的。

參考文獻

[1]L.-H. Chen and C.-H. Chiang, “New approach to intelligent control systems with self-exploring process,” IEEE Transactions on Systems, Man, and Cybernetics, Part B: Cybernetics, vol. 33, no. 1, pp. 5666, 2003.
[2]L.-H. Chen and C.-H. Chiang, “An intelligent control system with a multi-objective self-exploration process,” Fuzzy Sets and Systems, vol. 143, no. 2, pp. 275294, 2004.
< 上一篇下一篇 >
Copyright National Cheng Kung University