Senin, 21 November 2011

Metode kontrol optimal LQR

Konsep Dasar LQR

Sebuah proses/plant dengan model state space:
dx/dt = Ax + Bu
y = Cx + Du
y adalah output yang ingin dikendalikan. Tujuan LQR adalah meregulasi/membuat output y menjadi nol dengan input seminimal mungkin. Tujuan ini dicapai dengan mendesain sebuah gain feedback K yang bisa meminimisasi cost function
J = ∫ [y'(t) Q y(t) + u'(t) R u(t)] dt
Q dan R adalah matrix weighing/pembobotan, dan kedua matrix ini harus berupa symmetric positive-definite. Cara memilih matrix-matrix ini akan dijelaskan nanti. Cost function ini berupa persamaan kuadrat dan inilah asal nama Linear Quadratic Regulator.


Perancangan LQR

 

LQR mengendalikan proses/plant dengan menggunakan kombinasi linear state plant tersebut. Maka, LQR membutuhkan semua state dalam plant tersedia untuk proses kontrol (dapat diukur atau diakses datanya). Jika tidak semua state ini bisa diperoleh, maka LQR dapat disertai dengan observer/estimator untuk mengestimasi state-state yang tidak dapat diukur berdasarkan model plant dan output yang dapat diukur.
Sistem kendali LQR adalah:
u = -Kx
K dapat diperoleh dari:
K = inv(D‘QD+R) (B’P+D’QC)
*kutip di sini berarti matrix transpose dan inv berarti matrix inverse.
dan P adalah solusi dari persamaan aljabar Ricatti:
0 = A’P + PA + C’QC – (PB+C’QD) inv(D’QD+R) (B’P+D’QC)
Persamaan Ricatti ini dapat dicari solusinya dengan menggunakan tools perhitungan numerik seperti Matlab.
Biasanya, output y yang ingin dibuat nol adalah sama dengan seluruh state x. Jadi, C = I (matrix identitas) dan D = 0. Dengan ini, sistem kendali menjadi:
K = inv(R) B’P
0 = A’PPAQPB inv(R) B’P
Desain LQR yang telah dijabarkan adalah desain untuk sistem kendali dengan rentang waktu yang tak terhingga (t dari nol hingga t -> ∞). Jika rentang waktunya berhingga, maka P harus dicari dari persamaan diferensial Ricatti:
dP/dt = A’P + PA + C’QC - (PB+C’QD) inv(D’QD+R) (B’P+D’QC)
Persamaan ini harus diselesaikan secara numerik dari t = tf ke t = 0, di mana tf adalah waktu final kendali. Pada sistem waktu yang berhingga ini, P berubah-ubah terhadap waktu sehingga feedback gain K juga berubah-berubah terhadap waktu. Lain halnya dengan sistem yang memiliki waktu yang panjang/tak berhingga, nilai P selalu sama sehingga K tidak berubah-ubah terhadap waktu/time invariant.

Menentukan Matrix Q dan R

Hal yang paling sering menjadi pertanyaan adalah bagaimana memperoleh/menentukan matrix Q dan R. Tidak ada solusi yang unik untuk matrix-matrix ini. Pemilihan matrix ini tergantung dari seberapa besar pengaruh y dan u yang diinginkan pada cost function dan dilakukan dengan trial and error (coba-coba). Yang perlu diperhatikan dalam proses trial dan error ini adalah matrix Q dan R harus simetris(matriks nxn) dan positive definite(determinan setiap pecahan komponennya adalah bernilai positif, misalnya A adalah matrik 4x4 maka determinan pecahan matrik simetrisnya |1x1| |2x2| |3x3| |4x4| adalah positif ).
Adapun satu aturan yang bisa menjadi acuan awal dalam trial and error ini adalah Bryson’s Rule. Bryson’s Rule menunjukkan pemilihan matrix Q dan R dapat dimulai dengan:
Q = 1/nilai y² max yg diperbolehkan
R = 1/nilai u² max yg diperbolehkan
Cara pemilihan ini tidak dijamin akan memberikan hasil yang diinginkan, tetapi setidaknya dapat menjadi langkah awal dalam proses trial and error.
Pada perancangan sistem kendali, seringkali kita harus melakukan trial and error. Contohnya pada desain PID, kita harus melakukan trial and error kepada 3 variable yang berbeda (P, I, dan D). Di sini lah LQR menjadi pilihan yang lebih baik daripada PID. Pada LQR, trial and error hanya dilakukan pada dua variable yakni Q dan R. Maka, proses trial and error pada LQR lebih sederhana tetapi tetap dapat menghasilkan performa yang sama dengan PID. Untuk contoh simulasinya di matlab bisa dilihat disini !!!!

Tidak ada komentar:

Posting Komentar