इष्टतम नियंत्रण

मुक्त ज्ञानकोश विकिपीडिया से
नेविगेशन पर जाएँ खोज पर जाएँ

साँचा:asbox इष्टतम नियंत्रण (Optimal control), नियंत्रण की नीति (कन्ट्रोल स्ट्रेटिजी) निर्धारित करने की एक गणितीय इष्टतमीकरण विधि है। यह विचरण-कलन (calculus of variations) का विस्तार है जिसका विकास १९५० के दशक में लेव पोंट्रयागिन ( Lev Pontryagin) तथा रिचर्ड बेलमान (Richard Bellman) ने किया था। इष्टतम नियंत्रण के अनुप्रयोग विविध क्षेत्रों में हो रहे हैं, जैसे- इंजीनियरी, अर्थनीति, जीवविज्ञान, पर्यावरण, वित्त, प्रबन्धन, चिकित्सा आदि।

उदाहरण : सीमित काल

किसी खान मालिक को निर्नय लेना है कि खान से खनिज किस गति से निकाले जांय। उसके पास खनन का स्वामित्व दिनांक <math>0</math> से दिनांक <math>T</math> तक है। दिनाक <math>0</math> को खान में अयस्क की मात्रा <math>x_0</math> है। अयस्क की वर्तमान मात्रा <math>x(t)</math> उसी गति से घटती जाती है जिस गति <math>u(t)</math> से खनिज निकाला जाता है। खान से अयस्क निकालने का खर्च <math>u(t)^2/x(t)</math> है और अयस्क का मूल्य नियतांक <math>p</math> है। समय <math>T</math> पर खान में जो अयस्क बच जाता है उसका कोई मूल्य नहीं रहेगा। खान स्वामी, अपने स्वामित्व काल में अपना लाभ अधिकतम करने के लिये खनन की दर <math>u(t)</math> कैसी रखे?

1. Discrete-time version

The manager maximizes profit <math>\Pi</math>:

<math>\Pi = \sum_{t=0}^{T-1} \left[ pu_t - \frac{u_t^2}{x_t} \right] </math>

subject to the law of evolution for the state variable <math>x_t</math>

<math>x_{t+1} - x_t = - u_t\!</math>

Form the Hamiltonian and differentiate:

<math>H = pu_t - \frac{u_t^2}{x_t} - \lambda_{t+1} u_t</math>
<math>\frac{\partial H}{\partial u_t} = p - \lambda_{t+1} - 2\frac{u_t}{x_t} = 0</math>
<math>\lambda_{t+1} - \lambda_t = -\frac{\partial H}{\partial x_t} = -\left( \frac{u_t}{x_t} \right)^2</math>

As the mine owner does not value the ore remaining at time <math>T</math>,

<math>\lambda_T = 0\!</math>

Using the above equations, it is easy to solve for the <math>x_t</math> and <math>\lambda_t</math> series

<math>\lambda_t = \lambda_{t+1} + \frac{(p-\lambda_{t+1})^2}{4}</math>
<math>x_{t+1} = x_t \frac{2 - p + \lambda_{t+1}}{2}</math>

and using the initial and turn-T conditions, the <math>x_t</math> series can be solved explicitly, giving <math>u_t</math>.

2. Continuous-time version

The manager maximizes profit <math>\Pi</math>:

<math>\Pi = \int_0^T \left[ pu(t) - \frac{u(t)^2}{x(t)} \right] dt </math>

subject to the law of evolution for the state variable <math>x(t)</math>

<math> \dot x(t) = - u(t) </math>

Form the Hamiltonian and differentiate:

<math>H = pu(t) - \frac{u(t)^2}{x(t)} - \lambda(t) u(t) </math>
<math>\frac{\partial H}{\partial u} = p - \lambda(t) - 2\frac{u(t)}{x(t)} = 0</math>
<math>\dot\lambda(t) = -\frac{\partial H}{\partial x} = -\left( \frac{u(t)}{x(t)} \right)^2</math>

As the mine owner does not value the ore remaining at time <math>T</math>,

<math>\lambda(T) = 0</math>

Using the above equations, it is easy to solve for the differential equations governing <math>u(t)</math> and <math>\lambda(t)</math>

<math>\dot\lambda(t) = -\frac{(p-\lambda(t))^2}{4} </math>
<math>u(t) = x(t) \frac{p- \lambda(t)}{2}</math>

and using the initial and turn-T conditions, the functions can be solved to yield

<math>x(t) = \frac{(4-pt+pT)^2}{(4+pT)^2} x_0 </math>

इन्हें भी देखें