इष्टतम नियंत्रण

मुक्त ज्ञानकोश विकिपीडिया से
नेविगेशन पर जाएँ खोज पर जाएँ
The printable version is no longer supported and may have rendering errors. Please update your browser bookmarks and please use the default browser print function instead.

साँचा:asbox इष्टतम नियंत्रण (Optimal control), नियंत्रण की नीति (कन्ट्रोल स्ट्रेटिजी) निर्धारित करने की एक गणितीय इष्टतमीकरण विधि है। यह विचरण-कलन (calculus of variations) का विस्तार है जिसका विकास १९५० के दशक में लेव पोंट्रयागिन ( Lev Pontryagin) तथा रिचर्ड बेलमान (Richard Bellman) ने किया था। इष्टतम नियंत्रण के अनुप्रयोग विविध क्षेत्रों में हो रहे हैं, जैसे- इंजीनियरी, अर्थनीति, जीवविज्ञान, पर्यावरण, वित्त, प्रबन्धन, चिकित्सा आदि।

उदाहरण : सीमित काल

किसी खान मालिक को निर्नय लेना है कि खान से खनिज किस गति से निकाले जांय। उसके पास खनन का स्वामित्व दिनांक <math>0</math> से दिनांक <math>T</math> तक है। दिनाक <math>0</math> को खान में अयस्क की मात्रा <math>x_0</math> है। अयस्क की वर्तमान मात्रा <math>x(t)</math> उसी गति से घटती जाती है जिस गति <math>u(t)</math> से खनिज निकाला जाता है। खान से अयस्क निकालने का खर्च <math>u(t)^2/x(t)</math> है और अयस्क का मूल्य नियतांक <math>p</math> है। समय <math>T</math> पर खान में जो अयस्क बच जाता है उसका कोई मूल्य नहीं रहेगा। खान स्वामी, अपने स्वामित्व काल में अपना लाभ अधिकतम करने के लिये खनन की दर <math>u(t)</math> कैसी रखे?

1. Discrete-time version

The manager maximizes profit <math>\Pi</math>:

<math>\Pi = \sum_{t=0}^{T-1} \left[ pu_t - \frac{u_t^2}{x_t} \right] </math>

subject to the law of evolution for the state variable <math>x_t</math>

<math>x_{t+1} - x_t = - u_t\!</math>

Form the Hamiltonian and differentiate:

<math>H = pu_t - \frac{u_t^2}{x_t} - \lambda_{t+1} u_t</math>
<math>\frac{\partial H}{\partial u_t} = p - \lambda_{t+1} - 2\frac{u_t}{x_t} = 0</math>
<math>\lambda_{t+1} - \lambda_t = -\frac{\partial H}{\partial x_t} = -\left( \frac{u_t}{x_t} \right)^2</math>

As the mine owner does not value the ore remaining at time <math>T</math>,

<math>\lambda_T = 0\!</math>

Using the above equations, it is easy to solve for the <math>x_t</math> and <math>\lambda_t</math> series

<math>\lambda_t = \lambda_{t+1} + \frac{(p-\lambda_{t+1})^2}{4}</math>
<math>x_{t+1} = x_t \frac{2 - p + \lambda_{t+1}}{2}</math>

and using the initial and turn-T conditions, the <math>x_t</math> series can be solved explicitly, giving <math>u_t</math>.

2. Continuous-time version

The manager maximizes profit <math>\Pi</math>:

<math>\Pi = \int_0^T \left[ pu(t) - \frac{u(t)^2}{x(t)} \right] dt </math>

subject to the law of evolution for the state variable <math>x(t)</math>

<math> \dot x(t) = - u(t) </math>

Form the Hamiltonian and differentiate:

<math>H = pu(t) - \frac{u(t)^2}{x(t)} - \lambda(t) u(t) </math>
<math>\frac{\partial H}{\partial u} = p - \lambda(t) - 2\frac{u(t)}{x(t)} = 0</math>
<math>\dot\lambda(t) = -\frac{\partial H}{\partial x} = -\left( \frac{u(t)}{x(t)} \right)^2</math>

As the mine owner does not value the ore remaining at time <math>T</math>,

<math>\lambda(T) = 0</math>

Using the above equations, it is easy to solve for the differential equations governing <math>u(t)</math> and <math>\lambda(t)</math>

<math>\dot\lambda(t) = -\frac{(p-\lambda(t))^2}{4} </math>
<math>u(t) = x(t) \frac{p- \lambda(t)}{2}</math>

and using the initial and turn-T conditions, the functions can be solved to yield

<math>x(t) = \frac{(4-pt+pT)^2}{(4+pT)^2} x_0 </math>

इन्हें भी देखें