इष्टतम नियंत्रण
साँचा:asbox इष्टतम नियंत्रण (Optimal control), नियंत्रण की नीति (कन्ट्रोल स्ट्रेटिजी) निर्धारित करने की एक गणितीय इष्टतमीकरण विधि है। यह विचरण-कलन (calculus of variations) का विस्तार है जिसका विकास १९५० के दशक में लेव पोंट्रयागिन ( Lev Pontryagin) तथा रिचर्ड बेलमान (Richard Bellman) ने किया था। इष्टतम नियंत्रण के अनुप्रयोग विविध क्षेत्रों में हो रहे हैं, जैसे- इंजीनियरी, अर्थनीति, जीवविज्ञान, पर्यावरण, वित्त, प्रबन्धन, चिकित्सा आदि।
उदाहरण : सीमित काल
किसी खान मालिक को निर्नय लेना है कि खान से खनिज किस गति से निकाले जांय। उसके पास खनन का स्वामित्व दिनांक <math>0</math> से दिनांक <math>T</math> तक है। दिनाक <math>0</math> को खान में अयस्क की मात्रा <math>x_0</math> है। अयस्क की वर्तमान मात्रा <math>x(t)</math> उसी गति से घटती जाती है जिस गति <math>u(t)</math> से खनिज निकाला जाता है। खान से अयस्क निकालने का खर्च <math>u(t)^2/x(t)</math> है और अयस्क का मूल्य नियतांक <math>p</math> है। समय <math>T</math> पर खान में जो अयस्क बच जाता है उसका कोई मूल्य नहीं रहेगा। खान स्वामी, अपने स्वामित्व काल में अपना लाभ अधिकतम करने के लिये खनन की दर <math>u(t)</math> कैसी रखे?
1. Discrete-time version
The manager maximizes profit <math>\Pi</math>:
subject to the law of evolution for the state variable <math>x_t</math>
Form the Hamiltonian and differentiate:
As the mine owner does not value the ore remaining at time <math>T</math>,
Using the above equations, it is easy to solve for the <math>x_t</math> and <math>\lambda_t</math> series
and using the initial and turn-T conditions, the <math>x_t</math> series can be solved explicitly, giving <math>u_t</math>. |
2. Continuous-time version
The manager maximizes profit <math>\Pi</math>:
subject to the law of evolution for the state variable <math>x(t)</math>
Form the Hamiltonian and differentiate:
As the mine owner does not value the ore remaining at time <math>T</math>,
Using the above equations, it is easy to solve for the differential equations governing <math>u(t)</math> and <math>\lambda(t)</math>
and using the initial and turn-T conditions, the functions can be solved to yield
|
इन्हें भी देखें
- अरैखिक नियंत्रण
- इष्टतमीकरण (ऑप्टिमाइजेशन)
- गतिक क्रमादेशन (Dynamic programming)
- मॉडल द्वारा अनुमानित नियंत्रण