Représentation d'état

En automatique, une représentation d'état permet de modéliser un système dynamique en utilisant des variables d'état. Cette représentation, qui peut être linéaire ou non, continue ou discrète, permet de déterminer l'état du système à n'importe quel instant futur si l'on connaît l'état à l'instant initial et le comportement des variables exogènes qui influent sur le système. La représentation d'état du système permet de connaître son comportement "interne" et pas seulement son comportement "externe" comme c'est le cas avec sa fonction de transfert[1]. Pour un bref historique de la représentation d'état, voir Histoire de l'automatique.

Variables d'état

Un système peut être entièrement décrit à l'aide d'un ensemble de variables. Les variables d'état sont des grandeurs, qui le plus souvent ont une signification physique, et qui sont rassemblées dans un vecteur $x$ . La connaissance de toutes les variables d'état à un instant $t$ quelconque ainsi que de l'entrée sur un intervalle $[t, t+T]$ , où $T$ est arbitraire, permet de connaître la valeur de toutes les variables du système à l'instant $t+T$ . Le nombre de variables d'état, désigné par la lettre n, est l'ordre du système.

Systèmes linéaires

Représentations

Représentation d'état matricielle

Dans la première partie de cet article nous ne considèrerons que des systèmes linéaires invariants (ou stationnaires).

La représentation d'état de ces systèmes, quand ils sont à temps continu, s'écrit de la manière suivante[2] :

{\begin{cases}{\dot {x}}&=A~x+B~u\\y&=C~x+D~u\end{cases}}

x(t)\in \mathbb {R} ^{n}

: colonne qui représente les n variables d'état

u(t)\in \mathbb {R} ^{m}

: colonne qui représente les m commandes

y(t)\in \mathbb {R} ^{p}

: colonne qui représente les p sorties

A\in \mathbb {R} ^{n\times n}

: Matrice d'état

B\in \mathbb {R} ^{n\times m}

: Matrice de commande

C\in \mathbb {R} ^{p\times n}

: Matrice d'observation

D\in \mathbb {R} ^{p\times m}

: Matrice d'action directe

Les colonnes $x$ , $u$ et $y$ représentent des vecteurs $\mathbf {x} \in {\mathcal {X}},\mathbf {u} \in {\mathcal {U}}$ et $\mathbf {y} \in {\mathcal {Y}}$ dans des bases des espaces vectoriels ${\mathcal {X}},{\mathcal {U}}$ et ${\mathcal {Y}}$ , appelés espace d'état, espace des commandes et espace des sorties, et isomorphes à $\mathbb {R} ^{n},\mathbb {R} ^{m}$ et $\mathbb {R} ^{p}$ respectivement.

De même les matrices $A$ , $B$ , $C$ et $D$ représentent des applications linéaires $\mathbf {A} \in {\mathcal {L}}({\mathcal {X}},{\mathcal {X}})$ , $\mathbf {B} \in {\mathcal {L}}({\mathcal {U}},{\mathcal {X}})$ , $\mathbf {C} \in {\mathcal {L}}({\mathcal {X}},{\mathcal {Y}})$ et $\mathbf {D} \in {\mathcal {L}}({\mathcal {U}},{\mathcal {Y}})$ , respectivement, dans les bases considérées.

Les vecteurs $x$ , $u$ et $y$ vérifient les équations

{\begin{cases}\mathbf {\dot {x}} &=\mathbf {A~x+B~u} \\\mathbf {y} &=\mathbf {C} ~\mathbf {x} +\mathbf {D} ~\mathbf {u} \end{cases}}

Dans certains cas, la représentation d'état matricielle introduite en premier lieu sera la plus commode ; dans d'autres, celle mettant en jeu des vecteurs et des applications linéaires, et appelée représentation d'état intrinsèque (elle est également dite géométrique[3]) sera plus appropriée.

Intégration de l'équation d'état

L'état du système est un résumé exhaustif du passé du système. En effet, connaissant l'état $x(t_{i})$ , et la commande $u(t)$ sur l'intervalle fini $[t_{i},~t_{f}]$ , on peut exprimer l'état $x(t_{f})$ , grâce aux calculs sur l'exponentielle d'une matrice :

x(t_{f})=e^{A(t_{f}-t_{i})}x(t_{i})+\int _{t_{i}}^{t_{f}}e^{A(t_{f}-\tau )}Bu(\tau )d\tau

Changement de base

Considérons le changement de variable $z=Px$ , avec $P\in \mathbb {R} ^{n\times n}$ et inversible. Ce changement de variable correspond à un changement de base dans l'espace d'état. Le système se récrit donc comme suit :

{\begin{cases}{\dot {z}}=PAx+PBu&=PAP^{-1}z+PBu\\y=Cx+Du&=CP^{-1}z+Du\end{cases}}

On voit donc qu'il existe une infinité de représentations matricielles d'un système d'état. En revanche, la représentation intrinsèque est unique.

Pôles

Les valeurs propres de la matrice d'état $A$ (ou, de manière équivalente, de l'endomorphisme $\mathbf {A}$ représenté par cette matrice) sont les pôles du système. Soit p un pôle ; son ordre q est défini comme étant le degré maximal des diviseurs élémentaires de la matrice polynômiale $sI_{n}-A$ multiples du polynôme $s-p\in \mathbb {C} \left[s\right]$ , ou encore l'ordre de multiplicité de p en tant que racine du polynôme minimal de A, soit encore l'ordre maximal des blocs de Jordan de A ayant pour valeur propre p.

Cette dernière caractérisation et l'application de la réduction de Jordan à la théorie de systèmes différentiels montre que les conditions suivantes sont équivalentes :

(i) le système a un pôle p d'ordre supérieur ou égal à q;

(ii) avec u=0, il existe un état initial

x_{0}\neq 0

tel que l'équation d'état a une solution de la forme

x(t)=t^{q-1}e^{pt}x_{0}

.

Stabilité

De ce qui précède, il résulte les propositions suivantes:

Le système est asymptotiquement stable si, et seulement si ses pôles sont tous situés dans le demi-plan gauche ouvert (c'est-à-dire ont tous une partie réelle strictement négative). Il s'agit également de la condition nécessaire et suffisante pour que le système soit exponentiellement stable.

Le système est stable (au sens de Lyapunov) si, et seulement si ses pôles sont tous dans le demi-plan gauche fermé (c'est-à-dire ont tous une partie réelle négative ou nulle), ceux situés sur l'axe imaginaire (s'il en existe) étant simples (c'est-à-dire d'ordre 1).

Propriétés structurelles

La commandabilité et l'observabilité sont des propriétés structurelles du système qui n'apparaissent pas dans la représentation par fonction de transfert.

Commandabilité et stabilisabilité

Un système est dit commandable si pour tout intervalle de temps $[t_{i},~t_{f}]$ , et tous points $\mathbf {x} _{i},\mathbf {x} _{f}\in {\mathcal {X}}$ , avec $\mathbf {x} (t_{i})=\mathbf {x} _{i}$ , il existe une commande $u$ appliquée sur $[t_{i},~t_{f}]$ , telle que $\mathbf {x} (t_{f})=\mathbf {x} _{f}$ .

La condition nécessaire et suffisante de commandabilité ci-après est appelée le critère de Kalman pour la commandabilité[2]. Le système considéré est commandable si et seulement si :

{\textrm {rang}}{\begin{bmatrix}B&AB&...&A^{n-1}B\end{bmatrix}}=n

La matrice ci-dessus, notée $\Gamma$ , est communément appelée matrice de commandabilité, et ses colonnes se calculent de façon itérative : $A^{k+1}B=A(A^{k}B)$ . En termes intrinsèques on définit le sous-espace commandable ${\mathcal {X}}_{c}$ de l'espace d'état ${\mathcal {X}}$ suivant[3]

{\mathcal {X}}_{c}=\sum _{k=1}^{b}\mathbf {A} ^{k-1}{\mathcal {B}}

où ${\mathcal {B}}$ est l'image de $\mathbf {B}$ , et le système est donc commandable si, et seulement si ${\mathcal {X}}_{c}={\mathcal {X}}$ . On dit alors, par abus de langage, que $(A, B)$ (ou, de manière équivalente, $(A, B)$ ) est commandable. Quand ce n'est pas le cas, soit $\rho _{c}$ le rang de la matrice $\Gamma$ , c'est-à-dire la dimension de l'espace commandable ${\mathcal {X}}_{c}$ , $\left\{\varepsilon _{1},...,\varepsilon _{\rho _{c}}\right\}$ une base de ${\mathcal {X}}_{c}$ et $\left\{\varepsilon _{\rho _{c}+1},...,\varepsilon _{n}\right\}$ une base d'un sous-espace supplémentaire de ${\mathcal {X}}_{c}$ dans ${\mathcal {X}}$ . En choisissant dans ${\mathcal {X}}$ la base $\left\{\varepsilon _{1},...,\varepsilon _{n}\right\}$ , quelle que soit la base choisie dans ${\mathcal {U}}$ , les applications linéaires $\mathbf {A}$ et $\mathbf {B}$ sont représentées par des matrices de la forme

{\begin{pmatrix}A_{c}&\ast \\0&A_{\bar {c}}\end{pmatrix}},{\begin{pmatrix}B_{c}\\0\end{pmatrix}}

où $(A_{c},B_{c})$ est commandable et où l'astérisque est une sous-matrice dont les éléments sont quelconques. Les valeurs propres de $A_{\bar {c}}$ sont les pôles (ou modes) non commandables du système, également appelés ses zéros de découplage en entrée (z.d.e.). L'ordre de la matrice $A_{c}$ est $\rho _{c}$ et celui de la matrice $A_{\bar {c}}$ est $n-\rho _{c}$ .

Le système est dit stabilisable si ses pôles non commandables appartiennent tous au demi-plan gauche ouvert. Un système commandable est donc stabilisable.

Un critère commode pour étudier la commandabilité et la stabilisabilité d'un système est le test de Popov-Belevich-Hautus (PBH)[4]: le système est commandable (resp. stabilisable) si, et seulement si le rang de la matrice $(sI_{n}-A\quad B)$ est égal à $n$ pour tout $s\in \mathbb {C}$ (resp. pour tout $s$ dans le demi-plan droit fermé).

Les pôles non commandables sont également les valeurs de $s\in \mathbb {C}$ pour lesquelles le rang de la matrice $\left({\begin{array}{cc}sI_{n}-A&B\end{array}}\right)$ est $<n$ , autrement dit ce sont les racines des facteurs invariants de cette matrice. Soit p un pôle non commandable. Son ordre q est par définition le degré maximal des diviseurs élémentaires de $(sI_{n}-A\quad B)$ multiples du polynôme $s-p\in \mathbb {C}$ (c'est aussi l'ordre de multiplicité de p en tant que racine du polynôme minimal de $A_{\bar {c}}$ , soit encore l'ordre maximal des blocs de Jordan de $A_{\bar {c}}$ ayant pour valeur propre p.).

Cette dernière caractérisation montre (comme, plus haut, à propos des pôles du système) que les conditions suivantes sont équivalentes :

le nombre complexe p est un pôle non commandable d'ordre supérieur ou égal à q ;
il existe un état initial $x_{0}\neq 0$ tel que pour toute commande indéfiniment dérivable u, l'équation d'état a une solution de la forme $x(t)=t^{q-1}e^{pt}x_{0}$ .

Observabilité et détectabilité

Un système est dit observable si l'observation de ses entrées et sorties pendant un intervalle de temps fini $[t_{i},~t_{f}]$ permet de déterminer l'état initial $x(t_{i})$ , et donc, par intégration de l'équation d'état, de connaître $x(t)$ à tout instant appartenant à l'intervalle $[t_{i},~t_{f}]$ . La condition nécessaire et suffisante d'observabilité ci-après est appelé le Critère de Kalman pour l'observabilité[2]. Le système considéré est observable si et seulement si :

{\textrm {rang}}{\begin{bmatrix}C\\CA\\...\\CA^{n-1}\end{bmatrix}}=n

Cette matrice notée $\Omega$ est communément appelée matrice d'observabilité et ses lignes se calculent de façon itérative : $CA^{k+1}=(CA^{k})A$ . En termes intrinsèques, on définit le sous-espace non observable ${\mathcal {X}}_{\bar {o}}$ suivant[3]

{\mathcal {X}}_{\bar {o}}=\cap _{k=1}^{n}\ker(\mathbf {CA} ^{k})

et le système (ou, par abus de langage, $(C, A)$ , ou $(C, A)$ ) est donc observable si, et seulement si ${\mathcal {X}}_{\bar {o}}=0$ (où 0 désigne le sous-espace vectoriel de ${\mathcal {X}}$ réduit au seul élément nul). Quand ce n'est pas le cas, soit ${\mathcal {\rho }}_{\bar {o}}$ la dimension de ${\mathcal {X}}_{\bar {o}}$ ( $n-{\mathcal {\rho }}_{\bar {o}}$ étant donc le rang de $\Omega$ ), $\left\{\eta _{1},...,\eta _{n-\rho _{\bar {o}}}\right\}$ une base d'un sous-espace supplémentaire de ${\mathcal {X}}_{\bar {o}}$ , et $\left\{\eta _{n-\rho _{\bar {0}}+1},...,\eta _{n}\right\}$ une base de ${\mathcal {X}}_{\bar {o}}$ . En choisissant dans ${\mathcal {X}}$ la base $\left\{\eta _{1},...,\eta _{n}\right\}$ , quelle que soit la base choisie dans ${\mathcal {Y}}$ , les applications linéaires $\mathbf {C}$ et $\mathbf {A}$ sont représentées par des matrices de la forme

{\binom {C_{o}}{0}},{\begin{pmatrix}A_{o}&0\\\ast &A_{\bar {o}}\end{pmatrix}}

où ${\binom {C_{o}}{0}}$ est observable.

Les valeurs propres de $A_{\bar {o}}$ sont les pôles (ou modes) non observables du système, également appelés des zéros de découplage en sortie (z.d.s.). L'ordre de la matrice $A_{o}$ est $n-\rho _{o}$ et celui de la matrice $A_{\bar {o}}$ est $\rho _{o}$ .

Le système est dit détectable si ses pôles non observables appartiennent tous au demi-plan gauche ouvert. Un système observable est donc détectable.

Il existe également le test de Popov-Belevich-Hautus (PBH) pour caractériser l'observabilité et la détectabilité[4]: le système est observable (resp. détectable) si, et seulement si le rang de la matrice

{\binom {sI_{n}-A}{C}}

est égal à $n$ pour tout $s\in \mathbb {C}$ (resp. pour tout $s$ dans le demi-plan droit fermé).

Les pôles non observables sont également les valeurs de $s\in \mathbb {C}$ pour lesquelles le rang de la matrice ci-dessus est $<n$ , autrement dit ce sont les racines des facteurs invariants de cette matrice. L'ordre d'un pôle non observable se définit comme celui d'un pôle non commandable, mutatis mutandis.

Les conditions suivantes sont équivalentes :

le nombre complexe p est un pôle non observable d'ordre supérieur ou égal à q ;
avec $u=0$ , il existe un état initial $x_{0}\neq 0$ tel que $x(t)=t^{q-1}e^{pt}x_{0}$ est une solution de l'équation d'état, tandis que la sortie y est identiquement nulle.

Décomposition de Kalman

Écrivons maintenant ${\mathcal {X}}={\mathcal {X}}_{c{\bar {o}}}\oplus {\mathcal {X}}_{co}\oplus {\mathcal {X}}_{{\bar {c}}{\bar {o}}}\oplus {\mathcal {X}}_{{\bar {c}}o}$ où ${\mathcal {X}}_{c{\bar {o}}}={\mathcal {X}}_{c}\cap {\mathcal {X}}_{\bar {o}}$ , ${\mathcal {X}}_{co}$ est un supplémentaire de ${\mathcal {X}}_{c{\bar {o}}}$ dans ${\mathcal {X}}_{c}$ , ${\mathcal {X}}_{{\bar {c}}{\bar {o}}}$ est un supplémentaire de ${\mathcal {X}}_{c{\bar {o}}}$ dans ${\mathcal {X}}_{\bar {o}}$ et ${\mathcal {X}}_{{\bar {c}}o}$ est un supplémentaire de ${\mathcal {X}}_{\bar {o}}\oplus {\mathcal {X}}_{c}$ dans ${\mathcal {X}}$ . En choisissant dans ${\mathcal {X}}$ une base formée de la concaténation de bases des sous-espaces ci-dessous, les applications linéaires $\mathbf {A}$ , $\mathbf {B}$ et $\mathbf {C}$ sont représentées (quelles que soient les bases choisies dans ${\mathcal {U}}$ et ${\mathcal {Y}}$ ) par des matrices de la forme[2]^,[3],

{\tilde {A}}={\begin{pmatrix}A_{c{\bar {o}}}\quad &\ast &\ast &\ast \\0\quad &A_{co}\quad &0&\ast \\0\quad &0&A_{{\bar {c}}{\bar {o}}}\quad &\ast \\0\quad &0&0&A_{{\bar {c}}o}\end{pmatrix}},\quad {\tilde {B}}={\begin{pmatrix}B_{c{\bar {o}}}\\B_{co}\\0\\0\end{pmatrix}},

{\tilde {C}}={\begin{pmatrix}\ \ 0\quad &\ \ C_{co}\quad &\quad 0\quad \ &C_{{\bar {c}}o}\end{pmatrix}}

où

\left({\begin{pmatrix}A_{c{\bar {o}}}\quad &\ast \\0\quad &A_{co}\quad \end{pmatrix}},\quad {\begin{pmatrix}B_{c{\bar {o}}}\\B_{co}\end{pmatrix}}\right)

est commandable et

\left({\begin{pmatrix}C_{co}&C_{{\bar {c}}o}\end{pmatrix}},\quad {\begin{pmatrix}A_{co}\quad &\ast \\0&A_{{\bar {c}}o}\end{pmatrix}}\right)

est observable. On vérifie sans difficulté que la matrice de transfert du système est

G(s)={\tilde {C}}\left(sI_{n}-{\tilde {A}}\right)^{-1}{\tilde {B}}+D=C_{co}\left(sI_{n_{co}}-A_{co}\right)^{-1}B_{co}+D

où $n_{co}$ est la dimension de l'espace vectoriel ${\mathcal {X}}_{co}$ . Par conséquent, la matrice de transfert ne dépend que de la partie commandable et observable du système.

Modes cachés

Considérons de nouveau le système linéaire donné par la représentation d'état ci-dessus. Les propriétés suivantes sont équivalentes:

Le système est à la fois observable et commandable.
Les pôles du système (autrement dit, les valeurs propres de $A$ ) coïncident avec ses pôles de transmission (autrement dit, les pôles de sa matrice de transfert), en prenant en compte les multiplicités.

Le système est dit minimal quand ces propriétés équivalentes sont satisfaites.

Considérons la décomposition de Kalman de ce système. On a, puisque les valeurs propres d'une matrices restent inchangées par changement de base,

\sigma (A)=\sigma (A_{co}){\dot {\cup }}\sigma (A_{c{\bar {o}}}){\dot {\cup }}\sigma (A_{{\bar {c}}o}){\dot {\cup }}\sigma (A_{{\bar {c}}{\bar {o}}})

où $\sigma (.)$ désigne le spectre de la matrice entre parenthèses, c'est-à-dire l'ensemble de ses valeurs propres (répétées un nombre de fois égal à leur multiplicité) et où ${\dot {\cup }}$ est la réunion disjointe. D'autre part, avec les notations qui précèdent,

\sigma (A_{\bar {c}})=\sigma (A_{{\bar {c}}o}){\dot {\cup }}\sigma (A_{{\bar {c}}{\bar {o}}}),\ \sigma (A_{\bar {o}})=\sigma (A_{c{\bar {o}}}){\dot {\cup }}\sigma (A_{{\bar {c}}{\bar {o}}})

par conséquent, $\sigma (A)=\sigma (A_{co}){\dot {\cup }}\{m.c.\}$ où $\{m.c.\}=\sigma (A_{\bar {c}}){\dot {\cup }}\sigma (A_{\bar {o}})\backslash \sigma (A_{{\bar {c}}{\bar {o}}})$ ( $E\backslash F$ désignant le complémentaire de $F$ dans $E$ lorsque $F\subset E$ ).

Les éléments de

\{m.c.\}

(resp.

\sigma (A_{{\bar {c}}{\bar {o}}})

) s'appellent les modes cachés (resp. les zéros de découplage en entrée-sortie (z.d.e.s.))[5]. La dernière égalité s'écrit

\left\{m.c.\right\}=\left\{z.d.e.\right\}{\dot {\cup }}\left\{z.d.s.\right\}\backslash \left\{z.d.e.s.\right\}

,

tandis que la précédente s'écrit, en désignant par $\left\{p.s.\right\}$ (resp. $\left\{p.t.\right\}$ ) les pôles du système (resp. ses pôles de transmission)

\left\{p.s.\right\}=\left\{p.t.\right\}{\dot {\cup }}\left\{m.c.\right\}

.

On peut montrer que ces deux dernières relations sont intrinsèques[6]^,[4].

Zéros invariants

Considérons la matrice $R (s)$ , appelée matrice de Rosenbrock ou matrice-système[5]

R(s)={\begin{pmatrix}sI_{n}-A&-B\\C&D\end{pmatrix}}

.

Les racines dans le plan complexe des facteurs invariants de $R (s)$ (multiplicités prises en compte) sont appelés les zéros invariants (z.i.) du système. Ce sont des objets intrinsèques qui sont invariants par retour d'état, d'où leur nom.

Soit z un zéro invariant. Son ordre q se définit comme étant le degré maximal des diviseurs élémentaires de $R (s)$ multiples du polynôme $s-z\in \mathbb {C} \left[s\right]$ .

Les conditions suivantes sont équivalentes[7] :

le nombre complexe z est un zéro invariant du système, d'ordre supérieur ou égal à q ;
il existe un état initial $x_{0}$ et une commande $u(t)=u_{0}t^{q-1}e^{zt}$ , $u_{0}\neq 0$ , pour lesquels la sortie y est identiquement nulle.

Zéros du système

Les zéros du système (z.s.) sont définis par la relation[5]

\left\{z.s.\right\}=\left\{z.t.\right\}{\dot {\cup }}\left\{m.c.\right\}

où $\left\{z.t.\right\}$ est l'ensemble des zéros de transmission (contrairement aux zéros invariants, ces derniers ne sont pas invariants par retour d'état). On montre que[6]^,[4],

\left\{z.t.\right\}{\dot {\cup }}\left\{z.d.e.s.\right\}\subset \left\{z.i.\right\}\subset \left\{z.s.\right\}

la première (resp. la seconde) inclusion devenant une égalité dans le cas d'un système minimal (resp. ayant une matrice de transfert carrée et régulière).

Dualité

Les propriétés de commandabilité et d'observabilité sont duales, de même que les propriétés de stabilisabilité et de détectabilité, dans le sens suivant : $(C, A)$ est observable (resp. détectable) si, et seulement si $(t A, t C)$ est commandable (resp. stabilisable).

Passage à la fonction de transfert : exemple

Comme il est dit ci-dessus, les parties non commandables et/ou non observables disparaissent dans les représentations par fonction de transfert (c'est en cela que les pôles et zéros correspondants sont des modes cachés). Voici un exemple illustratif.

Considérons les systèmes $S_{1}$ et $S_{2}$ correspondants aux équations différentielles suivantes :

S_{1}:{\dot {y}}+y=u

S_{2}:{\ddot {y}}-y={\dot {u}}-u

Le système $S_{1}$ possède la forme d'état suivante :

S_{1}:{\begin{cases}{\dot {x}}=-x+u\\y=x\end{cases}}

Ce système est minimal.

Le système $S_{2}$ peut se mettre sous forme d'état comme suit :

S_{2}:{\begin{cases}{\begin{bmatrix}{\dot {x}}\\{\ddot {x}}-{\dot {u}}\end{bmatrix}}={\begin{bmatrix}0&1\\1&0\end{bmatrix}}{\begin{bmatrix}x\\{\dot {x}}-u\end{bmatrix}}+{\begin{bmatrix}1\\-1\end{bmatrix}}u\\y={\begin{bmatrix}1&0\end{bmatrix}}{\begin{bmatrix}x\\{\dot {x}}-u\end{bmatrix}}\end{cases}}

Le calcul de la matrice de commandabilité $\Gamma$ conduit au résultat suivant:

\Gamma ={\begin{bmatrix}B&AB\end{bmatrix}}={\begin{bmatrix}1&-1\\-1&1\end{bmatrix}}

Le rang de cette matrice est égal à 1. Puisque le système est d'ordre $2$ , il n'est pas commandable.

Néanmoins, les deux systèmes, bien que différents, ont la même fonction de transfert (avec $s$ la variable de Laplace):

S_{1}:{\xrightarrow {\mathcal {L}}}:{\frac {Y(s)}{U(s)}}={\frac {1}{s+1}}

S_{2}:{\xrightarrow {\mathcal {L}}}:{\frac {Y(s)}{U(s)}}={\frac {s-1}{s^{2}-1}}={\frac {s-1}{(s+1)(s-1)}}={\frac {1}{s+1}}

Ce sont les simplifications des pôles non commandables par des zéros (de découplage en entrée) qui fait que la représentation par fonction de transfert ne permet pas de refléter toutes les propriétés structurelles du système.

Discrétisation

On peut discrétiser à une période d'échantillonnage $T$ un système linéaire stationnaire à temps continu $\Sigma$ tel que celui ci-dessus, de manière à former un système linéaire stationnaire à temps discret $\Sigma _{d}$ . L'état $x_{d}={\mathfrak {D}}(x)$ et la sortie $y_{d}={\mathfrak {D}}(y)$ de $\Sigma _{d}$ sont les suites définies par les relations $x_{d}(k)=x(kT^{+})$ , $y_{d}(k)=y(kT^{+})$ . La commande discrète $u_{d}$ de $\Sigma _{d}$ est une suite de nombres calculés par un calculateur numérique fonctionnant en temps réel. Ces valeurs font l'objet d'un blocage ${\mathfrak {B}}$ tel que ${\mathfrak {B}}(u_{d})$ est une commande à temps continu $u$ vérifiant ${\mathfrak {D}}(u)=u_{d}.$ La commande bloquée $u_{d}$ est l'entrée de $\Sigma$ . Le type de bloqueur le plus simple, et aussi le plus répandu, est le bloqueur d'ordre zéro : il consiste à définir $u$ par $u(t)=u_{d}(k)$ pour $kT\leq t<(k+1)T$ . La commande $u$ qui en résulte est donc une fonction en escalier. Pour obtenir l'équation d'état de $\Sigma _{d}$ , il suffit d'intégrer celle de $\Sigma$ entre $kT$ et $(k+1)T$ et on montre que[4]

\left\{{\begin{array}{c}x_{d}(k+1)=A_{d}x_{d}(k)+B_{d}u_{d}(k)\\y_{d}(k)=Cx_{d}(k)+Du_{d}(k)\end{array}}\right.

avec

A_{d}=e^{AT},B_{d}=\int _{0}^{T}{\rm {e}}^{At}B\,\mathrm {d} t

ou sous une forme plus compacte

{\begin{pmatrix}A_{d}&B_{d}\\0&I_{m}\end{pmatrix}}=\exp \left\{{\begin{pmatrix}A&B\\0&0\end{pmatrix}}T\right\}

.

Pour que $\Sigma _{d}$ soit commandable (resp. observable) il faut que $\Sigma$ le soit, et si cette condition est satisfaite, il suffit que, de plus, la matrice d'état $A$ de $\Sigma$ n'ait pas de valeurs propres $\lambda _{1}$ , $\lambda _{2}$ telles que $\lambda _{1}-\lambda _{2}={\frac {2k\pi i}{T}},k\neq 0$ . On en déduit un théorème analogue au théorème de l'échantillonnage, mais s'appliquant aux systèmes[4].

Les valeurs propres de la matrices d'état $A_{d}$ sont les pôles du système $\Sigma _{d}$ . Une condition nécessaire et suffisante pour que ce système soit asymptotiquement stable (ou, de manière équivalente, exponentiellement stable) est que ces pôles aient tous un module strictement inférieur à 1. Cette condition est satisfaite si, et seulement si $\Sigma$ est exponentiellement stable.

Les différentes sortes de pôles et de zéros d'un système linéaire stationnaire se définissent dans le cas du temps discret d'une manière analogue, mutatis mutandis, à ce qui a été indiqué plus haut pour les systèmes à temps continu.

Formalisme

Nous ne traiterons, très brièvement, que le cas des systèmes linéaires instationnaires à temps continu. Un tel système a une équation d'état et une équation d'observation qui ont la même forme qu'un système linéaire stationnaire, mais avec des matrices $A$ , $B$ , $C$ et $D$ qui appartiennent cette fois à un anneau ou un corps différentiel $\mathbf {K}$ . Un tel système admet également une fonction de transfert. Cet anneau (supposé intègre et commutatif) ou ce corps (supposé commutatif) est muni de la dérivation usuelle $a\mapsto {\dot {a}}$ (deux exemples classiques sont ceux où $\mathbf {K} =\mathbb {C} \left[t\right]$ et $\mathbf {K} =\mathbb {C} (t)$ ). Soit $\mathbf {D} =\mathbf {K} \left[\partial \right]$ , avec $\mathbf {\partial =} {\frac {d}{dt}}$ , l'anneau des polynômes gauches en $\partial$ à coefficients dans $\mathbf {K}$ . Si $f$ est une variable, on a d'après la règle de Leibniz $\mathbf {\partial } (af)={\dot {a}}f+a\partial f$ , et puisque ceci est vrai quelle que soit $f$ on a sur $\mathbf {D}$ la règle de commutation

\mathbf {\partial } a-a\partial ={\dot {a}}

L'anneau $\mathbf {D}$ , muni de cette règle, est un anneau d'Ore non commutatif, qui est simple et principal lorsque $\mathbf {K}$ est un corps [8].

Commandabilité

La commandabilité d'un tel système se définit comme dans le cas stationnaire. Un critère de commandabilité, analogue à celui de Kalman, a été donné par Silverman et Meadows[9] lorsque $\mathbf {K} ={\mathcal {O}}({\mathcal {I}})$ , l'anneau des fonctions analytiques réelles sur un intervalle ouvert non vide ${\mathcal {I}}$ de la droite réelle: soit

\Gamma =\left[{\begin{array}{cccc}P_{0}\quad \vdots \ &P_{1}\quad \vdots \ &\cdots \quad \vdots &P_{n-1}\end{array}}\right]

avec

P_{0}=B,\quad P_{i+1}=\left(A-{\frac {d}{dt}}I_{n}\right)P_{i},\quad 1\leq i\leq n-2

.

Une condition nécessaire et suffisante pour que le système soit commandable est qu'il existe un sous-ensemble discret $S$ de ${\mathcal {I}}$ tel que le rang sur $\mathbb {R}$ de $\Gamma$ soit égal à la dimension $n$ de l'espace d'état pour tout $t\in {\mathcal {I}}\backslash S$ .

Considérons par exemple le système dont les matrices d'état et de commande sont, respectivement,

A={\begin{pmatrix}0&1\\-1&0\end{pmatrix}},\quad B={\begin{pmatrix}\cos \sigma \\-\sin \sigma \end{pmatrix}}.

Si $\sigma$ est un paramètre constant quelconque, la matrice de commandabilité est

\Gamma ={\begin{pmatrix}\cos \sigma &-\sin \sigma \\-\sin \sigma &-\cos \sigma \end{pmatrix}}

,

son déterminant vaut $-1$ et le système (stationnaire) est donc commandable. En revanche, si $σ = t$ , la matrice de commandabilité est

\Gamma ={\begin{pmatrix}B&\vdots \quad \left(A-{\frac {d}{dt}}I_{2}\right)B\end{pmatrix}}={\begin{pmatrix}\cos t&0\\-\sin t&0\end{pmatrix}}

et le système (instationnaire) est non commandable.

Observabilité et dualité

L'observabilité se définit comme dans le cas stationnaire. On obtient une condition nécessaire et suffisante d'observabilité en passant au système dual. Il est défini par les équations[8]

\left\{{\begin{array}{c}-{\dfrac {d{\breve {x}}}{dt}}=A^{T}{\breve {x}}+C^{T}{\breve {u}}\\{\breve {y}}=B^{T}{\breve {x}}+D^{T}{\breve {u}}\end{array}}\right.

Un système linéaire coïncide donc avec son "bidual", et il est observable si, et seulement si son dual est commandable[9].

Stabilité

La stabilité d'un système linéaire instationnaire peut s'étudier par des méthodes purement analytiques[10] qui fournissent des conditions suffisantes ou nécessaires de stabilité exponentielle. On peut aussi, par des méthodes issues de l’analyse algébrique et de l'algèbre différentielle (en) (théorie de Picard-Vessiot (en)) définir les pôles d'un système instationnaire (sous certaines conditions portant sur le corps différentiel auquel appartiennent les coefficients des matrices de ce système) qui fournissent une condition nécessaire et suffisante de stabilité exponentielle analogue à celle indiquée plus haut pour les systèmes linéaires stationnaires[8].

Systèmes non linéaires

Représentations des systèmes non linéaires

Commençons par les représentations classiques. Une représentation d'état d'un système non linéaire est de la forme

{\begin{cases}{\dot {x}}&=f(x,u,t)\\y&=h(x,u,t))\end{cases}}

où comme précédemment $x$ est le vecteur d'état, $y$ le vecteur de sortie et $u$ le vecteur d'entrée. Ces variables sont définies sur un intervalle ouvert non vide ${\mathcal {I}}$ de la droite réelle. Nous supposerons que $x(t)\in \mathbf {X} ^{\prime },u(t)\in \mathbf {U} ,y(t)\in \mathbf {Y}$ , $\forall t\in {\mathcal {I}}$ où $\mathbf {X} ^{\prime },\mathbf {U}$ et $\mathbf {Y}$ sont des ouverts non vides de $\mathbb {R} ^{n},\mathbb {R} ^{m}$ et $\mathbb {R} ^{p}$ , respectivement.

La première équation représente l'équation d'évolution et la seconde l'équation d'observation. La représentation d'état linéaire décrite précédemment est un cas particulier de cette forme, obtenu lorsque les fonctions $f$ et $h$ sont linéaires par rapport à $(x, u)$ .

La représentation d'état ci-dessus n'est pas unique, car elle n'est pas intrinsèque. En effet, considérons le changement de variable $z=\eta (x)$ où $η$ est un difféomorphisme de $\mathbf {X} ^{\prime }$ dans l'ouvert $\mathbf {X} ^{\prime \prime }$ de $\mathbb {R} ^{n}$

On obtient :

{\dot {z}}={\dot {x}}\left({\frac {\partial \eta }{\partial x}}\right)_{x=\eta ^{-1}(z)}

, que l'on note

{\frac {\partial \eta }{\partial x}}{\dot {x}}

par la suite. D'où :

{\dot {z}}={\frac {\partial \eta }{\partial x}}f(x,u,t)

On peut alors récrire notre système en tenant compte du changement de variable :

{\begin{cases}{\dot {z}}&={\frac {\partial \eta }{\partial x}}f(\eta ^{-1}(z),u,t)\\y&=h(\eta ^{-1}(z),u,t)\end{cases}}

Pour obtenir une représentation intrinsèque, nous supposerons que $x=\varphi (\mathbf {x} )$ où $(\mathbf {X} ,\varphi ,n)$ est une carte d'une variété différentielle connexe ${\mathcal {X}}$ de dimension $n$ (avec $\mathbf {X} ^{\prime }=\varphi (\mathbf {X} )$ ) et, pour simplifier les écritures, nous poserons $u=\mathbf {u} ,y=\mathbf {y}$ en considérant $\mathbf {U}$ et $\mathbf {Y}$ en tant que variétés différentielles. Alors les deux premières équations se mettent sous la forme[11]

{\begin{cases}\mathbf {\dot {x}} =\mathbf {f} (\mathbf {x} ,\mathbf {u} ,t)\\\mathbf {y} =\mathbf {h} (\mathbf {x} ,\mathbf {u} ,t))\end{cases}}

Les deux équations obtenues après le changement de variable $z=\eta (x)$ se mettent également sous cette forme, car celui-ci n'est rien d'autre qu'un changement de carte. On a donc bien obtenu l'unicité de la représentation.

Exemple du pendule

L'exemple classique de système non linéaire est un pendule libre (il n'y a pas d'entrées, le pendule est livré à lui-même). L'équation différentielle régissant le pendule est la suivante :

ml{\ddot {\theta }}(t)=-mg\sin \theta (t)-kl{\dot {\theta }}(t)

où:

$\theta (t)$ est l'angle du pendule
$m$ est la masse du pendule (la masse de la tige est négligée)
$g$ est l'accélération gravitationnelle
$k$ est le coefficient de frottement au point de pivot
$l$ est le rayon du pendule (jusqu'au centre de gravité de la masse $m$ )

Les équations d'état sont :

{\dot {x_{1}}}(t)=x_{2}(t)

{\dot {x_{2}}}(t)=-{\frac {g}{l}}\sin {x_{1}}(t)-{\frac {k}{m}}{x_{2}}(t)

oùn:

$x_{1}(t)=\theta (t)$ est l'angle du pendule
$x_{2}(t)={\dot {x_{1}}}(t)$ est la vitesse angulaire du pendule
${\dot {x_{2}}}={\ddot {x_{1}}}$ est l'accélération angulaire du pendule

L'équation d'état peut être écrite ainsi :

{\dot {x}}(t)={\binom {{\dot {x_{1}}}(t)}{{\dot {x_{2}}}(t)}}=f(t,x(t))={\binom {x_{2}(t)}{-{\frac {g}{l}}\sin {x_{1}}(t)-{\frac {k}{m}}{x_{2}}(t)}}

Les points d'équilibre stationnaires d'un système sont définis par les points où ${\dot {x}}=0$ . Dans ce cas, les points qui satisfont ce critère pour le pendule sont :

{\binom {x_{1}}{x_{2}}}={\binom {n\pi }{0}}

pour tout n entier.

Commandabilité, observabilité

La commandabilité et l'observabilité d'un système non linéaire se définissent de la manière habituelle, déjà explicitée ci-dessus. La commandabilité s'étudie, dans le cas de systèmes affines en la commande, c'est-à-dire régis par une équation d'état de la forme

{\dot {x}}=f(x)+g(x)u=f(x)+\sum _{i=1}^{m}g_{i}(x)u_{i}

,

x(t)\in \mathbb {R} ^{n},u(t)\in \mathbb {R} ^{m}

(où $f$ et $g$ sont indéfiniment différentiables et $f (0) = 0$ ) grâce à outils mathématiques empruntés à la géométrie différentielle[12]. Soit $V_{1},V_{2}$ deux champs de vecteurs indéfiniment différentiables sur $\mathbb {R} ^{n},\left[V_{1},V_{2}\right]$ leur crochet de Lie, et définissons

ad_{V_{1}}^{0}(V_{2})=V_{2},\quad ad_{V_{1}}^{k}(V_{2})=[V_{1},ad_{V_{1}}^{k-1}(V_{2})],\quad k\in \{1,2,...\}

.

Soit les distributions[11]

G_{i}=\mathrm {span} \{ad_{f}^{k}(g_{j}):k\in \{0,2,...,i\},j\in \{1,2,...,m\}\}

où $\mathrm {span} \{.\}$ désigne l'espace vectoriel engendré par les vecteurs entre accolades. Il existe un voisinage ouvert $U$ de l'origine dans lequel le système est commandable si, et seulement si la distribution $G_{n-1}$ est de dimension $n$ [13]. Dans le cas où le système est linéaire, on retrouve le critère de Kalman. On peut du reste préciser que l'ensemble des états appartenant à $U$ accessibles dans à partir de l'origine est ${\mathcal {X}}_{c}=G_{n-1}\cap U$ [12].

D'autre part, il existe un bouclage linéarisant de la forme $u=\alpha (x)+\beta (x)v$ (c'est-à-dire qu'il existe un difféomorphisme $u=\eta$ tel que le système d'entrée $v$ et d'état $z=\eta (x)$ est linéaire) si, et seulement si (1) la condition ci-dessus est satisfaite et (2) la distribution $G_{n-2}$ est involutive (i.e., pour tous champs de vecteurs $V_{1},V_{2}\in G_{n-2}$ , le crochet de Lie $[V_{1},V_{2}]$ appartient à $G_{n-2}$ )[13]. Ce résultat est fondé, notamment, sur le théorème de Frobenius.

Il existe une condition nécessaire et suffisante d'observabilité locale pour le système ci-dessus lorsqu'il a une équation d'observation de la forme[12]

y=h(x)

.

Les systèmes plats (au sens de la platitude différentielle (en))[14]^,[15] sont des systèmes commandables, et observables vus de la sortie plate.

Stabilité

La stabilité des systèmes non linéaires s'étudie grâce à des fonctions de Lyapunov. Des stabilités de différents types existent: au sens de Lyapunov, asymptotique, exponentielle ; elles peuvent être locales ou globales, uniformes ou non, etc[16].

Notes et références

Notes

Kailath 1980
Kalman 1960, Kalman 1963
Wonham 1985
Bourlès 2010
Rosenbrock 1970
Bourlès et Fliess 1997
MacFarlane et Karkanias 1976
Bourlès et Marinescu 2011
Silverman et Meadows 1967
Rugh 1995
Spivak 1999
Isidori 1995
Slotine et Li 1991
Fliess, Lévine et Rouchon 1995
Sira Ramírez et Agrawal 2004
Hahn 1967

Références

(en) Thomas Kailath, Linear Systems, Prentice Hall, 1980, 682 p. (ISBN 0-13-536961-4)
(en) Henri Bourlès, Linear Systems, John Wiley & Sons, 2010, 544 p. (ISBN 978-1-84821-162-9 et 1-84821-162-7, lire en ligne)
(en) Henri Bourlès et Michel Fliess, « Finite poles and zeros of linear systems: an intrinsic approach », Int. J. Control, vol. 68, n^o 4,‎ 1997, p. 897-922
(en) Henri Bourlès et Bogdan Marinescu, Linear Time-Varying Systems : Algebraic-Analytic Approach, Springer, 2011, 638 p. (ISBN 978-3-642-19726-0 et 3-642-19726-4, lire en ligne)
(en) Michel Fliess, Jean Lévine et Pierre Rouchon, « Flatness and defect of nonlinear systems: Introductory theory and examples », Internat. J. Control, vol. 61,‎ 1995, p. 1327-1361
(en) Wolfgang Hahn, Stability of Motion, Springer, 1967, 446 p. (ISBN 3-540-03829-9)
(en) Alberto Isidori, Nonlinear Control Systems (3rd ed.), Berlin/Heidelberg/New York, Springer, 1995, 564 p. (ISBN 3-540-19916-0, lire en ligne)
(en) R.E. Kalman, « On the general theory of control systems », dans Proc. 1st IFAC Congress, Moscou, 1960
(en) R. E. Kalman, « Mathematical description of linear dynamical systems », SIAM J. Control, vol. 1,‎ 1963, p. 152-192
(en) A.G.J. MacFarlane et N. Karkanias, « Poles and zeros of linear multivariable systems: a survey of the algebraic, geometric and complex-variable theory », Int. J. Control, vol. 24, n^o 1,‎ 1976, p. 33-74
(en) Howard Rosenbrock, State-Space and Multivariable Theory, Nelson, 1970, 267 p. (ISBN 0-17-781002-5)
(en) Wilson Rugh, Linear System Theory (2nd ed.), Upper Saddle River (N. J.), Prentice Hall, 1995, 581 p. (ISBN 0-13-441205-2)
(en) Jean-Jacques E. Slotine et Weiping Li, Applied Nonlinear Control, Prentice-Hall, 1991, 461 p. (ISBN 0-13-040049-1)
(en) L. M. Silverman et H. E. Meadows, « Controllability and observability in time-variable linear systems », SIAM J. Control, vol. 5,‎ 1967, p. 64-73
(en) Hebertt J. Sira Ramírez et Sunil Kumar Agrawal, Differentially flat systems, Marcel Dekker, 2004, 467 p. (ISBN 0-8247-5470-0)
(en) Michael Spivak, (A Comprehensive Introduction to) Differential Geometry [détail des éditions], vol. 1, 1999
(en) W. Murray Wonham, Linear multivariable control : a geometric approach, New York/Berlin/Paris etc., Springer, 1985, 334 p. (ISBN 0-387-96071-6)

Voir aussi

Portail de l’électricité et de l’électronique
Portail des mathématiques

Cet article est issu de Wikipedia. Le texte est sous licence Creative Commons - Attribution - Partage dans les Mêmes. Des conditions supplémentaires peuvent s'appliquer aux fichiers multimédias.

[Kailath-1] Kailath 1980

[Kalman-2] Kalman 1960, Kalman 1963

[Wonham-3] Wonham 1985

[Bourlès-4] Bourlès 2010

[Rosenbrock-5] Rosenbrock 1970

[Bourlès-Fliess-6] Bourlès et Fliess 1997

[7] MacFarlane et Karkanias 1976

[Bourlès-Marinescu-8] Bourlès et Marinescu 2011

[Silverman-Meadows-9] Silverman et Meadows 1967

[10] Rugh 1995

[Spivak-11] Spivak 1999

[Isidori-12] Isidori 1995

[Slotine-13] Slotine et Li 1991

[14] Fliess, Lévine et Rouchon 1995

[15] Sira Ramírez et Agrawal 2004

[16] Hahn 1967