Contexte

La raison de cette publication est un
article ambigu
sur le principe de moindre action (IPA) , publié sur la ressource il y a quelques jours. Elle est ambiguë car son auteur sous une forme populaire tente de transmettre au lecteur l'un des principes fondamentaux d'une description mathématique de la nature, et il y réussit partiellement. Sinon pour un mais qui se cache à la fin de la publication. Sous le spoiler est une citation complète de ce passage
Problème de mouvement de ballePas si simple
En fait, j'ai un peu triché en disant que les corps bougent toujours de manière à minimiser l'action. Bien que cela soit vrai dans de nombreux cas, vous pouvez trouver des situations dans lesquelles l'action n'est clairement pas minimale.
Par exemple, prenez une balle et placez-la dans un espace vide. A une certaine distance de celui-ci, nous mettons une paroi élastique. Supposons que nous voulons que la balle soit au même endroit après un certain temps. Dans de telles conditions, le ballon peut se déplacer de deux manières différentes. Premièrement, il peut simplement rester en place. Deuxièmement, il peut être poussé vers le mur. La balle va voler contre le mur, rebondir et revenir. Il est clair que vous pouvez le pousser si vite qu'il revient exactement au bon moment.
Les deux variantes du mouvement de la balle sont possibles, mais l'action dans le deuxième cas se révélera plus, car pendant tout ce temps, la balle se déplacera avec une énergie cinétique non nulle.
Comment sauvegarder le principe de moindre action pour qu'il soit juste dans de telles situations? Nous en reparlerons la prochaine fois.
À mon avis, quel est donc le problème?
Le problème est que l'auteur, citant cet exemple, a commis un certain nombre d'erreurs fondamentales. Il est aggravé par le fait que la deuxième partie prévue, selon l'auteur, sera basée sur ces erreurs. Guidé par le principe de remplir la ressource d'informations fiables, je suis obligé de fournir une explication de ma position sur cette question plus en détail, et le format des commentaires pour cela ne suffit pas.
Cet article expliquera comment les mécaniques sont construites sur la base du PND, et tentera d'expliquer au lecteur que le problème posé par l'auteur de la publication citée est manquant.
1. Définition de l'action de Hamilton. Principe de moindre action
L'action de Hamilton est appelée fonctionnelle
S = i n t l i m i t s t 2 t 1 L l e f t ( m a t h b f q ( t ) , d o t m a t h b f q ( t ) r i g h t ) d t
où
L left( mathbfq(t), dot mathbfq(t) right)=T left( mathbfq(t), dot mathbfq(t) right)− Pi( mathbfq)
Est la fonction de Lagrange pour un système mécanique dans lequel (en omettant les arguments ci-dessous)
T est l'énergie cinétique du système; P - son énergie potentielle;
q (t) est le vecteur des coordonnées généralisées de ce système, qui est fonction du temps. on pense que les instants temporels t
1 et t
2 sont fixes.
Pourquoi la fonctionnalité, pas la fonction? Parce qu'une fonction, par définition, est une règle selon laquelle un nombre du domaine de définition (argument de fonction) est associé à un autre nombre du domaine de valeurs. Une fonction est différente en ce que l'argument n'est pas un nombre, mais une fonction entière. Dans ce cas, il s'agit de la loi de mouvement du système mécanique
q (t), définie au moins sur l'intervalle de temps entre t
1 et t
2 .
À long terme (et c'est un euphémisme!) Les travaux de mécaniciens (dont le magnifique Leonard Euler) nous ont permis de formuler
Principe de moindre action:Un système mécanique pour lequel la fonction Lagrange est spécifiée L left( mathbfq(t), dot mathbfq(t) right) , se déplace de telle manière que la loi de son mouvement q (t) délivre un minimum à la fonction
S= int limitst2t1L left( mathbfq(t), dot mathbfq(t) right)dt to min
appelé l'action de Hamilton.
Dès la définition même du PND, il résulte du fait que ce principe ne conduit à des équations de mouvement que pour une classe limitée de systèmes mécaniques. Pour quoi? Et découvrons-le.
2. Les limites d'applicabilité du principe de moindre action. Quelques définitions pour les plus petits
Comme il résulte de la définition, encore une fois, de la fonction de Lagrange, le PND permet d'obtenir des équations de mouvement pour les systèmes mécaniques, dont l'action de force est déterminée exclusivement par l'énergie potentielle. Afin de comprendre de quels systèmes nous parlons, nous donnerons plusieurs définitions, que, pour sauvegarder l'article, je mets sous le spoiler
Travail électrique en mouvementConsidérons un point se déplaçant le long de la trajectoire AB, auquel une force est appliquée
v e c F . Le déplacement infiniment petit d'un point le long de la trajectoire est déterminé par le vecteur
d v e c s tangente à la trajectoire.
Travail élémentaire de la force
v e c F en mouvement
d v e c s appelé une valeur scalaire égale à
d A = v e c F c d o t d v e c s
Ensuite, le travail complet de la force sur le déplacement du point le long de la trajectoire AB est une intégrale curviligne
A = i n t l i m i t s A B vecF cdotd vecs
Points d'énergie cinétiqueL'énergie cinétique d'un point T est le travail que les forces appliquées à un point de masse m doivent terminer pour convertir le point du mouvement au repos à une vitesse vecv
Nous calculons l'énergie cinétique selon cette définition. Que le point commence à passer d'un état de repos sous l'action des forces qui lui sont appliquées. Sur le segment de la trajectoire AB, il acquiert de la vitesse
vecv . Nous calculons le travail effectué par les forces appliquées au point, qui, selon le principe de l'indépendance des forces, nous remplaçons la résultante
vecFT=A= int limitsAB vecF cdotd vecs
Selon la deuxième loi de Newton
vecF=m veca=m fracd vecvdt
alors
T= int limitsAB vecF cdotd vecs=m int limitsAB fracd vecvdt cdotd vecs=m int limitsAB vecv cdotd vecv
Nous calculons le produit scalaire se tenant strictement sous le signe intégral, pour lequel nous différencions dans le temps le produit scalaire du vecteur vitesse par lui-même
fracddt( vecv cdot vecv)= fracd vecvdt cdot vecv+ vecv cdot fracd vecvdt=2 vecv cdot fracd vecvdt quad(1)
D'un autre côté
vecv cdot vecv=v2
En différenciant cette égalité dans le temps, nous avons
fracddt( vecv cdot vecv)= fracddt(v2)=2v fracdvdt quad(2)
En comparant (1) et (2), nous concluons que
vecv cdotd vecv=vdv
Ensuite, nous calculons calmement le travail, révélant l'intégrale curviligne à travers une définie, en prenant le module de vitesse du point au début et à la fin de la trajectoire comme limites
T=m int limitsAB vecv cdotd vecv=m int limitsv0vdv= fracmv22
Forces conservatrices et points d'énergie potentielsConsidérez la force agissant sur un point, et telle que l'amplitude et la direction de cette force dépendent uniquement de la position du point dans l'espace
vecF= vecF(x,y,z) quad(3)
Laissez le point se déplacer dans l'espace le long d'une trajectoire arbitraire AB. Nous calculons le travail que fera la force (3)
A= int limitsAB vecF cdotd vecs= int limitsAB left(Fxdx+Fydy+Fzdz right)
Puisque la projection de la force sur l'axe des coordonnées dépend exclusivement de ces mêmes coordonnées, vous pouvez toujours trouver la fonction
U=U(x,y,z)
tel que
Fx= frac partialU partialx, quadFy= frac partialU partialy, quadFz= frac partialU partialz
Ensuite, l'expression de l'œuvre est convertie en
A= int limitsAB left( frac partialU partialxdx+ frac partialU partialydy+ frac partialU partialzdz right)= int limitsUBUAdU=UB−UA
où
UA,UB Sont les valeurs de la fonction U (x, y, z) aux points A et B, respectivement. Ainsi, le travail de la force que nous considérons ne dépend pas de la trajectoire du point, mais n'est déterminé que par les valeurs de la fonction U au début et à la fin de la trajectoire. Une telle force est appelée
force conservatrice et la fonction correspondante U (x, y, z) est appelée fonction de force. De toute évidence,
vecF= nablaU , ainsi que l'égalité à zéro du travail de la force conservatrice lors du déplacement sur un chemin fermé. On dit également que la fonction U (x, y, z) définit un champ de force dans l'espace.
Énergie potentielle Pi= Pi(x,y,z) les points dans l'espace avec un champ de force donné sont appelés le travail des forces externes qui leur sont appliquées, qu'ils effectuent lorsqu'ils déplacent le point vers une position dans l'espace spécifiée par les coordonnées (x, y, z) à partir d'une position arbitraire sélectionnée comme point de référence du niveau d'énergie potentiel .
Choisissons un point arbitraire O situé entre les points A et B sur la trajectoire du point considéré plus haut. On suppose que l'énergie potentielle est nulle au point O. Ensuite, par définition
PiA=−(UA−UO)
Est l'énergie potentielle du point en position A, et
PiB=−(UB−UO)
- l'énergie potentielle du point en position B. Compte tenu de tout ce qui précède, nous calculons à nouveau le travail des forces potentielles lors du déplacement du point A au point B
AAB=AAO+AOB=UO−UA+UB−UO=(UO−UA)−(UO−UB)= PiA− PiB
Ainsi, le travail des forces conservatrices est égal à la variation de l'énergie potentielle d'un point pris avec le signe opposé
AAB= PiA− PiB=−( PiB− PiA)=− Delta Pi
de plus, le choix du niveau auquel nous considérons l'énergie potentielle égale à zéro n'affecte pas du tout le résultat. Nous pouvons en conclure que le niveau de référence de l'énergie potentielle peut être choisi de manière complètement arbitraire.
3. Le concept de variations de coordonnées généralisées. Énoncé du problème variationnel
Nous considérons donc maintenant un système mécanique se déplaçant sous l'action de forces potentielles, dont la position est uniquement déterminée par le vecteur de coordonnées généralisées
mathbfq= left[q1,q2, dots,qs right]T quad(4)
où
s est le nombre de degrés de liberté d'un système donné.
Réelle,
mais encore inconnue de nous , la loi de mouvement de ce système est déterminée par la dépendance des coordonnées généralisées (4) au temps. Considérons l'une des coordonnées généralisées
qi=qi(t) , en supposant un raisonnement similaire pour toutes les autres coordonnées.
Figure 1. Mouvement réel et détourné d'un système mécaniqueDans la figure, la dépendance
qi(t) représenté par une courbe rouge. Nous choisissons deux instants de temps fixes arbitraires t
1 et t
2 , en réglant t
2 > t
1 . Position du système
mathbfq1= mathbfq(t1) nous convenons d'appeler la position initiale du système, et
mathbfq2= mathbfq(t2) - la position finale du système.
Cependant, j'insiste encore une fois pour que le texte suivant soit lu attentivement!
Malgré le fait que nous fixions la position initiale et finale du système, ni la première position ni la seconde ne nous sont inconnues à l'avance! Ainsi que la loi inconnue du mouvement du système! Ces dispositions sont considérées précisément comme la position initiale et finale, quelles que soient les significations spécifiques.
De plus, nous pensons que de la position initiale au système final peut venir de différentes manières, c'est-à-dire la dépendance
mathbfq= mathbfq(t) peut être cinématiquement possible. Le mouvement réel du système existera dans une seule variante (courbe rouge), les variantes cinématographiques restantes seront appelées
mouvements de rond-point mathbfq∗= mathbfq∗(t) (courbe bleue sur la figure). Différence entre réel et rond-point
deltaqi(t)=q∗i(t)−qi(t), quad foralli= overline1,s quad(5)
sera appelé
variations isochrones de coordonnées généraliséesDans ce contexte, les variations (5) doivent être comprises comme des fonctions infinitésimales exprimant la déviation du rond-point par rapport au réel. Le petit «delta» pour la désignation n'a pas été choisi par hasard et souligne la différence fondamentale entre la variation et le différentiel de fonction. La différentielle est la partie linéaire principale de l'incrément de fonction provoqué par l'incrément d'argument. En cas de variation, un changement dans la valeur d'une fonction
avec une valeur constante de l'argument est provoqué par un changement dans la forme de la fonction elle-même! Nous ne faisons pas varier l'argument dans le rôle du temps; par conséquent, la variation est appelée isochrone. On fait varier la règle selon laquelle chaque valeur de temps est mise en correspondance avec une certaine valeur de coordonnées généralisées!
En fait, nous faisons varier la loi du mouvement, selon laquelle le système de l'état initial passe à l'état final. L'état initial et final sont déterminés par la loi réelle du mouvement, mais j'insiste encore une fois sur le fait que nous ne connaissons pas leurs valeurs spécifiques et qu'ils peuvent être cinématiquement possibles, nous pensons seulement qu'ils existent et que le système est garanti de passer d'une position à une autre! Dans la position initiale et finale du système, nous ne faisons pas varier la loi du mouvement, par conséquent, les variations des coordonnées généralisées dans la position initiale et finale sont égales à zéro
deltaqi(t1)= deltaqi(t2)=0, quad foralli= overline1,s quad(6)
Sur la base du principe de moindre action, le mouvement réel du système doit être tel qu'il fournisse un minimum de fonctionnalités d'action. La variation des coordonnées entraîne un changement dans le fonctionnement de l'action. Une condition nécessaire pour que la fonctionnelle atteigne une valeur extrême est l'égalité à zéro de sa variation
deltaS= delta int limitst2t1L(q1, dots,qs, dotq1, dots, dotqs)dt=0 quad(7)
4. La solution du problème variationnel. Équations de Lagrange du 2e type
Résolvons notre problème variationnel, pour lequel nous calculons la variation complète de l'action fonctionnelle et l'assimilons à zéro
\ begin {align} \ delta S = & \ int \ limits_ {t_1} ^ {t2} \, L (q_1 + \ delta q_1, \ dots, q_s + \ delta q_s, \, \ dot q_1 + \ delta \ dot q_1, \ dots, \ dot q_s + \ delta \ dot q_s) \, dt - \\ & - \ int \ limits_ {t_1} ^ {t2} \, L (q_1, \ dots, q_s, \, \ dot q_1, \ dots, \ dot q_s) \, dt = 0 \ end {align}
Poussons tout sous une seule intégrale, et puisque toutes les opérations sur des quantités infinitésimales sont valables pour les variations, nous transformons ce crocodile sous la forme
int limitst2t1 left[ sum limitssi=1 frac partialL partialqi deltaqi+ sum limitssi=1 frac partialL partial dotqi delta dotqi right]dt=0 quad(8)
Basé sur la définition de la vitesse généralisée
delta dotqi= fracd( deltaqi)dt
Puis l'expression (8) est transformée en la forme
int limitst2t1 left[ sum limitssi=1 frac partialL partialqi deltaqidt+ sum limitssi=1 frac partialL partial dotqid( deltaqi) right]=0
Le deuxième terme est intégré en plusieurs parties
sum limitssi=1 frac partialL partial dotqi deltaqi|t2t1+ int limitst2t1 left[ sum limitssi=1 frac partialL partialqi deltaqi− sum limitssi=1 fracddt gauche( frac partielL partiel dotqi droite) deltaqi droite]dt=0 quad(10)
Sur la base de la condition (7), nous avons
sum limitssi=1 frac partialL partial dotqi deltaqi|t2t1=0
alors nous obtenons l'équation
int limitst2t1 left[ sum limitssi=1 left( frac partialL partialqi− fracddt left( frac partialL partial dotqi right) right) deltaqi right]dt=0
Pour des limites d'intégration arbitraires, la disparition d'une certaine intégrale est assurée par la disparition de l'intégrande
sum limitssi=1 left[ frac partialL partialqi− fracddt left( frac partialL partial pointqi droite) droite] deltaqi=0 quad(11)
Étant donné que les variations des coordonnées généralisées sont indépendantes, (11) n'est valable que si tous les coefficients des variations sont égaux à zéro, c'est-à-dire
frac partialL partialqi− fracddt left( frac partialL partial dotqi right)=0, quad foralli= overline1,s
Personne ne nous dérange pour multiplier chacune des équations par (-1) et obtenir une notation plus familière
fracddt left( frac partialL partial dotqi right)− frac partialL partialqi=0, quad foralli= overline1,s quad(12)
Les équations (12) sont la solution au problème . Et à ce stade, l'attention est une fois de plus - résoudre le problème variationnel par le principe de la moindre action, ce n'est
pas une fonction qui fournit un minimum à l'action hamiltonienne,
mais un système d'équations différentielles, en résolvant quelle fonction peut être trouvée . Dans ce cas, il s'agit d'une équation différentielle de Lagrange de second ordre écrite en termes de fonction de Lagrange, c'est-à-dire dans la formulation des systèmes mécaniques conservateurs.
Et voilà,
le principe de moindre action s'arrête là , et la théorie des équations différentielles ordinaires commence, qui, en particulier, déclare que la solution de l'équation (12) est une fonction vectorielle de la forme
mathbfq= mathbfq(t,C1,C2, dots,C2s)
où C
1 , ..., C
2 sont des constantes d'intégration arbitraires.
De cette façon
Le PND est un principe fondamental qui permet d'obtenir les équations de mouvement d'un système pour lequel la fonction de Lagrange est définie
Un point! Dans les problèmes de mécanique analytique, les calculs ci-dessus n'ont plus besoin d'être effectués, il suffit d'utiliser leur résultat (12). Une fonction qui satisfait à l'équation (12) est la loi de mouvement d'un système qui satisfait PND.
5. Le problème avec le ballon et le mur
Revenons maintenant à la tâche avec laquelle tout a commencé - à propos du mouvement unidimensionnel d'une balle près d'une paroi absolument élastique. Bien sûr, pour ce problème, on peut obtenir des équations de mouvement différentielles.
Comme ce sont des équations de mouvement différentielles, toutes, je le souligne, n'importe laquelle de leurs solutions offre un minimum d'action fonctionnelle, ce qui signifie que le PND est exécuté! La solution générale des équations de mouvement de la balle peut être représentée sous la forme du soi-disant
portrait de phase du système mécanique considéré. Ce portrait de phase
Figure 2. Portrait de phase du système dans le problème de la balleLes coordonnées de la balle sont tracées sur l'axe horizontal et la projection de la vitesse sur l'axe x sur l'axe vertical. Cela peut sembler étrange, mais ce dessin reflète toutes les trajectoires de phase possibles de la balle, dans toutes les conditions initiales ou, si vous le souhaitez, aux limites. En fait, il y a une infinité de lignes parallèles sur le graphique, le dessin en montre certaines et la direction du mouvement le long de la trajectoire de phase.
Il s'agit d'une solution générale à l'équation du mouvement de la balle. Chacune de ces trajectoires de phase fournit un minimum de la fonction d'action, qui découle directement des calculs effectués ci-dessus.
Que fait l'auteur de la tâche? Il dit: ici la balle est au repos, et pour la période de temps de t
A à t
B l' action est nulle. Si la balle est poussée contre le mur, alors dans la même période, l'action sera plus grande, car la balle a une énergie cinétique non nulle et inchangée. Mais pourquoi la balle se déplace-t-elle vers le mur, car au repos l'action sera moindre? PND connaît donc des problèmes et ne fonctionne pas! Mais nous allons certainement résoudre ce problème dans le prochain article.
Ce que l'auteur dit est un non-sens. Pourquoi?
Oui, car il compare des actions sur différentes branches d'une même trajectoire de phase réelle! Pendant ce temps, lors de l'application du PND, l'action sur la trajectoire réelle et sur de nombreuses trajectoires de rond-point est comparée.
Autrement dit, l'action sur la trajectoire réelle est comparée à l'action sur les trajectoires qui ne sont pas dans la nature, et ne le seront jamais!Je ne comprends pas? Je l'expliquerai encore plus intelligiblement. Considérez l'état de repos. Il est décrit par une branche d'un portrait de phase coïncidant avec l'axe des abscisses. La coordonnée ne change pas avec le temps. C'est un vrai mouvement. Et quel genre de mouvement sera rond-point. Toute autre cinématique possible. Par exemple, de petites vibrations de balle près de la position de repos que nous envisageons. Le problème permet-il à la balle d'osciller le long de l'axe x? Suppose qu'un tel mouvement est cinématiquement possible et peut être considéré comme l'un des ronds-pointsPourquoi le ballon reste-t-il encore? Oui, car l'action au repos, calculée sur une période de temps fixe de t A à tB , il y aura moins d'action, avec de petites fluctuations dans la même période de temps. Cela signifie que la nature préfère la paix aux vibrations et à toute autre "agitation" de la balle. En pleine conformité avec l'IPA.Disons que nous avons poussé le ballon vers le mur. Poussons-la comme l'auteur le souhaite, à une vitesse choisie parmi les conditions aux limites, de sorte qu'à l'instant t B la balle soit dans la même position d'où elle est partie. La balle, à vitesse constante, atteint le mur, rebondit élastiquement et revient à sa position initiale à l'instant t B , toujours à vitesse constante. Ok, c'est un vrai mouvement. Quel mouvement sera l'un des ronds-points? Par exemple, si la balle se rapproche et s'éloigne du mur à une vitesse qui change avec le temps. Un tel mouvement est-il cinématiquement possible? C'est possible.
Pourquoi le module de vitesse de balle ne change-t-il pas? Oui, car l'action sur une telle trajectoire de phase aura une valeur minimale, par rapport à toute autre option, où la vitesse dépend du temps.C’est tout.
Rien de si magique ne se passe ici. IPA fonctionne sans aucun problème.Conclusions et souhaits
Le PND est une loi fondamentale de la nature. De là, en particulier, les lois de la mécanique découlent, par exemple, des équations différentielles du mouvement (12). PND nous dit que la nature est structurée de sorte que l'équation du mouvement d'un système mécanique conservateur ressemble exactement à l'expression (12) et à rien d'autre. On ne lui en demande pas plus.Pas besoin d'inventer des problèmes là où ils ne le sont pas.