🚐 🔨 🤙🏼 Kalman-Filter zur Minimierung des Entropiewertes eines zufälligen Fehlers mit einer nicht-Gaußschen Verteilung 🕵️ 🖖 ➡️

Einführung

Bei Habr wurde in den folgenden Veröffentlichungen eine mathematische Beschreibung des Betriebs des Kalman-Filters und seiner Anwendungsmerkmale berücksichtigt [1 ÷ 10]. In der Veröffentlichung [2] wurde der Algorithmus des Kalman-Filters (FC) im Modell des „Zustandsraums“ in einer einfachen und verständlichen Form betrachtet. Es sollte beachtet werden, dass die Untersuchung von Steuerungs- und Managementsystemen im Zeitbereich unter Verwendung von Zustandsvariablen in letzter Zeit aufgrund der einfachen Analyse in großem Umfang verwendet wurde [11].

Die Veröffentlichung [8] ist speziell für die Ausbildung von großem Interesse. Die methodische Technik des Autors ist sehr effektiv. Er begann seinen Artikel mit der Betrachtung der Verteilung des zufälligen Gaußschen Fehlers, berücksichtigte den FC-Algorithmus und endete mit einer einfachen iterativen Formel zur Auswahl der FC-Verstärkung. Der Autor beschränkte sich auf eine Betrachtung der Gaußschen Verteilung unter Berufung auf die Tatsache, dass für ausreichend große

$n$ (Mehrfachmessungen) Das Verteilungsgesetz der Summe der Zufallsvariablen tendiert zur Gaußschen Verteilung.

Theoretisch ist eine solche Aussage sicherlich richtig, aber in der Praxis kann die Anzahl der Messungen an jedem Punkt im Bereich nicht sehr groß sein. Kalman RE selbst erhielt Ergebnisse zur minimalen Kovarianz des Filters basierend auf orthogonalen Projektionen, ohne anzunehmen, dass die Messfehler Gaußsch sind [12].

Der Zweck dieser Veröffentlichung ist es, die Fähigkeiten des Kalman-Filters zu untersuchen, um den Entropiewert eines zufälligen Fehlers mit einer nicht-Gaußschen Verteilung zu minimieren.
Um die Wirksamkeit des Kalman-Filters bei der Identifizierung des Verteilungsgesetzes oder einer Überlagerung von Gesetzen aus experimentellen Daten zu bewerten, verwenden wir die Informationstheorie von Messungen, die auf der Informationstheorie von C. Shannon basieren, wonach Informationen wie eine physikalische Größe gemessen und bewertet werden können.

Der Hauptvorteil des Informationsansatzes zur Beschreibung von Messungen besteht darin, dass die Größe des Entropieintervalls der Unsicherheit für jedes Verteilungsgesetz streng mathematisch ermittelt werden kann. Dies beseitigt die historisch entwickelte Willkür, die bei der freiwilligen Zuweisung verschiedener Werte der Konfidenzwahrscheinlichkeit unvermeidlich ist. Dies ist besonders wichtig im Bildungsprozess, wenn der Schüler bei der Anwendung der Kalman-Filterung auf eine bestimmte numerische Stichprobe eine Abnahme der Messunsicherheit beobachten kann [13, 14].

Darüber hinaus kann die Kombination der Wahrscheinlichkeits- und Informationseigenschaften der Stichprobe die Art der Verteilung des Zufallsfehlers genauer bestimmen. Dies wird durch eine umfangreiche Datenbank mit numerischen Werten von Parametern wie dem Entropiekoeffizienten und dem Gegenüberschuss für verschiedene Verteilungsgesetze und deren Überlagerung erklärt.

Bewertung der Überlagerung der Verteilungsgesetze einer Zufallsvariablen durch den Entropiekoeffizienten und den Gegenüberschuss (erhalten aus experimentellen Daten)

Wahrscheinlichkeitsverteilungsdichte für jede Spalte des Histogramms [14] breit

$d$ ist gleich

$p_ {i} (x_ {i}) = n_ {i} / (n \ cdot d)$ daher ist die Schätzung der Entropiewahrscheinlichkeiten definiert als

$H \ left (x \ right) = \ int _ {- \ infty} ^ {+ \ infty} p \ left (x \ right) \ ln p \ left (x \ right) dx$ beim Finden der Entropie durch das Histogramm von

$m$ Spalten erhalten wir das Verhältnis:

$\ displaystyle H \ left (x \ right) = - \ sum_ {i = 1} ^ {m} \ int _ {\ tilde {x_ {i}} - \ frac {d} {2}} ^ {\ tilde { x_ {i}} + \ frac {d} {2}} \ frac {n_ {i}} {nd} \ ln \ frac {n_ {i}} {nd} = \ sum_ {i = 1} ^ {m } \ frac {n_ {i}} {n} \ ln \ frac {n} {n_ {i}} + \ ln d$

Wir präsentieren den Ausdruck zur Schätzung der Entropie in folgender Form:

$H \ left (x \ right) = \ ln \ left [d \ prod_ {i = 1} ^ {m} \ left (\ frac {n} {n_ {i}} \ right) ^ {\ frac {n_ {i}} {n}} \ right]$

Wir erhalten einen Ausdruck zum Schätzen des Entropiewertes einer Zufallsvariablen:

$\ Delta _ {e} = \ frac {1} {2} e ^ {H \ left (x \ right)} = \ frac {dn} {2} 10 ^ {- \ frac {1} {n} \ sum_ {1} ^ {m} n_ {i} \ lg n_ {i}}$

Die Klassifizierung der Verteilungsgesetze erfolgt auf einer Ebene in den Koordinaten des Entropiekoeffizienten

$k = \ frac {\ Delta _ {e}} {\ sigma}$ und Gegenüberschuss

$\ psi = \ frac {\ sigma ^ {2}} {\ sqrt {\ mu _ {4}}}$ wo

$\ mu _ {4} = \ frac {1} {n} \ sum_ {1} ^ {n} \ left (x_ {i} - \ bar {X} \ right) ^ {4}$ .

Für alle möglichen Verteilungsgesetze variiert \ psi von 0 bis 1 und k von 0 bis 2,066, sodass jedes Gesetz durch einen bestimmten Punkt charakterisiert werden kann. Wir zeigen dies mit folgendem Programm:

Ebene der Verteilungsgesetze

import matplotlib.pyplot as plt from numpy import* from scipy.stats import * def graf(a):#  a.sort() n=len(a) m= int(10+sqrt(n)) d=(max(a)-min(a))/m x=[];y=[] for i in arange(0,m,1): x.append(min(a)+d*i) k=0 for j in a: if min(a)+d*i <=j<min(a)+d*(i+1): k=k+1 y.append(k) h=(1+0.5*m/n)*0.5*d*n*10**(-sum([w*log10(w) for w in y if w!=0])/n) k=h/std (a) mu4=sum ([(w-mean (a))**4 for w in a])/n psi=(std(a))**2/sqrt(mu4) return psi,k b=800#   plt.title('  ', size=12) plt.xlabel(' $\psi$', size=12) plt.ylabel('  k', size=12) a=uniform.rvs( size=b) psi,k,=graf(a) nr=" : k=%s,$\psi$=%s "%(round(k,3),round(psi,3)) plt.plot(psi,k,'o', label=nr) a=logistic.rvs( size=b) psi,k,=graf(a) nr=":k=%s,$\psi$=%s "%(round(k,3),round(psi,3)) plt.plot(psi,k,'o', label=nr) a=norm.rvs( size=b) psi,k,=graf(a) nr=" :K=%s,$\psi$i=%s "%(round(k,3),round(psi,3)) plt.plot(psi,k,'o', label=nr) a= erlang.rvs(4,size=b) psi,k,=graf(a) nr="  :k=%s,$\psi$=%s "%(round(k,3),round(psi,3)) plt.plot(psi,k, 'o', label=nr) a= pareto.rvs(4,size=b) psi,k,=graf(a) nr=" :k=%s,$\psi$=%s "%(round(k,3),round(psi,3)) plt.plot(psi,k, 'o', label=nr) a = cauchy.rvs(size=b) psi,k,=graf(a) nr=" :k=%s,$\psi$=%s "%(round(k,3),round(psi,3)) plt.plot(psi,k,'o', label=nr) c = 0.412 a = genlogistic.rvs(c, size=b) psi,k,=graf(a) nr=" -1:k=%s,$\psi$=%s "%(round(k,3),round(psi,3)) plt.plot(psi,k,'o', label=nr) mu=0.6 a = poisson.rvs(mu, size=b) psi,k,=graf(a) nr=":k=%s,$\psi$=%s "%(round(k,3),round(psi,3)) plt.plot(psi,k,'o', label=nr) a= laplace.rvs(size=b) psi,k,=graf(a) nr=":k=%s,$\psi$=%s "%(round(k,3),round(psi,3)) plt.plot(psi,k,'o', label=nr) plt.legend(loc='best') plt.grid() plt.show()

In einer Ebene in Koordinaten

$k, \ psi$ aus dem Rest der Verteilungen entfernt, die Pareto, Cauchy-Verteilungen, obwohl sie zu verschiedenen Anwendungsgebieten gehören, das erste in der Physik und das zweite in der Wirtschaft. Wählen Sie zum Vergleich die normale Gaußsche Verteilung oben in der Klassifizierung. Alle folgenden Vergleiche werden an einer begrenzten Probe durchgeführt und dienen dazu, die Fähigkeiten eines photonischen Kristalls am Beispiel einer numerischen Bestimmung des Entropiefehlers zu demonstrieren.

Auswahl eines Kalman-Filteralgorithmus

An jedem ausgewählten Punkt im Messbereich werden mehrere Messungen durchgeführt und deren Ergebnis mit einer Messung verglichen, die FC „nicht kennt“. Daher sollten Sie einen FC auswählen, z. B. Kalman-Filter, um eine Konstante zu schätzen [16]. Ich bevorzuge jedoch Python und habe mich für die Option [16] mit umfangreicher Dokumentation entschieden. Ich werde eine Beschreibung des Algorithmus geben:

Da die Konstante immer ein Modell des Systems ist, kann dargestellt werden als:

$x_ {k} = x_ {k-1} + w_ {k}$ , (1)

Für das Modell degeneriert die Übergangsmatrix zu Eins und die Kontrollmatrix zu Null. Das Messmodell hat die Form:

$y_ {k} = y_ {k-1} + v_ {k}$ , (2)

Für Modell (2) wird die Messmatrix in Einheit und die Kovarianzmatrix konvertiert

$P, Q, R$ in Dispersionen verwandeln. Am nächsten

$k$ -th Schritt, bevor die Messergebnisse eintreffen, versucht der Kalman-Skalarfilter, den neuen Zustand des Systems unter Verwendung der Formel (1) zu bewerten:

$\ hat {x} _ {k / (k-1)} = \ hat {x} _ {(k-1) / (k-1)}$ , (3)

Gleichung (3) zeigt, dass die A-priori-Schätzung im nächsten Schritt gleich der im vorherigen Schritt vorgenommenen posterioren Schätzung ist. A-priori-Schätzung der Varianz des Fehlers:

$P_ {k / (k-1)} = P _ {(k-1) / (k-1)} + Q_ {k}$ , (4)

Nach a priori staatlicher Einschätzung

$\ hat {x} _ {k / (k-1)}$ Es ist möglich, die Messprognose zu berechnen:

$\ hat {y} _ {k} = \ hat {x} _ {k / (k-1)}$ , (5)

Nach der nächsten Messung wird empfangen

$y_ {k}$ Der Filter berechnet den Fehler seiner Prognose

$k$ th Messung:

$e_ {k} = y_ {k} - \ hat {y} _ {k} = y_ {k} - \ hat {x} _ {k / (k-1)}$ , (6)

Der Filter passt seine Bewertung des Systemzustands an und wählt einen Punkt aus, der irgendwo zwischen der anfänglichen Bewertung liegt

$\ hat {x} _ {k / (k-1)}$ und der Punkt, der der neuen Dimension entspricht

$y_ {k}$ ::

$e_ {k} = y_ {k} - \ hat {y} _ {k} = y_ {k} - \ hat {x} _ {k / (k-1)}$ , (7)

wo

$G _ {k}$ - Filterverstärkung.

Die Fehlervarianzschätzung wird ebenfalls korrigiert:

$P_ {k / (k)} = (1-G_ {k}) \ cdot P_ {k / (k-1)}$ , (8)

Es kann nachgewiesen werden, dass die Varianz des Fehlers

$e_ {k}$ ist gleich:

$S_ {k} = P_ {k / (k-1)} + R_ {k}$ , (9)

Die Verstärkung des Filters, bei der der minimale Fehler bei der Beurteilung des Systemzustands erreicht wird, wird aus der Beziehung bestimmt

$G_ {k} = P_ {k / (k-1)} / S_ {k}$ , (10)

FC-Entropiefehlerminimierung für Rauschen mit Cauchy-, Pareto- und Gauß-Verteilung

1. In der Wahrscheinlichkeitstheorie wird die Cauchy-Verteilungsdichte aus der Beziehung bestimmt:

$f (x) = \ frac {b} {\ pi \ cdot (1-x ^ {2})}$

Für diese Verteilung ist es unmöglich, den Fehler mit Methoden der Wahrscheinlichkeitstheorie abzuschätzen (

$\ sigma = \ infty$ ), aber die Informationstheorie erlaubt Ihnen dies:

Programm zur Minimierung des FC-Entropiefehlers durch Cauchy-Rauschen

 from numpy import * import matplotlib.pyplot as plt from scipy.stats import * def graf(a):#      a.sort() n=len(a) m= int(10+sqrt(n)) d=(max(a)-min(a))/m x=[];y=[] for i in arange(0,m,1): x.append(min(a)+d*i) k=0 for j in a: if min(a)+d*i <=j<min(a)+d*(i+1): k=k+1 y.append(k) h=(1+0.5*m/n)*0.5*d*n*10**(-sum([w*log10(w) for w in y if w!=0])/n) return h def Kalman(a,x,sz,R1): R = R1*R1 #  Q = 1e-5 #       #    : xest1 = zeros(sz) #    xest2 = zeros(sz) #    P1 = zeros(sz) #    P2 = zeros(sz) #    G = zeros(sz) #    xest2[0] = 0.0 P2[0] = 1.0 for k in arange(1, sz): #    . xest1[k] = xest2[k-1] #   . P1[k] = P2[k-1] + Q#   . #         : G[k] = P1[k] / ( P1[k] + R ) xest2[k] = xest1[k] + G[k] * ( a[k] - xest1[k] ) P2[k] = (1 - G[k]) * P1[k] return xest2,P1 nr="  " x =2#      ) R1 = 0.1 #  .  .   . sz = 50 #  . a = cauchy.rvs(x, R1, size=sz) xest2,P1=Kalman(a,x,sz,R1) plt.plot(a, 'k+', label=' ') plt.plot(xest2,'b-', label=' ') plt.axhline(x, color='g', label=' ') plt.axis([0, sz,-x, 2*x]) plt.legend() plt.xlabel(' ') plt.ylabel(u' ') h1=graf(a) h2=graf(xest2) plt.title('   %s.\n     $\Delta $1=%s   $\Delta $2=%s '%(nr,round(h1,3),round(h2,3)), size=12) plt.grid() plt.show()

Der Typ des Diagramms kann sich sowohl beim Neustart des Programms (neue Generation der Verteilungsprobe) als auch in Abhängigkeit von der Anzahl der Messungen und Verteilungsparameter ändern, bleibt jedoch unverändert. Der FC minimiert den Wert des Entropiefehlers, der auf der Grundlage der Informationstheorie der Messungen berechnet wird. Für den gegebenen Graphen reduziert FC den Entropiefehler um das 3,9-fache.

2. In der Wahrscheinlichkeitstheorie die Pareto-Verteilungsdichte mit Parametern

$x_ {m}$ und

$k$ bestimmt aus dem Verhältnis:

$f_ {X} (x) = \ left \ {\ begin {matrix} \ frac {kx_ {k} ^ {m}} {x ^ {k + 1}}, & x \ geq x_ {m} \\ 0, & x <x_ {m} \ end {matrix} \ right.$

Es ist zu beachten, dass die Pareto-Verteilung nicht nur in der Wirtschaft zu finden ist. Sie können das folgende Beispiel für die Verteilung der Dateigröße im Internetverkehr über das TCP-Protokoll geben.

3. In der Wahrscheinlichkeitstheorie die Dichte der Normalverteilung (Gauß) mit mathematischer Erwartung

$\ mu$ und Standardabweichung

$\ sigma$ bestimmt aus dem Verhältnis:

$f (x) = \ frac {1} {\ sigma \ sqrt {2 \ pi}} \ cdot e ^ {- \ frac {(x- \ mu) ^ {2}} {2 \ sigma ^ {2} }}$

Die Bestimmung der Minimierung des FC-Entropiefehlers aus Rauschen mit einer Gaußschen Verteilung wird zum Vergleich mit nicht-Gaußschen Cauchy- und Pareto-Verteilungen angegeben.

Programm zur Minimierung des FC-Entropiefehlers durch Normalverteilungsrauschen

 from numpy import * import matplotlib.pyplot as plt from scipy.stats import * def graf(a):#      a.sort() n=len(a) m= int(10+sqrt(n)) d=(max(a)-min(a))/m x=[];y=[] for i in arange(0,m,1): x.append(min(a)+d*i) k=0 for j in a: if min(a)+d*i <=j<min(a)+d*(i+1): k=k+1 y.append(k) h=(1+0.5*m/n)*0.5*d*n*10**(-sum([w*log10(w) for w in y if w!=0])/n) return h def Kalman(a,x,sz,R1): R = R1*R1 #  Q = 1e-5 #       #    : xest1 = zeros(sz) #    xest2 = zeros(sz) #    P1 = zeros(sz) #    P2 = zeros(sz) #    G = zeros(sz) #    xest2[0] = 0.0 P2[0] = 1.0 for k in arange(1, sz): #    . xest1[k] = xest2[k-1] #   . P1[k] = P2[k-1] + Q#   . #         : G[k] = P1[k] / ( P1[k] + R ) xest2[k] = xest1[k] + G[k] * ( a[k] - xest1[k] ) P2[k] = (1 - G[k]) * P1[k] return xest2,P1 nr="  " x =2#      ) R1 = 0.1 #  .  .   . sz = 50 #  . a=norm.rvs( x, R1, size=sz) xest2,P1=Kalman(a,x,sz,R1) plt.plot(a, 'k+', label=' ') plt.plot(xest2,'b-', label=' ') plt.axhline(x, color='g', label=' ') plt.axis([0, sz,-x, 2*x]) plt.legend() plt.xlabel(' ') plt.ylabel(u' ') h1=graf(a) h2=graf(xest2) plt.title('   %s.\n     $\Delta $1=%s   $\Delta $2=%s '%(nr,round(h1,3),round(h2,3)), size=12) plt.grid() plt.show()

Die Gaußsche Verteilung bietet eine höhere Stabilität des Ergebnisses für 50 Messungen, und für das gezeigte Diagramm nimmt der Entropiefehler um das 2,2-fache ab.

Minimierung des FC-Entropiefehlers aus einer Stichprobe experimenteller Daten mit einem unbekannten Rauschverteilungsgesetz

Programm zur Minimierung des FC-Entropiefehlers einer begrenzten Stichprobe experimenteller Daten

 from numpy import * import matplotlib.pyplot as plt from scipy.stats import * def graf(a):#      a.sort() n=len(a) m= int(10+sqrt(n)) d=(max(a)-min(a))/m x=[];y=[] for i in arange(0,m,1): x.append(min(a)+d*i) k=0 for j in a: if min(a)+d*i <=j<min(a)+d*(i+1): k=k+1 y.append(k) h=(1+0.5*m/n)*0.5*d*n*10**(-sum([w*log10(w) for w in y if w!=0])/n) k=h/std (a) mu4=sum ([(w-mean (a))**4 for w in a])/n psi=(std(a))**2/sqrt(mu4) return h def Kalman(a,x,sz,R1): R = R1*R1 #  Q = 1e-5 #       #    : xest1 = zeros(sz) #    xest2 = zeros(sz) #    P1 = zeros(sz) #    P2 = zeros(sz) #    G = zeros(sz) #    xest2[0] = 0.0 P2[0] = 1.0 for k in arange(1, sz): #    . xest1[k] = xest2[k-1] #   . P1[k] = P2[k-1] + Q#   . #         : G[k] = P1[k] / ( P1[k] + R ) xest2[k] = xest1[k] + G[k] * ( a[k] - xest1[k] ) P2[k] = (1 - G[k]) * P1[k] return xest2,P1 R1 = 0.9 #  .  .   . a=[ 0.203, 0.154, 0.172, 0.192, 0.233, 0.181, 0.219, 0.153, 0.168, 0.132, 0.204, 0.165, 0.197, 0.205, 0.143, 0.201, 0.168, 0.147, 0.208, 0.195, 0.153, 0.193, 0.178, 0.162, 0.157, 0.228, 0.219, 0.125, 0.101, 0.211,0.183, 0.147, 0.145, 0.181,0.184, 0.139, 0.198, 0.185, 0.202, 0.238, 0.167, 0.204, 0.195, 0.172, 0.196, 0.178, 0.213, 0.175, 0.194, 0.178, 0.135, 0.178, 0.118, 0.186, 0.191] sz = len(a) #   x =0.179#      ) xest2,P1=Kalman(a,x,sz,R1) plt.plot(a, 'k+', label=' ') plt.plot(xest2,'b-', label=' ') plt.axhline(x, color='g', label=' ') plt.axis([0, sz,-x, 2*x]) plt.legend() plt.xlabel(' ') plt.ylabel(' ') h1=graf(a) nr="  " h2=graf(xest2) plt.title('   %s \n     $\Delta $1=%s   $\Delta $2=%s '%(nr,round(h1,3),round(h2,3)), size=12) plt.grid() plt.show()

Bei der Analyse einer Stichprobe experimenteller Daten erhalten wir stabile Ergebnisse zur Minimierung des FC-Entropiefehlers. Für dieses Beispiel reduziert der FC den Entropiefehler um das 4,85-fache.

Fazit

Alle Vergleiche in diesem Artikel wurden an begrenzten Datenstichproben durchgeführt. Daher sollten grundlegende Schlussfolgerungen unterlassen werden. Die Verwendung von Entropiefehlern ermöglicht es uns jedoch, die Wirksamkeit des Kalman-Filters in der gegebenen Implementierung zu quantifizieren. Daher kann die Trainingsaufgabe dieses Artikels als abgeschlossen betrachtet werden.

Referenzen

1. Nicht orthogonale SINS für kleine UAVs
2. Kalman Filter - ist es schwierig?
3. Geruchslose Filtration und nichtlineare Schätzung *
4. An der Schwelle zur Augmented Reality: Was für Entwickler vorzubereiten (Teil 2 von 3)
5. Klassische Mechanik: bei Diffusionen „an den Fingern“
6. Kalman Filter - Einführung
7. Generator des Federated Kalman Filters unter Verwendung genetischer Algorithmen.
8. Kalman-Filter
9. Verwenden eines Kalman-Filters zum Bestimmen von Ableitungen einer Messgröße
10. Ein einfaches adaptives Kalman-Filtermodell mit Python
11. Der Zustandsraum bei den Problemen des Entwurfs optimaler Steuerungssysteme
12. Ein neuer Ansatz für lineare Filter- und Vorhersageprobleme1
13. Probabilistische und informative Analyse der Messergebnisse in Python
14. Die Auswahl des Verteilungsgesetzes einer Zufallsvariablen nach der statistischen Stichprobe mittels Python
15. Kalman-Filterung
16. Kalman-Filter zum Schätzen einer Konstante

Kalman-Filter zur Minimierung des Entropiewertes eines zufälligen Fehlers mit einer nicht-Gaußschen Verteilung

Einführung

Auswahl eines Kalman-Filteralgorithmus

Fazit

More articles: