🏦 🤹🏿 ⤴️ Gieriger Ansatz und Spielautomaten. Analyse der Aufgaben der ML-Strecke der Programmiermeisterschaft 🌞 ♟️ 🚚

Wir veröffentlichen weiterhin Analysen der Aufgaben, die bei der letzten Meisterschaft vorgeschlagen wurden. Als nächstes folgen Aufgaben aus der Qualifikationsrunde für Spezialisten für maschinelles Lernen. Dies ist der dritte von vier Tracks (Backend, Frontend, ML, Analytics). Die Teilnehmer mussten ein Modell für die Korrektur von Tippfehlern in Texten erstellen, eine Strategie für das Spielen an Spielautomaten vorschlagen, ein System von Empfehlungen für Inhalte in Erinnerung rufen und mehrere weitere Programme erstellen.

A. Tippfehler

Zustand

	Alle Sprachen	python2.7 + numpy	python3.5 + numpy
Zeitlimit	1 s	5 s	5 s
Speicherlimit	64 MB	256 MB	256 MB
Geben Sie ein	Standardeingabe oder input.txt
Fazit	Standardausgabe oder output.txt

(Epigraph) (aus einem Forum)
- Wer hat diesen Unsinn komponiert?
- Astrophysiker. Sie sind auch Menschen.
- Sie haben 10 Fehler im Wort "Journalisten" gemacht.

Viele Benutzer machen Tippfehler, einige aufgrund von Tastenanschlägen und andere aufgrund ihres Analphabetismus. Wir möchten prüfen, ob der Benutzer tatsächlich an ein anderes Wort als das von ihm eingegebene denken kann.

Nehmen wir formeller an, dass das folgende Fehlermodell auftritt: Der Benutzer beginnt mit einem Wort, das er schreiben möchte, und macht anschließend eine Reihe von Fehlern. Jeder Fehler ist eine Ersetzung eines Teilstrings des Wortes durch einen anderen Teilstring. Ein Fehler entspricht dem Ersetzen nur an einer Position (dh wenn der Benutzer einen einzelnen Fehler durch die Regel "abc" → "cba" machen möchte, kann er aus der Zeichenfolge "abcabc" entweder "cbaabc" oder "abccba" erhalten). Nach jedem Fehler wird der Vorgang wiederholt. Dieselbe Regel könnte mehrmals in verschiedenen Schritten verwendet werden (im obigen Beispiel könnte beispielsweise "cbacba" in zwei Schritten erhalten werden).

Es ist erforderlich, die Mindestanzahl von Fehlern zu bestimmen, die ein Benutzer machen kann, wenn er ein bestimmtes Wort im Auge hat und ein anderes schreibt.

E / A-Formate und Beispiel

Eingabeformat

Die erste Zeile enthält das Wort, das der Benutzer nach unserer Annahme im Sinn hatte (es besteht aus Buchstaben des lateinischen Alphabets in Kleinbuchstaben, die Länge überschreitet 20 nicht).

Die zweite Zeile enthält das Wort, das er tatsächlich geschrieben hat (es besteht auch aus Buchstaben des lateinischen Alphabets in Kleinbuchstaben, die Länge überschreitet 20 nicht).

Die dritte Zeile enthält eine einzelne Zahl N (N <50) - die Anzahl der Ersetzungen, die verschiedene Fehler beschreiben.

Die nächsten N Zeilen enthalten mögliche Ersetzungen im Format & lt "korrekte" Buchstabenfolge & gt <Leerzeichen> <"fehlerhafte" Buchstabenfolge>. Sequenzen dürfen nicht länger als 6 Zeichen sein.

Ausgabeformat

Es ist erforderlich, eine Zahl zu drucken - die Mindestanzahl von Fehlern, die der Benutzer machen kann. Wenn diese Zahl 4 überschreitet oder es unmöglich ist, aus einem Wort ein anderes zu erhalten, drucken Sie -1.

Beispiel

Geben Sie ein	Fazit
`mlax drum 50 lr mlax gtwt md mlax ujoc ml pq mf ml bf mlax aruq mlax nqdd mlax fglm mlax bfit mlax mziq mla hlb au mlax vmpa mw aw ax ok mla kqf me xx ml if ml gk le mla xrh mj ac ab mq ax fr ml sb mlax gxxx xm mlax hczx lq la sv lg ax eh lax mjh la ec la pv ml iq aq lax jrs la qn lax bjo lo az ln ac`	`4`

Lösung

Versuchen wir, aus der richtigen Schreibweise alle möglichen Wörter mit nicht mehr als 4 Fehlern zu generieren. Im schlimmsten Fall kann O ((L﹒N) ⁴ ) vorliegen. In den Grenzen des Problems ist dies eine ziemlich große Zahl, daher müssen Sie herausfinden, wie Sie die Komplexität reduzieren können. Stattdessen können Sie den Meet-in-the-Middle-Algorithmus verwenden: Generieren Sie Wörter mit nicht mehr als 2 Fehlern sowie Wörter, aus denen Sie ein vom Benutzer geschriebenes Wort mit nicht mehr als 2 Fehlern erhalten können. Beachten Sie, dass die Größe jedes dieser Sätze 10 ⁶ nicht überschreitet. Wenn die Anzahl der vom Benutzer gemachten Fehler 4 nicht überschreitet, überschneiden sich diese Sätze. Ebenso können wir überprüfen, ob die Anzahl der Fehler 3, 2 und 1 nicht überschreitet.

 struct FromTo { std::string from; std::string to; }; std::pair<size_t, std::string> applyRule(const std::string& word, const FromTo &fromTo, int pos) { while(true) { int from = word.find(fromTo.from, pos); if (from == std::string::npos) { return {std::string::npos, {}}; } int to = from + fromTo.from.size(); auto cpy = word; for (int i = from; i < to; i++) { cpy[i] = fromTo.to[i - from]; } return {from, std::move(cpy)}; } } void inverseRules(std::vector<FromTo> &rules) { for (auto& rule: rules) { std::swap(rule.from, rule.to); } } int solve(std::string& wordOrig, std::string& wordMissprinted, std::vector<FromTo>& replaces) { std::unordered_map<std::string, int> mapping; std::unordered_map<int, std::string> mappingInverse; mapping.emplace(wordOrig, 0); mappingInverse.emplace(0, wordOrig); mapping.emplace(wordMissprinted, 1); mappingInverse.emplace(1, wordMissprinted); std::unordered_map<int, std::unordered_set<int>> edges; auto buildGraph = [&edges, &mapping, &mappingInverse](int startId, const std::vector<FromTo>& replaces, bool dir) { std::unordered_set<int> mappingLayer0; mappingLayer0 = {startId}; for (int i = 0; i < 2; i++) { std::unordered_set<int> mappingLayer1; for (const auto& v: mappingLayer0) { auto& word = mappingInverse.at(v); for (auto& fromTo: replaces) { size_t from = 0; while (true) { auto [tmp, wordCpy] = applyRule(word, fromTo, from); if (tmp == std::string::npos) { break; } from = tmp + 1; { int w = mapping.size(); mapping.emplace(wordCpy, w); w = mapping.at(wordCpy); mappingInverse.emplace(w, std::move(wordCpy)); if (dir) { edges[v].emplace(w); } else { edges[w].emplace(v); } mappingLayer1.emplace(w); } } } } mappingLayer0 = std::move(mappingLayer1); } }; buildGraph(0, replaces, true); inverseRules(replaces); buildGraph(1, replaces, false); { std::queue<std::pair<int, int>> q; q.emplace(0, 0); std::vector<bool> mask(mapping.size(), false); int level{0}; while (q.size()) { auto [w, level] = q.front(); q.pop(); if (mask[w]) { continue; } mask[w] = true; if (mappingInverse.at(w) == wordMissprinted) { return level; } for (auto& v: edges[w]) { q.emplace(v, level + 1); } } } return -1; }

B. Vielarmiger Bandit

Zustand

Zeitlimit	2 s
Speicherlimit	64 MB
Geben Sie ein	Standardeingabe
Fazit	Standardausgabe

Dies ist eine interaktive Aufgabe.

Sie selbst wissen nicht, wie es passiert ist, aber Sie befanden sich in einer Halle mit Spielautomaten mit einer ganzen Tüte Token. Leider lehnen sie es an der Abendkasse ab, Token zurückzunehmen, und Sie haben beschlossen, Ihr Glück zu versuchen. Es gibt viele Spielautomaten in der Halle, die Sie spielen können. Für ein Spiel mit einem Spielautomaten verwenden Sie einen Token. Im Falle eines Gewinns gibt Ihnen die Maschine einen Dollar, im Falle eines Verlustes - nichts. Jede Maschine hat eine feste Gewinnwahrscheinlichkeit (die Sie nicht kennen), die jedoch für verschiedene Maschinen unterschiedlich ist. Nachdem Sie die Website des Herstellers dieser Maschinen studiert haben, haben Sie festgestellt, dass die Gewinnwahrscheinlichkeit für jede Maschine in der Herstellungsphase zufällig aus der Beta-Verteilung mit bestimmten Parametern ausgewählt wird.

Sie möchten Ihre erwarteten Gewinne maximieren.

E / A-Formate und Beispiel

Eingabeformat

Eine Ausführung kann aus mehreren Tests bestehen.

Jeder Test beginnt mit der Tatsache, dass Ihr Programm in der Zeile zwei durch ein Leerzeichen getrennte Ganzzahlen enthält: Die Anzahl N ist die Anzahl der Token in Ihrer Tasche und M ist die Anzahl der Maschinen in der Halle (N ≤ 10 ⁴ , M ≤ min (N, 100)). ) Die nächste Zeile enthält zwei reelle Zahlen α und β (1 ≤ α, β ≤ 10) - die Parameter der Beta-Verteilung der Gewinnwahrscheinlichkeit.

Das Kommunikationsprotokoll mit dem Prüfsystem lautet wie folgt: Sie stellen genau N Anforderungen. Drucken Sie für jede Anforderung in einer separaten Zeile die Nummer der Maschine aus, die Sie spielen möchten (von 1 bis einschließlich M). Als Antwort wird in einer separaten Zeile entweder "0" oder "1" angezeigt, was jeweils einen Verlust und einen Gewinn in einem Spiel mit dem angeforderten Spielautomaten bedeutet.

Nach dem letzten Test gibt es anstelle der Zahlen N und M zwei Nullen.

Ausgabeformat

Die Aufgabe gilt als erledigt, wenn Ihre Entscheidung nicht viel schlimmer ist als die Entscheidung der Jury. Wenn Ihre Entscheidung erheblich schlechter ist als die Entscheidung der Jury, erhalten Sie das Urteil „falsche Antwort“.

Es ist garantiert, dass die Wahrscheinlichkeit, das Urteil „falsche Antwort“ zu erhalten, ^10-6 nicht überschreitet, wenn Ihre Entscheidung nicht schlechter ist als die Entscheidung der Jury.

Anmerkungen

Interaktionsbeispiel:

 ____________________  stdin     stdout ____________________ ____________________   5 2   2 2              2    1              1    0              1    1              2    1              2    1

Lösung

Dieses Problem ist bekannt und kann auf verschiedene Arten gelöst werden. Die Hauptentscheidung der Jury setzte die Thompson-Stichprobenstrategie um. Da jedoch die Anzahl der Schritte zu Beginn des Programms bekannt war, gibt es optimalere Strategien (z. B. UCB1). Darüber hinaus könnte man sogar mit der Epsilon-Greedy-Strategie auskommen: Mit einer bestimmten Wahrscheinlichkeit ε eine zufällige Maschine spielen und mit einer Wahrscheinlichkeit (1 - ε) eine Maschine mit der besten Siegesstatistik spielen.

 class SolverFromStdIn(object): def __init__(self): self.regrets = [0.] self.total_win = [0.] self.moves = [] class ThompsonSampling(SolverFromStdIn): def __init__(self, bandits_total, init_a=1, init_b=1): """ init_a (int): initial value of a in Beta(a, b). init_b (int): initial value of b in Beta(a, b). """ SolverFromStdIn.__init__(self) self.n = bandits_total self.alpha = init_a self.beta = init_b self._as = [init_a] * self.n # [random.betavariate(self.alpha, self.beta) for _ in range(self.n)] self._bs = [init_b] * self.n # [random.betavariate(self.alpha, self.beta) for _ in range(self.n)] self.last_move = -1 random.seed(int(time.time())) def move(self): samples = [random.betavariate(self._as[x], self._bs[x]) for x in range(self.n)] self.last_move = max(range(self.n), key=lambda x: samples[x]) self.moves.append(self.last_move) return self.last_move def set_reward(self, reward): i = self.last_move r = reward self._as[i] += r self._bs[i] += (1 - r) return i, r while True: n, m = map(int, sys.stdin.readline().split()) if n == 0 and m == 0: break alpha, beta = map(float, sys.stdin.readline().split()) solver = ThompsonSampling(m) for _ in range(n): print >> sys.stdout, solver.move() + 1 sys.stdout.flush() reward = int(sys.stdin.readline()) solver.set_reward(reward)

C. Ausrichtung der Sätze

Zustand

Zeitlimit	2 s
Speicherlimit	64 MB
Geben Sie ein	Standardeingabe oder input.txt
Fazit	Standardausgabe oder output.txt

Eine der wichtigsten Aufgaben für das Training eines guten maschinellen Übersetzungsmodells ist ein guter Fall von parallelen Sätzen. In der Regel sind parallele Angebote die Quelle für parallele Angebote. Es stellt sich heraus, dass Sie häufig nur ihre Länge kennen müssen, um ein bestimmtes Korpus paralleler Sätze zu bilden. Insbesondere stellen Sie möglicherweise fest, dass der Satz in der Ausgangssprache umso länger übersetzt wird, je länger er ist. Einige Schwierigkeiten liegen in der Tatsache, dass sich während der Übersetzung die Anzahl der Sätze im Text ändern kann: Manchmal können zwei benachbarte Sätze in der Übersetzung zu einem kombiniert werden oder umgekehrt - ein Satz kann in zwei Sätze geteilt werden. In einigen seltenen Fällen können Sätze in einer Übersetzung vollständig weggelassen werden, oder eine Übersetzung kann in einer Übersetzung erscheinen, die nicht im Original enthalten war.

Nehmen wir formeller an, dass das folgende generative Modell für parallele Gehäuse wahr ist. Bei jedem Schritt führen wir einen der folgenden Schritte aus:

1. Stoppen Sie

Mit der Wahrscheinlichkeit p _h endet _die Erzeugung der Rümpfe.

2. [1-0] Angebote überspringen

Mit der Wahrscheinlichkeit p _d schreiben _wir dem Originaltext einen Satz zu. Wir schreiben der Übersetzung nichts zu. Die Länge des Satzes in der Originalsprache L ≥ 1 wird aus der diskreten Verteilung ausgewählt:

.

Hier sind μs , σs die Verteilungsparameter und αs der so gewählte Normalisierungskoeffizient

.

3. [0-1] Vorschlag einfügen

Mit der Wahrscheinlichkeit p _i weisen _wir der Übersetzung einen Satz zu. Wir schreiben dem Original nichts zu. Die Länge eines Satzes in einer Übersetzungssprache L ≥ 1 wird aus einer diskreten Verteilung ausgewählt:

.

Hier sind μ _t , σ _t die Verteilungsparameter und α _t der so gewählte Normalisierungskoeffizient

.

4. Übersetzung

Mit der Wahrscheinlichkeit (1 - p _d - p _i - p _h ) nehmen wir die Länge des Satzes in der Originalsprache L _s ≥ 1 aus der Verteilung p _s (mit Aufrundung). Als nächstes erzeugen wir die Länge des Satzes in der Übersetzungssprache L _t ≥ 1 aus der bedingten diskreten Verteilung:

.

Hier ist α _st der Normalisierungskoeffizient, und die verbleibenden Parameter sind in den vorhergehenden Absätzen beschrieben.

Weiter ist ein weiterer Schritt:

1. [2-1] Mit der Wahrscheinlichkeit p _{split s} teilt sich _der erzeugte Satz in der Originalsprache in zwei nicht leere auf, so dass sich die Gesamtzahl der Wörter um genau eins erhöht . Die Wahrscheinlichkeit, dass ein Satz der Länge L _s in Teile der Länge L ₁ und L ₂ zerfällt (dh L ₁ + L ₂ = L _s + 1), ist proportional zu P _s (L ₁ ) ⋅ P _s (L ₂ ).

2. [1-2] Mit der Wahrscheinlichkeit p _{split t} teilt sich _der erzeugte Satz in der Zielsprache in zwei nicht leere Sätze auf, so dass sich die Gesamtzahl der Wörter um genau eins erhöht. Die Wahrscheinlichkeit, dass ein Satz der Länge L _t in Teile der Länge L1 und L2 zerfällt (dh L ₁ + L ₂ = L _t + 1), ist proportional zu P _t (L ₁ ) ⋅ P _t (L ₂ ).

3. 3. [1-1] Mit einer Wahrscheinlichkeit von (1 - p _{split s} - p _{split t} ) zerfällt keiner der generierten Sätze.

E / A-Formate, Beispiele und Hinweise

Eingabeformat

Die erste Zeile der Datei enthält die Verteilungsparameter: p _h , p _d , p _i , p _{split s} , p _{split t} , μ _s , σ _s , μ _t , σ _t . 0,1 ≤ σ _s <σ _t ≤ 3. 0 ≤ μ _s , μ _t ≤ 5.

Die nächste Zeile enthält die Zahlen N _s und N _t - die Anzahl der Sätze im Fall in der Originalsprache bzw. in der Zielsprache (1 ≤ N _s , N _t ≤ 1000).

Die nächste Zeile enthält N _s Ganzzahlen - die Länge der Sätze in der Originalsprache. Die nächste Zeile enthält N _t Ganzzahlen - die Länge der Sätze in der Zielsprache.

Die nächste Zeile enthält zwei Zahlen: j und k (1 ≤ j ≤ N _s , 1 ≤ k ≤ N _t ).

Ausgabeformat

Es ist erforderlich, die Wahrscheinlichkeit abzuleiten, dass Sätze mit den Indizes j bzw. k in den Texten parallel sind (dh, dass sie in einem Schritt des Algorithmus erzeugt werden und keiner von ihnen das Ergebnis des Zerfalls ist).

Ihre Antwort wird akzeptiert, wenn der absolute Fehler 10 ^–4 nicht überschreitet.

Beispiel 1

Geben Sie ein	Fazit
`0.05 0.08 0.07 0.15 0.1 1 0.3 3 0.5 1 1 4 20 1 1`	`0.975037457809`

Beispiel 2

Geben Sie ein	Fazit
`0.1 0.2 0.3 0.25 0.3 1 0.3 3 0.5 2 1 3 4 20 2 1`	`0.247705779810`

Beispiel 3

Geben Sie ein	Fazit
`0.2 0.2 0.2 0.3 0.3 3 0.3 1 1 5 3 16 35 24 19 23 5 6 7 2 1`	`0.200961101684`

Anmerkungen

Im ersten Beispiel kann die anfängliche Folge von Zahlen auf drei Arten erhalten werden:

• Fügen Sie zuerst mit der Wahrscheinlichkeit p _d einen Satz zum Originaltext hinzu, dann mit der Wahrscheinlichkeit p _i einen Satz zur Übersetzung und beenden Sie dann mit der Wahrscheinlichkeit p _h die Generierung.

Die Wahrscheinlichkeit dieses Ereignisses ist P ₁ = p _d * P _s (4) * p _i * P _t (20) * p _h .

• Fügen Sie zuerst mit der Wahrscheinlichkeit p _d einen Satz zum Originaltext hinzu, dann mit der Wahrscheinlichkeit p _i einen Satz zur Übersetzung und beenden Sie dann mit der Wahrscheinlichkeit p _h die Generierung.

Die Wahrscheinlichkeit dieses Ereignisses ist gleich P ₂ = p _i * P _t (20) * p _d * P _s (4) * p _h .

• Mit der Wahrscheinlichkeit (1 - p _h - p _d - p _i ) zwei Sätze erzeugen, dann mit der Wahrscheinlichkeit (1 - p _{split s} - p _{split t} ) alles so lassen, wie es ist (dh das Original oder die Übersetzung nicht in zwei Sätze teilen ) und beenden Sie danach mit der Wahrscheinlichkeit p _h die Erzeugung.

Die Wahrscheinlichkeit dieses Ereignisses ist

.

Als Ergebnis wird die Antwort berechnet als

Lösung

Die Aufgabe ist ein Sonderfall der Ausrichtung mit Hidden-Markov-Modellen (HMM-Ausrichtung). Die Hauptidee ist, dass Sie die Wahrscheinlichkeit berechnen können, mit diesem Modell und dem Vorwärtsalgorithmus ein bestimmtes Dokumentpaar zu generieren: In diesem Fall ist der Status ein Paar von Dokumentpräfixen. Dementsprechend kann die erforderliche Wahrscheinlichkeit der Ausrichtung eines bestimmten Paares paralleler Sätze durch den Vorwärts-Rückwärts- Algorithmus berechnet werden.

Code

 #include <iostream> #include <iomanip> #include <cmath> #include <vector> double p_h, p_d, p_i, p_tr, p_ss, p_st, mu_s, sigma_s, mu_t, sigma_t; double lognorm_cdf(double x, double mu, double sigma) { if (x < 1e-9) return 0.0; double res = std::log(x) - mu; res /= std::sqrt(2.0) * sigma; res = 0.5 * (1 + std::erf(res)); return res; } double length_probability(int l, double mu, double sigma) { return lognorm_cdf(l, mu, sigma) - lognorm_cdf(l - 1, mu, sigma); } double translation_probability(int ls, int lt) { double res = length_probability(ls, mu_s, sigma_s); double mu = mu_t - mu_s + std::log(ls); double sigma = std::sqrt(sigma_t * sigma_t - sigma_s * sigma_s); res *= length_probability(lt, mu, sigma); return res; } double split_probability(int l1, int l2, double mu, double sigma) { int l_sum = l1 + l2; double total_prob = 0.0; for (int i = 1; i < l_sum; ++i) { total_prob += length_probability(i, mu, sigma) * length_probability(l_sum - i, mu, sigma); } return length_probability(l1, mu, sigma) * length_probability(l2, mu, sigma) / total_prob; } double log_prob10(int ls) { return std::log(p_d * length_probability(ls, mu_s, sigma_s)); } double log_prob01(int lt) { return std::log(p_i * length_probability(lt, mu_t, sigma_t)); } double log_prob11(int ls, int lt) { return std::log(p_tr * (1 - p_ss - p_st) * translation_probability(ls, lt)); } double log_prob21(int ls1, int ls2, int lt) { return std::log(p_tr * p_ss * split_probability(ls1, ls2, mu_s, sigma_s) * translation_probability(ls1 + ls2 - 1, lt)); } double log_prob12(int ls, int lt1, int lt2) { return std::log(p_tr * p_st * split_probability(lt1, lt2, mu_t, sigma_t) * translation_probability(ls, lt1 + lt2 - 1)); } double logsum(double v1, double v2) { double res = std::max(v1, v2); v1 -= res; v2 -= res; v1 = std::min(v1, v2); if (v1 < -30) { return res; } return res + std::log(std::exp(v1) + 1.0); } double loginc(double* to, double from) { *to = logsum(*to, from); } constexpr double INF = 1e25; int main(void) { using std::cin; using std::cout; cin >> p_h >> p_d >> p_i >> p_ss >> p_st >> mu_s >> sigma_s >> mu_t >> sigma_t; p_tr = 1.0 - p_h - p_d - p_i; int Ns, Nt; cin >> Ns >> Nt; using std::vector; vector<int> ls(Ns), lt(Nt); for (int i = 0; i < Ns; ++i) cin >> ls[i]; for (int i = 0; i < Nt; ++i) cin >> lt[i]; vector< vector< double> > fwd(Ns + 1, vector<double>(Nt + 1, -INF)), bwd = fwd; fwd[0][0] = 0; bwd[Ns][Nt] = 0; for (int i = 0; i <= Ns; ++i) { for (int j = 0; j <= Nt; ++j) { if (i >= 1) { loginc(&fwd[i][j], fwd[i - 1][j] + log_prob10(ls[i - 1])); loginc(&bwd[Ns - i][Nt - j], bwd[Ns - i + 1][Nt - j] + log_prob10(ls[Ns - i])); } if (j >= 1) { loginc(&fwd[i][j], fwd[i][j - 1] + log_prob01(lt[j - 1])); loginc(&bwd[Ns - i][Nt - j], bwd[Ns - i][Nt - j + 1] + log_prob01(lt[Nt - j])); } if (i >= 1 && j >= 1) { loginc(&fwd[i][j], fwd[i - 1][j - 1] + log_prob11(ls[i - 1], lt[j - 1])); loginc(&bwd[Ns - i][Nt - j], bwd[Ns - i + 1][Nt - j + 1] + log_prob11(ls[Ns - i], lt[Nt - j])); } if (i >= 2 && j >= 1) { loginc(&fwd[i][j], fwd[i - 2][j - 1] + log_prob21(ls[i - 1], ls[i - 2], lt[j - 1])); loginc(&bwd[Ns - i][Nt - j], bwd[Ns - i + 2][Nt - j + 1] + log_prob21(ls[Ns - i], ls[Ns - i + 1], lt[Nt - j])); } if (i >= 1 && j >= 2) { loginc(&fwd[i][j], fwd[i - 1][j - 2] + log_prob12(ls[i - 1], lt[j - 1], lt[j - 2])); loginc(&bwd[Ns - i][Nt - j], bwd[Ns - i + 1][Nt - j + 2] + log_prob12(ls[Ns - i], lt[Nt - j], lt[Nt - j + 1])); } } } int j, k; cin >> j >> k; double rlog = fwd[j - 1][k - 1] + bwd[j][k] + log_prob11(ls[j - 1], lt[k - 1]) - bwd[0][0]; cout << std::fixed << std::setprecision(12) << std::exp(rlog) << std::endl; }

D. Band mit Empfehlungen

Zustand

Zeitlimit	2 s
Speicherlimit	64 MB
Geben Sie ein	Standardeingabe oder input.txt
Fazit	Standardausgabe oder output.txt

Betrachten Sie einen Feed mit Empfehlungen für heterogene Inhalte. Es mischt Objekte verschiedener Typen (Bilder, Videos, Nachrichten usw.). Diese Objekte sind normalerweise nach Relevanz für den Benutzer geordnet: Je relevanter (interessanter) das Objekt für den Benutzer ist, desto näher am Anfang der Empfehlungsliste. Bei einer solchen Reihenfolge treten jedoch häufig Situationen auf, in denen mehrere Objekte desselben Typs in der Liste der Empfehlungen aufgeführt sind. Dies verschlechtert die externe Vielfalt unserer Empfehlungen erheblich und daher gefällt es den Benutzern nicht. Es ist erforderlich, einen Algorithmus zu implementieren, der gemäß der Liste der Empfehlungen eine neue Liste erstellt, die frei von diesem Problem ist und am relevantesten ist.

Eine erste Liste von Empfehlungen sei a = [a ₀ , a ₁ , ..., a _{n - 1} ] mit der Länge n> 0. Ein Objekt mit der Nummer i hat den Typ mit der Nummer b _i ∈ {0, ..., m - 1}. Zusätzlich hat ein Objekt unter der Nummer i die Relevanz r (a _i ) = 2 _−i . Betrachten Sie die Liste, die aus der ersten Liste erhalten wird, indem Sie eine Teilmenge von Objekten auswählen und neu anordnen: x = [a _{i ₀} , a _{i ₁} , ..., a _{i _{k - 1}} ] mit der Länge k (0 ≤ k ≤ n). Eine Liste wird als zulässig bezeichnet, wenn keine zwei aufeinanderfolgenden Objekte in ihrem Typ übereinstimmen, d. H. B _{i _j} ≠ b _{i _{j + 1}} für alle j = 0, ..., k - 2. Die Relevanz der Liste wird durch die Formel berechnet

s u m_{j = 0}^{k - 1} 2_{- j} r (a_{i_{j}})

$\ sum_ {j = 0} ^ {k-1} 2 _ {- j} r (a_ {i_j})$ . Sie müssen die Liste der maximalen Relevanz unter allen gültigen finden.

E / A-Formate und Beispiele

Eingabeformat

In der ersten Zeile werden die Zahlen n und m mit einem Leerzeichen geschrieben (1 ≤ n ≤ 100000, 1 ≤ m ≤ n). Die nächsten n Zeilen enthalten die Zahlen b _i für i = 0, ..., n - 1 (0 ≤ b _i ≤ m - 1).

Ausgabeformat

Notieren Sie mit einem Leerzeichen die Anzahl der Objekte in der endgültigen Liste: i ₀ , i ₁ , ..., i _{k - 1} .

Beispiel 1

Geben Sie ein	Fazit
`1 1 0`	`0`

Beispiel 2

Geben Sie ein	Fazit
`2 2 1 1`	`0`

Beispiel 3

Geben Sie ein	Fazit
`10 2 1 1 1 0 0 1 0 1 1 1`	`0 3 1 4 2 6 5`

Lösung

Mit einfachen mathematischen Berechnungen kann gezeigt werden, dass das Problem durch einen „gierigen“ Ansatz gelöst werden kann, dh in der optimalen Liste von Empfehlungen hat jeder Punkt das relevanteste Objekt von allen, die am selben Anfang der Liste gültig sind. Die Implementierung dieses Ansatzes ist einfach: Wir nehmen Objekte in einer Reihe und fügen sie, wenn möglich, der Antwort hinzu. Wenn ein ungültiges Objekt gefunden wird (dessen Typ mit dem Typ des vorherigen übereinstimmt), legen wir es in einer separaten Warteschlange beiseite, aus der wir es so schnell wie möglich in die Antwort einfügen. Beachten Sie, dass zu jedem Zeitpunkt alle Objekte in dieser Warteschlange einen übereinstimmenden Typ haben. Am Ende verbleiben möglicherweise mehrere Objekte in der Warteschlange. Sie werden nicht in die Antwort aufgenommen.

  std::vector<int> blend(int n, int m, const std::vector<int>& types) { std::vector<int> result; std::queue<int> repeated; for (int i = 0; i < n; ++i) { if (result.empty() || types[result.back()] != types[i]) { result.push_back(i); if (!repeated.empty() && types[repeated.front()] != types[result.back()]) { result.push_back(repeated.front()); repeated.pop(); } } else { repeated.push(i); } } return result; }

D. Clusterisierung von Zeichenfolgen

	Alle Sprachen	python2.7 + numpy	python3.5 + numpy
Zeitlimit	1 s	6 s	6 s
Speicherlimit	64 MB	64 MB	64 MB
Geben Sie ein	Standardeingabe oder input.txt
Fazit	Standardausgabe oder output.txt

Es gibt ein endliches Alphabet A = {a ₁ , a ₂ , ..., a _{K - 1} , a _K = S}, a _i ∈ {a, b, ..., z}, S ist das Ende der Zeile.

Betrachten Sie die folgende Methode zum Generieren von zufälligen Zeichenfolgen über dem Alphabet A:

1. Das erste Zeichen x ₁ ist eine Zufallsvariable mit der Verteilung P (x ₁ = a _i ) = q _i (es ist bekannt, dass q _K = 0 ist).
2. Jedes nächste Zeichen wird basierend auf dem vorherigen gemäß der bedingten Verteilung P (x _i = a _j || x _{i - 1} = a _l ) = p _{jl erzeugt} .
3. Wenn x _i = S ist, stoppt die Erzeugung und das Ergebnis ist x ₁ x ₂ ... x _{i - 1} .

Der Satz von Linien, die aus einer Mischung von zwei beschriebenen Modellen mit unterschiedlichen Parametern erzeugt werden, ist angegeben. Für jede Zeile muss der Index der Kette angegeben werden, aus der sie generiert wurde.

E / A-Formate, Beispiel und Notizen

Eingabeformat

Die erste Zeile enthält zwei Zahlen 1000 ≤ N ≤ 2000 und 3 ≤ K ≤ 27 - die Anzahl der Zeilen bzw. die Größe des Alphabets.

Die zweite Zeile enthält eine Zeile, die aus K - 1 verschiedenen Kleinbuchstaben des lateinischen Alphabets besteht und die ersten K - 1 Elemente des Alphabets angibt.

Jede der folgenden N Zeilen wird gemäß dem in der Bedingung beschriebenen Algorithmus erzeugt.

Ausgabeformat

In n Zeilen enthält die i-te Zeile die Clusternummer (0/1) für die Sequenz in der i + 1-ten Zeile der Eingabedatei. Die Übereinstimmung mit der wahren Antwort sollte mindestens 80% betragen.

Beispiel

Geben Sie ein	Fazit
`100 3 a a aa a aaa a aaaaaa aa a a a aaa a a aaa aa aaaa aaa a aaaaa aa a aaaa a a a a a a aa aaaa aaa a aa aaaa a a a a a a a a a a aa aaa aaa a a bbb bb bb bbbbbbb bb bbb b bbbbbbb bbbb bbb bb bbb bb bb bbb bbbbbb bbb b bbbbbb b bbbbb b b bb b bb bb b b b b bb bb bb b b b bb b bbb bb b bbbbbb b bb bb bb b bb bbb`	`0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1`

Anmerkungen

Hinweis zum Test aus der Bedingung: Darin werden die ersten 50 Zeilen aus der Verteilung generiert
P (x _i = a | x _{i - 1} = a) = 0,5, P (x _i = S | x _{i - 1} = a) = 0,5, P (x ₁ = a) = 1; zweite 50 - aus der Verteilung
P (x _i = b | x _{i - 1} = b) = 0,5, P (x _i = S | x _{i - 1} = b) = 0,5, P (x ₁ = b) = 1.

Lösung

Das Problem wird mithilfe des EM-Algorithmus gelöst: Es wird angenommen, dass die dargestellte Probe aus einer Mischung von zwei Markov-Ketten generiert wird, deren Parameter während der Iterationen wiederhergestellt werden. Eine Einschränkung von 80% der richtigen Antworten wird vorgenommen, damit die Richtigkeit der Lösung nicht durch Beispiele beeinträchtigt wird, die in beiden Ketten eine hohe Wahrscheinlichkeit haben. Diese Beispiele können daher bei ordnungsgemäßer Wiederherstellung einer Kette zugewiesen werden, die hinsichtlich der generierten Antwort falsch ist.

 import random import math EPS = 1e-9 def empty_row(size): return [0] * size def empty_matrix(rows, cols): return [empty_row(cols) for _ in range(rows)] def normalized_row(row): row_sum = sum(row) + EPS return [x / row_sum for x in row] def normalized_matrix(mtx): return [normalized_row(r) for r in mtx] def restore_params(alphabet, string_samples): n_tokens = len(alphabet) n_samples = len(string_samples) samples = [tuple([alphabet.index(token) for token in s] + [n_tokens - 1, n_tokens - 1]) for s in string_samples] probs = [random.random() for _ in range(n_samples)] for _ in range(200): old_probs = [x for x in probs] # probs fixed p0, A = empty_row(n_tokens), empty_matrix(n_tokens, n_tokens) q0, B = empty_row(n_tokens), empty_matrix(n_tokens, n_tokens) for prob, sample in zip(probs, samples): p0[sample[0]] += prob q0[sample[0]] += 1 - prob for t1, t2 in zip(sample[:-1], sample[1:]): A[t1][t2] += prob B[t1][t2] += 1 - prob A, p0 = normalized_matrix(A), normalized_row(p0) B, q0 = normalized_matrix(B), normalized_row(q0) trans_log_diff = [ [math.log(b + EPS) - math.log(a + EPS) for b, a in zip(B_r, A_r)] for B_r, A_r in zip(B, A) ] # A, p0, B, q0 fixed probs = empty_row(n_samples) for i, sample in enumerate(samples): value = math.log(q0[sample[0]] + EPS) - math.log(p0[sample[0]] + EPS) for t1, t2 in zip(sample[:-1], sample[1:]): value += trans_log_diff[t1][t2] probs[i] = 1.0 / (1.0 + math.exp(value)) if max(abs(x - y) for x, y in zip(probs, old_probs)) < 1e-9: break return [int(x > 0.5) for x in probs] def main(): N, K = list(map(int, input().split())) string_samples = [] alphabet = list(input().strip()) + [''] for _ in range(N): string_samples.append(input().rstrip()) result = restore_params(alphabet, string_samples) for r in result: print(r) if __name__ == '__main__': main()

Gieriger Ansatz und Spielautomaten. Analyse der Aufgaben der ML-Strecke der Programmiermeisterschaft

A. Tippfehler

Zustand

Eingabeformat

Ausgabeformat

Beispiel

Lösung

B. Vielarmiger Bandit

Zustand

Eingabeformat

Ausgabeformat

Anmerkungen

Lösung

C. Ausrichtung der Sätze

Zustand

Eingabeformat

Ausgabeformat

Beispiel 1

Beispiel 2

Beispiel 3

Anmerkungen

Lösung

D. Band mit Empfehlungen

Zustand

Eingabeformat

Ausgabeformat

Beispiel 1

Beispiel 2

Beispiel 3

Lösung

D. Clusterisierung von Zeichenfolgen

Eingabeformat

Ausgabeformat

Beispiel

Anmerkungen

Lösung

More articles: