👆🏿 🧑🏾‍🤝‍🧑🏻 ⏸️ Regel 10: 1 beim Programmieren und Schreiben 🚵🏻 👩🏼 👨‍🎓

In diesem Artikel analysiert der Autor die Zeit, die für das Schreiben von Büchern oder Programmcode aufgewendet wird, und kommt zu einem interessanten Muster. Es kann verwendet werden, um Projektarbeiten zu planen.

Hofstadter-Gesetz: Jedes Geschäft dauert immer länger als erwartet, auch wenn Sie das Hofstadter-Gesetz berücksichtigen.
- Douglas Hofstadter, Gödel, Asher, Bach

Das Schreiben von Prosa und Code hat viel gemeinsam. Die auffälligste Ähnlichkeit ist jedoch wahrscheinlich, dass weder Autoren noch Programmierer ihre Arbeit pünktlich beenden können. Schriftsteller sind dafür berüchtigt, die Fristen zu brechen. Programmierer haben sich den Ruf von Menschen verdient, deren Ergebnisse sich immer stark von den anfänglichen Berechnungen unterscheiden. Es stellt sich die Frage: Warum?

Heute hatte ich eine Idee, wie ich darauf antworten sollte. Und meine Erkenntnisse haben mich erstaunt.

Meine Bücher studieren

Meine beiden Bücher Hallo, Startup und Terraform: Wir starten und arbeiten , schrieb ich in der Atlas -Bucherstellungsumgebung, die die Verwaltung aller Inhalte mit Git ermöglicht. Dies bedeutet, dass jede Textzeile, jede Bearbeitung und jede Änderung in das Git-Festschreibungsprotokoll übernommen wurde.

Lassen Sie uns überprüfen, wie viel Aufwand für das Schreiben von zwei Büchern aufgewendet wurde.

Hallo Start

Beginnen wir mit meinem ersten Buch. Hallo Startup . Es hat 602 Seiten und ungefähr 190.000 Wörter. Ich habe cloc im Hello, Startup Git Repository ausgeführt und die folgenden Ergebnisse erhalten (Der Einfachheit halber werden die Bruchteile verworfen):

602 Seiten enthalten 26.571 Textzeilen. Der Löwenanteil ist in AsciiDoc geschrieben , ähnlich wie bei Markdown. Es wird von Atlas verwendet, um fast jeden Inhalt zu schreiben. Mit HTML und CSS definiert Atlas das Layout und die Struktur eines Buches. Darüber hinaus gibt es weitere Programmiersprachen (Java, Ruby, Python und nicht nur), in denen verschiedene Beispiele für die im Buch behandelten Themen geschrieben sind.

Aber 602 Seiten und 26.571 Zeilen sind nur das Endergebnis. Sie reflektieren nicht etwa 10 Monate Schreiben, Ändern, Bearbeiten, Korrekturlesen, Stilanpassungen, Recherchen, Notizen und andere Arbeiten, die zur Veröffentlichung des Buches beitragen. Um weitere nützliche Ideen zu erhalten, habe ich git-quick-stats , um das gesamte Commit-Protokoll für Bücher zu analysieren.

Also habe ich 163.756 Zeilen hinzugefügt und 131.425 gelöscht, was insgesamt 295.181 Zeilen verarbeiteten Materials ergibt. Das heißt, es stellt sich heraus, dass ich insgesamt 295 181 Zeilen geschrieben oder gelöscht habe, von denen 26 571 Zeilen übrig geblieben sind. Dieses Verhältnis liegt etwas über 10: 1. Um jede veröffentlichte Zeile zu erhalten, musste ich zuerst 10 andere schreiben!

Ich gebe zu, dass das Zählen der Anzahl der zu Git hinzugefügten und aus Git entfernten Zeilen nicht als ideale Metrik für den Bearbeitungsprozess angesehen werden kann. Dies lässt uns jedoch zumindest verstehen, dass eine einfache Berechnung nicht ausreicht, um die geleistete Arbeit zu bewerten. Ein wesentlicher Teil des Prozesses wurde im Git-Commit-Protokoll überhaupt nicht berücksichtigt. Zum Beispiel wurden die ersten Kapitel in Google Text & Tabellen geschrieben, bevor ich zu Atlas wechselte, und viele Änderungen wurden ohne Commits an meinem Computer vorgenommen.

Trotz der Tatsache, dass diese Daten alles andere als ideal sind, glaube ich, dass das Gesamtverhältnis von „Originaltextmaterial“ zu veröffentlichtem 10: 1 beträgt.

Terraform: Wir beginnen und arbeiten

Lassen Sie uns prüfen, ob dieser Anteil auf mein zweites Buch Terraform zutrifft : Wir starten und arbeiten , das 206 Seiten und etwa 52.000 Wörter enthält.

Die vereinfachte Ausgabe von cloc :

206 Seiten bestehen aus 8410 Textzeilen. Auch hier ist der größte Teil des Textes in AsciiDoc geschrieben, obwohl dieses Buch wesentlich mehr Codebeispiele enthält, die hauptsächlich in HCL, der Hauptsprache von Terraform, geschrieben wurden. Neben ihm gibt es viele Markdowns, mit denen ich HCL-Beispiele dokumentiert habe.

Wir werden git-quick-stats , um den Revisionsverlauf dieses Buches zu überprüfen:

Fast fünf Monate lang habe ich 32.209 hinzugefügt und 22.402 Zeilen gelöscht, was insgesamt 54.611 recycelten Zeilen entspricht. Die Genauigkeit der Bewertung des Bearbeitungsprozesses dieses Buches leidet noch mehr, da die Arbeit als eine Reihe von Blog-Posts begann , die einer konkreten Überarbeitung unterzogen wurden, bevor sie zu Atlas und Git verschoben wurden. Das Volumen dieser Blog-Beiträge nimmt mindestens die Hälfte des Buches ein, daher ist es logisch, die endgültige Rate des verarbeiteten Textes um 50% zu erhöhen. Das heißt, es werden 54611 * 1,5 = 81 916 Zeilen bearbeitbaren Textes ausgegeben, was insgesamt 8410 Zeilen ergibt.

Und wieder ein Verhältnis von ca. 10: 1!

Es ist nicht verwunderlich, dass Autoren die Fristen nicht einhalten. Wenn der Zeitplan ein Buch mit 250 Seiten übergeben soll, stellt sich in der Praxis heraus, dass wir dabei 2500 Seiten schreiben werden.

Was ist mit Programmierung?

Wie läuft die Entwicklung? Ich habe mich entschlossen, mehrere Open-Source-Git-Repositories mit unterschiedlichen Reifegraden zu prüfen: von einigen Monaten bis zu 23 Jahren.

terraform-aws-couchbase (2018)

terraform-aws-couchbase ist eine Reihe von Modulen zum Bereitstellen und Verwalten von Couchbase unter AWS, deren Quellcode 2018 eröffnet wurde.

Die vereinfachte Ausgabe von cloc :

Und hier ist das Ergebnis der Überprüfung der git-quick-stats :

Wir erhalten bis zu 37.693 Zeilen Arbeitscode, was zu 7481 Zeilen des endgültigen Codes im Verhältnis 5: 1 führt. Selbst im Repository unter 5 Monaten musste ich jede Zeile fünfmal neu schreiben! Es ist nicht verwunderlich, dass die Bewertung der Softwareentwicklung kompliziert ist: Wir stellen uns nicht einmal vor, dass wir tatsächlich 35.000 schreiben müssen, um 7,5 Tausend Zeilen endgültigen Codes zu erhalten

Mal sehen, wie es mit älteren Produkten läuft.

Terratest (2016)

Terratest ist eine OpenSource-Bibliothek, die 2016 zum Testen von Infrastrukturcode erstellt wurde.

Die vereinfachte Ausgabe von cloc :