👨🏽‍🏫 🌱 🚁 Règle 10: 1 en programmation et en écriture ☝🏽 🏘️ 🏎️

Dans cet article, l'auteur analyse le temps passé à écrire des livres ou du code de programme, et arrive à un modèle intéressant. Il peut être utilisé pour planifier le travail du projet.

Loi de Hofstadter: toute entreprise dure toujours plus longtemps que prévu, même si vous tenez compte de la loi de Hofstadter.
- Douglas Hofstadter, Gödel, Asher, Bach

Écrire de la prose et du code a beaucoup en commun. Mais la similitude la plus notable est probablement que ni les écrivains ni les programmeurs ne peuvent terminer leur travail à temps. Les écrivains sont connus pour avoir dépassé les délais. Les programmeurs ont acquis la réputation de personnes dont les résultats sont toujours très différents des calculs initiaux. La question se pose: pourquoi?

Aujourd'hui, j'ai eu une idée de comment y répondre. Et mes découvertes m'ont étonné.

Étudier mes livres

Mes deux livres, Hello, startup et Terraform: nous lançons et travaillons , j'ai écrit dans l'environnement de création de livres Atlas , qui prévoit de gérer tout le contenu à l'aide de Git. Cela signifie que chaque ligne de texte, chaque modification et chaque modification a été validée dans le journal de validation Git.

Voyons combien d'efforts ont été consacrés à l'écriture de deux livres.

Salut démarrage

Commençons par mon premier livre. Bonjour démarrage . Il compte 602 pages et environ 190 mille mots. J'ai exécuté cloc dans le référentiel Hello, Startup git et j'ai obtenu les résultats suivants (pour plus de simplicité, les parties fractionnaires sont jetées):

602 pages contiennent 26 571 lignes de texte. La part du lion est écrite en AsciiDoc , similaire à Markdown. Il est utilisé par Atlas pour écrire presque n'importe quel contenu. En utilisant HTML et CSS, Atlas définit la mise en page et la structure d'un livre. En plus d'eux, il existe d'autres langages de programmation (Java, Ruby, Python et pas seulement), dans lesquels divers exemples sont écrits pour les sujets abordés dans le livre.

Mais 602 pages et 26 571 lignes ne sont que le résultat final. Ils ne reflètent pas environ 10 mois d'écriture, de modification, d'édition, de relecture, d'ajustements stylistiques, de recherche, de notes et d'autres travaux qui contribuent à la publication du livre. Par conséquent, pour obtenir des idées plus utiles, j'ai utilisé git-quick-stats pour analyser l'intégralité du journal de validation du livre.

J'ai donc ajouté 163 756 lignes et supprimé 131 425, ce qui donne au total 295 181 lignes de matériel traité. Autrement dit, il s'avère que j'ai écrit ou supprimé un total de 295 181 lignes, dont 26 571 lignes sont restées à la suite. Ce rapport est un peu plus de 10: 1. Pour obtenir chaque ligne publiée, je devais d'abord en écrire 10 autres!

J'admets que le comptage du nombre de lignes ajoutées et supprimées de Git ne peut pas être considéré comme une métrique idéale pour le processus d'édition. Mais, au moins, cela nous permet de comprendre qu'un simple calcul ne suffit pas pour évaluer le travail effectué. Une partie substantielle du processus n'était pas du tout reflétée dans le journal de validation de Git. Par exemple, les premiers chapitres ont été écrits dans Google Docs avant mon passage à Atlas, et de nombreuses modifications ont été apportées à mon ordinateur sans commits.

Malgré le fait que ces données sont loin d'être idéales, je pense que le rapport global du «texte original» au document publié est de 10: 1.

Terraform: nous commençons et travaillons

Vérifions si cette proportion est applicable à mon deuxième livre Terraform: nous lançons et travaillons , qui contient 206 pages et environ 52 mille mots.

La sortie simplifiée de cloc :

206 pages se composent de 8410 lignes de texte. Encore une fois, la plupart du texte est écrit en AsciiDoc, bien que ce livre contienne beaucoup plus d'exemples de code écrits principalement en HCL, le langage principal de Terraform. Outre lui, il existe de nombreux Markdowns que j'ai utilisés pour documenter des exemples HCL.

Nous utiliserons git-quick-stats pour vérifier l'historique des révisions de ce livre:

Pendant près de cinq mois, j'ai ajouté 32 209 et supprimé 22 402 lignes, pour un total de 54 611 lignes recyclées. La précision de l'évaluation du processus d'édition de ce livre en souffre encore plus, car le travail a commencé comme une série de billets de blog qui ont subi une révision tangible avant d'être déplacés vers Atlas et Git. Le volume de ces articles de blog occupe au moins la moitié du livre, il sera donc logique d'augmenter de 50% le taux final du texte traité. Autrement dit, il se révélera 54611 * 1,5 = 81 916 lignes de texte modifiable, résultant en un total de 8410 lignes.

Et encore une fois, un rapport d'environ 10: 1!

Il n'est pas surprenant que les écrivains ne respectent pas les délais. Si le calendrier est censé remettre un livre de 250 pages, alors en pratique il s'avère que dans le processus, nous écrirons 2500 pages.

Et la programmation?

Comment se déroule le développement? J'ai décidé de consulter plusieurs référentiels git open source de différents niveaux de maturité: de quelques mois à 23 ans.

terraform-aws-couchbase (2018)

terraform-aws-couchbase est un ensemble de modules pour déployer et gérer Couchbase sur AWS, dont le code source a été ouvert en 2018.

La sortie simplifiée de cloc :

Et voici le résultat de la vérification de git-quick-stats :

Nous obtenons jusqu'à 37 693 lignes de code de travail, ce qui donne 7481 lignes du code final dans un rapport de 5: 1. Même dans le référentiel de moins de 5 mois, j'ai dû réécrire chaque ligne cinq fois! Il n'est pas surprenant que l'évaluation du développement logiciel soit compliquée: nous n'imaginons même pas que pour obtenir 7,5 mille lignes de code final, nous devons en réalité écrire 35 mille

Voyons comment les choses se passent avec les anciens produits.

Terratest (2016)

Terratest est une bibliothèque open source créée en 2016 pour tester le code d'infrastructure.

La sortie simplifiée de cloc :