🛍️ 😳 🦌 Armazenamento em cache em disco de árvores de computação preguiçosa 🔄 👲🏻 👩🏾‍🤝‍👨🏼

Não vale a pena falar em detalhes sobre o conceito de computação lenta. A idéia de fazer a mesma coisa com menos frequência, especialmente se for longa e pesada, é tão antiga quanto o mundo. Porque imediatamente ao ponto.

Segundo o autor deste texto, um lenificador normal deve:

Salve os cálculos entre as chamadas do programa.
Rastreie as alterações na árvore de cálculo.
Possui sintaxe moderadamente transparente.

Árvore preguiçosa

Conceito

Em ordem:

Salve os cálculos entre as chamadas do programa:
De fato, se chamamos o mesmo script várias dezenas de centenas de vezes por dia, por que devemos recalcular o mesmo cada vez que o script é chamado, se é possível armazenar o objeto de resultado em um arquivo. É melhor puxar um objeto do disco, mas ... devemos ter certeza de sua relevância. De repente, o script é reescrito e o objeto salvo está desatualizado. Com base nisso, não podemos carregar o objeto apenas com a existência de um arquivo. O segundo ponto segue a partir disso.
Acompanhe as alterações na árvore de cálculo:
A necessidade de atualizar o objeto deve ser calculada com base nos dados sobre os argumentos da função que o gera. Portanto, teremos certeza de que o objeto carregado é válido. De fato, para uma função pura, o valor de retorno depende apenas dos argumentos. Isso significa que, enquanto armazenamos em cache os resultados de funções puras e monitoramos a mudança de argumentos, podemos ter calma quanto à relevância do cache. Além disso, se o objeto calculado depender de outro objeto armazenado em cache (lento), que por sua vez depende de outro, será necessário trabalhar corretamente as alterações nesses objetos, atualizando oportunamente os nós da cadeia que deixaram de ser relevantes. Por outro lado, seria bom levar em consideração que nem sempre precisamos carregar os dados de toda a cadeia de cálculo. Freqüentemente, carregar apenas o objeto de resultado final é suficiente.
Possui sintaxe moderadamente transparente:
Este ponto é claro. Se, para reescrever o script para cálculos preguiçosos, for necessário alterar o código inteiro, essa é uma solução mais ou menos. As alterações devem ser feitas no mínimo.

Essa linha de raciocínio levou a uma solução técnica, denominada em python pela biblioteca evalcache (links no final do artigo).

Solução de sintaxe e mecanismo de trabalho

Exemplo simples

import evalcache import hashlib import shelve lazy = evalcache.Lazy(cache = shelve.open(".cache"), algo = hashlib.sha256) @lazy def summ(a,b,c): return a + b + c @lazy def sqr(a): return a * a a = 1 b = sqr(2) c = lazy(3) lazyresult = summ(a, b, c) result = lazyresult.unlazy() print(lazyresult) #f8a871cd8c85850f6bf2ec96b223de2d302dd7f38c749867c2851deb0b24315c print(result) #8

Como isso funciona?

A primeira coisa que chama sua atenção aqui é a criação do decorador preguiçoso. Essa solução sintática é bastante padrão para os pitães Python. O decorador lento é passado para um objeto de cache no qual o lenificator armazenará os resultados dos cálculos. Os requisitos da interface do tipo dict são sobrepostos ao tipo de cache. Em outras palavras, podemos armazenar em cache tudo o que implementa a mesma interface que o tipo de ditado. Para demonstrar no exemplo acima, usamos o dicionário da biblioteca de arquivar.

O decorador também recebe um protocolo de hash que ele usará para construir chaves de hash de objetos e algumas opções adicionais (permissão de gravação, permissão de leitura, saída de depuração), que podem ser encontradas na documentação ou no código.

O decorador pode ser aplicado a funções e objetos de outros tipos. Nesse momento, um objeto lento é construído com base em uma chave de hash calculada com base na representação (ou usando uma função de hash especialmente definida para esse tipo de função).

Um recurso importante da biblioteca é que um objeto lento pode gerar outros objetos preguiçosos, e o hash do pai (ou pais) será misturado à chave de hash do descendente. Para objetos preguiçosos, é permitido o uso da operação de obter um atributo, o uso de chamadas ( __call__ ) de objetos e o uso de operadores.

Ao passar por um script, de fato, nenhum cálculo é realizado. Para b, o quadrado não é calculado e para o resultado lazyres, a soma dos argumentos não é considerada. Em vez disso, uma árvore de operações é construída e chaves de hash de objetos preguiçosos são calculadas.

Cálculos reais (se o resultado não tiver sido colocado anteriormente no cache) serão executados apenas na linha: result = lazyresult.unlazy()

Se o objeto foi calculado anteriormente, ele será carregado a partir do arquivo.
Você pode visualizar a árvore de construção:

Criar visualização em árvore

 evalcache.print_tree(lazyresult) ... generic: <function summ at 0x7f1cfc0d5048> args: 1 generic: <function sqr at 0x7f1cf9af29d8> args: 2 ------- 3 -------

Como os hashes dos objetos são construídos com base nos dados dos argumentos que geram esses objetos, quando o argumento muda, o hash do objeto muda e, com ele, os hashes de toda a cadeia, dependendo dele. Isso permite que você mantenha os dados do cache atualizados, fazendo atualizações no prazo.

Objetos preguiçosos se alinham em uma árvore. Se realizarmos uma operação preguiçosa em um dos objetos, exatamente quantos objetos serão carregados e contados conforme necessário para obter um resultado válido. Idealmente, o objeto necessário simplesmente será carregado. Nesse caso, o algoritmo não puxará objetos formadores para a memória.

Em ação

Acima foi um exemplo simples que mostra a sintaxe, mas não demonstra o poder computacional da abordagem.
Aqui está um exemplo um pouco mais próximo da vida real (usado pelo sympy).

Exemplo usando sympy e numpy

 #!/usr/bin/python3.5 from sympy import * import numpy as np import math import evalcache lazy = evalcache.Lazy(evalcache.DirCache(".evalcache"), diag = True) pj1, psi, y0, gamma, gr= symbols("pj1 psi y0 gamma gr") ###################### Construct sympy expression ##################### F = 2500 xright = 625 re = 625 y0 = 1650 gr = 2*math.pi / 360 #gamma = pi / 2 xj1q = xright + re * (1 - cos(psi)) yj1q = (xright + re) * tan(psi) - re * sin(psi) #+ y0 pj1 = sqrt(xj1q**2 + yj1q**2) pj2 = pj1 + y0 * sin(psi) zj2 = (pj2**2)/4/F asqrt = sqrt(pj2**2 + 4*F**2) xp2 = 2*F / asqrt yp2 = pj2 / asqrt xp3 = yp2 yp3 = -xp2 xmpsi = 1295 gmpsi = 106 * gr aepsi = 600 bepsi = 125 b = 0.5*(1-cos(pi * gamma / gmpsi)) p1 = ( (gamma * xmpsi / gmpsi * xp2) * (1-b) + (aepsi * xp2 * sin(gamma) + bepsi * yp2 * (1-cos(gamma)))*b + pj1 ) ####################################################################### #First lazy node. Simplify is long operation. #Sympy has very good representations for expressions print("Expression:", repr(p1)) print() p1 = lazy(simplify)(p1) ######################################################################################### ## Really don't need to lazify fast operations Na = 200 angles = [t * 2 * math.pi / 360 / Na * 106 for t in range(0,Na+1)] N = int(200) a = (np.arange(0,N+1) - N/2) * 90/360*2*math.pi/N ######################################################################################### @lazy def genarray(angles, a, p1): points = [] for i in range(0, len(angles)): ex = p1.subs(gamma, angles[i]) func = lambdify(psi, ex, 'numpy') # returns a numpy-ready function rads = func(a) xs = rads*np.cos(a) ys = rads*np.sin(a) arr = np.column_stack((xs,ys,[i*2]*len(xs))) points.append(arr) return points #Second lazy node. arr = genarray(angles, a, p1).unlazy() print("\nResult list:", arr.__class__, len(arr))

Operações para simplificar expressões simbólicas são extremamente caras e pedem literalmente lenificação. A construção adicional de uma grande variedade leva ainda mais tempo, mas, graças à lenificação, os resultados serão extraídos do cache. Observe que, se quaisquer coeficientes forem alterados na parte superior do script em que a expressão sympy é gerada, os resultados serão recalculados porque a chave de hash do objeto lento será alterada (graças às declarações __repr__ ).

Muitas vezes, uma situação ocorre quando um pesquisador realiza experimentos computacionais em um objeto gerado por um longo tempo. Ele pode usar vários scripts para separar a geração e o uso do objeto, o que pode causar problemas com a atualização prematura dos dados. A abordagem proposta pode facilitar esse caso.

O que é isso tudo?

evalcache faz parte do projeto zencad. Este é um pequeno script cadic, inspirado e explorando as mesmas idéias do openscad. Diferentemente do openscad orientado a malha, o zencad em execução no núcleo opencascade usa uma representação brep de objetos, e os scripts são escritos em python.

As operações geométricas são frequentemente realizadas por um longo período de tempo. A desvantagem dos sistemas de script cad é que toda vez que você executa o script, o produto é completamente recontado novamente. Além disso, com o crescimento e a complicação do modelo, os custos indiretos não crescem linearmente. Isso leva ao fato de que você pode trabalhar confortavelmente apenas com modelos extremamente pequenos.

A tarefa do evalcache era amenizar esse problema. No zencad, todas as operações são declaradas preguiçosas.

Exemplos:

Exemplo de construção de modelo

 #!/usr/bin/python3 #coding: utf-8 from zencad import * xgate = 14.65 ygate = 11.6 zgate = 11 t = (xgate - 11.7) / 2 ear_r = 8.6/2 ear_w = 7.8 - ear_r ear_z = 3 hx_h = 2.0 bx = xgate + ear_w by = 2 bz = ear_z+1 gate = ( box(xgate, ygate, t).up(zgate - t) + box(t, ygate, zgate) + box(t, ygate, zgate).right(xgate - t) ) gate = gate.fillet(1, [5, 23,29, 76]) gate = gate.left(xgate/2) ear = (box(ear_w, ear_r * 2, ear_z) + cylinder(r = ear_r, h = ear_z).forw(ear_r).right(ear_w)).right(xgate/2 - t) hx = linear_extrude( ngon(r = 2.5, n = 6).rotateZ(deg(90)).forw(ear_r), hx_h ).up(ear_z - hx_h).right(xgate/2 -t + ear_w) m = ( gate + ear + ear.mirrorYZ() - hx - hx.mirrorYZ() - box(xgate-2*t, ygate, zgate, center = True).forw(ygate/2) - box(bx, by, bz, center = True).forw(ear_r).up(bz/2) - cylinder(r = 2/2, h = 100, center = True).right(xgate/2-t+ear_w).forw(ear_r) - cylinder(r = 2/2, h = 100, center = True).left(xgate/2-t+ear_w).forw(ear_r) ) display(m) show()

Este script gera o seguinte modelo:

Observe que não há chamadas evalcache no script. O truque é que a lenificação é incorporada na própria biblioteca do zencad e nem é visível à primeira vista, embora todo o trabalho aqui esteja trabalhando com objetos preguiçosos, e o cálculo direto seja realizado apenas na função 'display'. Obviamente, se algum parâmetro do modelo for alterado, o modelo será recontado do local onde a primeira chave de hash foi alterada.

Modelos de computação volumosos

Aqui está outro exemplo. Desta vez, nos limitaremos a fotos:

O cálculo de uma superfície rosqueada não é uma tarefa fácil. No meu computador, esse parafuso é construído na ordem de dez segundos ... A edição de um modelo com threads é muito mais agradável usando o cache.

E agora isso é um milagre:

Cruzar superfícies rosqueadas é uma tarefa computacional complexa. Valor prático, no entanto, nada além de verificar a matemática. O cálculo leva um minuto e meio. Um objetivo digno de lenificação.

Os problemas

O cache pode não funcionar como planejado.
Os erros de cache podem ser divididos em falso positivo e falso negativo .

Erros negativos falsos

Erros de falso negativo são situações em que o resultado do cálculo está no cache, mas o sistema não o encontrou.
Isso acontece se o algoritmo de chave de hash usado pelo evalcache, por algum motivo, produziu uma chave diferente para recálculo. Se a função hash não for substituída pelo objeto do tipo em cache, o evalcache utilizará o __repr__ objeto para construir a chave.
Ocorre um erro, por exemplo, se a classe que está sendo object.__repr__ não substituir o object.__repr__ padrão object.__repr__ , que muda do início ao início. Ou, se o __repr__ substituído, depende de alguma forma insignificante para o cálculo dos dados alterados (como o endereço do objeto ou o carimbo de data / hora).

Ruim:

 class A: def __init__(self): self.i = 3 A_lazy = lazy(A) A_lazy().unlazy() #        -  __repr__.

Bom:

 class A: def __init__(self): self.i = 3 def __repr__(self): return "A({})".format(self.i) A_lazy = lazy(A) A_lazy().unlazy() #     .

Os erros falsos negativos levam ao fato de que a lenificação não funciona. O objeto será recontado a cada nova execução de script.

Erros de falsos positivos

Este é um tipo de erro mais vil, pois leva a erros no objeto final de cálculo:
Isso pode acontecer por duas razões.

Incrível:
Ocorreu uma colisão de chave de hash no cache. Para o algoritmo sha256 com um espaço de 115792089237316195423570985008687907853269984665640564039457584007913129639936 chaves possíveis, a probabilidade de uma colisão é desprezível.
Provável:
Uma representação de um objeto (ou uma função de hash substituída) não a descreve completamente ou coincide com a representação de um objeto de outro tipo.

 class A: def __init__(self): self.i = 3 def __repr__(self): return "({})".format(self.i) class B: def __init__(self): self.i = 3 def __repr__(self): return "({})".format(self.i) A_lazy = lazy(A) B_lazy = lazy(B) a = A_lazy().unlazy() b = B_lazy().unlazy() #.     B,        A.

Ambos os problemas estão relacionados a um objeto __repr__ incompatível. Se, por algum motivo, for impossível substituir o tipo de objeto __repr__ , a biblioteca permitirá definir uma função de hash especial para o tipo de usuário.

Sobre análogos

Existem muitas bibliotecas de lenificação que basicamente consideram suficiente executar um cálculo não mais de uma vez por chamada de script.

Existem muitas bibliotecas de cache de disco que, a seu pedido, salvarão um objeto com a chave necessária para você.

Mas ainda não consegui encontrar bibliotecas que permitissem resultados de armazenamento em cache na árvore de execução. Se houver, por favor, inseguro.

Referências:

Projeto Github
Projeto Pypi

Armazenamento em cache em disco de árvores de computação preguiçosa