Você sabia que, de 15 de outubro a 15 de dezembro, é realizado um dos maiores campeonatos de análise de dados sísmicos do mundo, o Rosneft Seismic Challenge, com um total de prêmios de 1 milhão de rublos e uma final de 21 de dezembro em Moscou?
Acredita-se que entrar no setor de petróleo, onde os salários não são inferiores ao setor de TI, é bastante difícil do lado de fora. Há alguma verdade nisso, porque a esfera é bastante específica e não favorece as pessoas "fora de tópico". Este evento visa simplificar a entrada neste mundo subterrâneo para equipes jovens e talentosas que trabalham com reconhecimento de imagem e aprendizado de máquina.

Coloco este tópico na seção "PR" porque: a) quero ajudar os compatriotas da Ufa; b) Acredito na alta qualificação dos vendedores ambulantes. E será ótimo se alguns conhecerem outros. Ao mesmo tempo, serei um pouco tradutor de tecnológico para humano.
Então, qual é o desafio?
A tarefa é: “Separação de horizontes sísmicos em um cubo de amplitude - segmentação de dados usando reconhecimento de imagem”. O campeonato está
hospedado na plataforma Boosters.pro. O organizador é o instituto corporativo da LLC BashNIPIneft, um dos líderes (por incrível que pareça) no desenvolvimento de
software de
petróleo e gás . Um exemplo indicativo de seu trabalho bem-sucedido é o desenvolvimento e
implementação do RN-GRID , um software industrial proprietário para modelagem matemática e análise do processo de criação de trincas durante o fraturamento hidráulico.
Eu traduzo a tarefa para o russo
Apesar do nome terrível, a tarefa se resume à análise de imagens usando o aprendizado de máquina. Mas, como sempre, há muitas nuances.
A exploração sísmica é o principal método para detectar petróleo e gás. O método é baseado na excitação de vibrações elásticas e no registro subsequente da resposta das rochas. Essas vibrações se propagam através da espessura da terra, refratando e refletindo nos limites das camadas geológicas com propriedades diferentes. As ondas refletidas retornam à superfície e são gravadas. A saída é o chamado cubo sísmico, que é cortado em camadas vertical e horizontalmente. Temos essas seções (linhas cruzadas e interlinhas), nas quais rochas com propriedades diferentes são visíveis.

A tarefa dos participantes é determinar e marcar com precisão essas horizontes de camadas em todo o cubo sísmico, com base no treinamento preliminar em 10% do cubo. É fácil né?
E agora em termos comuns:
“Correlação na exploração sísmica refere-se ao processo de identificação e rastreamento de horizontes refletidos, vários complexos sísmicos de fácies (recifes etc.) em tempo, profundidade e espaço, em sismogramas e no tempo total e profundidade de dados sísmicos.
No processo de rastreamento de horizontes refletidos, é usada uma combinação de atributos sísmicos dinâmicos e cinemáticos. Em sua análise complexa, as fronteiras refletivas do campo de ondas no espaço são correlacionadas pelo rastreamento dos extremos mais pronunciados (ou transição através de 0) do campo de ondas, levando principalmente em consideração o sinal de similaridade dos traços sísmicos vizinhos.
Ao mesmo tempo, é considerada a propriedade da suavidade da mudança no momento do registro da chegada das ondas. Uma linha que conecta os recursos característicos (extremos) da mesma onda em caminhos diferentes é geralmente chamada de eixo de modo comum. As ondas refletidas são geralmente correlacionadas com os extremos mais distintos (fases). Ao mesmo tempo, os intérpretes geralmente aderem ao princípio - de mais confiável a menos confiável.
Primeiro, traçaremos os horizontes traçados com confiança em uma área significativa da área de estudo e teremos uma referência geológica adequada. Tais horizontes refletidos são comumente referidos como referência ou referência. Eles são marcadores regionais. Seu rastreamento e interpretação podem aumentar significativamente a compreensão de todo material sísmico, história tectônica, condições de sedimentação ".
Kirilov A.S., Zakrevsky K.E., Workshop sobre interpretação sísmica no PETREL. M.: PUBLISHING HOUSE MAI-PRINT, 2014 - 288 p.
Precisa de mais informações?
Sobre esse problema, há uma grande quantidade de informações básicas em russo em quase todos os formatos. Incluindo no Youtube. Por exemplo, você pode citar um excelente vídeo visual sobre o reconhecimento automático de horizontes sísmicos, disponibilizado gratuitamente pelo Centro Kazan de Educação Continuada IGiNGT KFU.
Parece-me depois dele que a tarefa inerente ao desafio deve se tornar mais compreensível.
Ok, o que precisa ser feito?
Com base nos primeiros 10% do cubo sísmico já marcados por um intérprete profissional, é necessário marcar as fatias restantes no conjunto de dados de teste ao longo dos limites das classes especificadas com o valor métrico máximo.

Com o que trabalhar?
O conjunto de dados de origem é uma matriz tridimensional de dados sísmicos (cubo de tempo total do atributo sísmico). Como mencionado acima, um cubo pode ser representado como fatias verticais 2D: linhas cruzadas e linhas internas.

Cada fatia consiste em vetores unidimensionais - traços (rastreio) de 2562 milissegundos de comprimento em incrementos de 2 ms. Número de linhas cruzadas: 1896. Número de linhas cruzadas: 2812.
Número total de execuções> 5 milhões
Número de classes de segmentação (ou seja, divisões de raças): 8.
Quem está esperando o desafio sísmico?
Os organizadores aguardam a participação de especialistas da área de análise de dados. Os prazos são limitados e o desafio é para a tecnologia que "já sabe". Indivíduos e equipes de até cinco pessoas podem participar da seleção competitiva.
Como participar?
Os participantes se registram no site
RN.DIGITAL . no Boosters.pro. Segundo as estatísticas, em 4 de novembro, 402 equipes se inscreveram para participar da competição.
Datas:
15/10/19 - 15/12/19 - realizando um concurso
24.11.19 - o fim da oportunidade de combinar equipes
15/10/19 - 01/12/19 - a primeira rodada do concurso
02/12/19 - 15/12/19 - a segunda rodada do concurso para as 30 melhores equipes da primeira rodada
21/12/19 - debriefing em tempo integral e recompensa de 10 equipes da segunda rodada na cidade de Moscou.
A organização da final é interessante: o conselho de especialistas avalia o trabalho final, mas não afeta a escolha dos vencedores. A distribuição dos finalistas é determinada pelos resultados da parte de correspondência da competição, com base na melhor métrica de qualidade de segmentação (Dice Metrics). Ao mesmo tempo, os participantes podem obter um “coque” extra para a melhor apresentação de sua decisão no valor de 50.000 rublos.
PS
Não sou o organizador deste desafio, por isso mal posso responder às perguntas dos comentários em detalhes. Se os habragiteli tiverem perguntas / interesses, posso convidar um representante dos organizadores e dos caras dos boosters nos comentários.