Os bancos de dados ajudam a compartilhar os resultados de experimentos e medições, desempenham um papel importante na formação do ambiente acadêmico e no processo de desenvolvimento de especialistas.
Falaremos sobre conjuntos de dados obtidos com equipamentos caros (as fontes desses dados geralmente são grandes organizações internacionais e programas científicos, geralmente relacionados às ciências naturais), bem como bancos de dados estaduais.

Foto Jan Antonin Kolar - UnsplashData.gov.ru é um projeto do governo no campo de dados abertos que é bem conhecido pelos vendedores ambulantes. Sua contraparte em Moscou é
Data.mos.ru. Das opções estrangeiras, vale destacar o
Data.gov - uma plataforma com dados abertos do governo dos EUA (um
único catálogo com filtros).
O sistema de informações da universidade é um projeto da Universidade Estadual de Moscou, que combina bancos de dados com informações estatísticas sobre a situação social e econômica do país, bem como publicações de fontes estatais e científicas. Os dados são retirados de Rosstat e de estudos realizados na Universidade Estadual de Moscou. O recurso pode ser usado sem registro prévio, mas para acesso total, você precisará se inscrever.
Base cartográfica do Instituto Geológico da Rússia. Karpinsky. As informações sobre os recursos naturais do país coletadas ao longo da existência da instituição foram impressas em mapas digitais. A interface do site permite mapear o OpenStreetMap ou o I. Maps com vários outros itens. camadas com informações sobre o campo magnético, minerais, etc.
O GEOSS é um portal para encontrar dados de observação da Terra de satélites e drones de vários tipos. O arquivo de recursos é coletado por
90 organizações em todo o mundo. Para encontrar informações de interesse, basta selecionar a área desejada no mapa ou direcionar palavras-chave para a pesquisa.
MAST é um arquivo financiado pela NASA. Os dados apresentados são coletados por
telescópios em órbita - você pode estudar e baixar estudos usando a
pesquisa com filtros .
Foto Max Bender - UnsplashO OpenEI é uma plataforma para encontrar dados abertos sobre uso de energia, em particular sobre recursos de energia renovável e novas tecnologias na indústria. O site é organizado de acordo com o princípio do wiki - a validade dos dados é verificada pela
comunidade .
Os Dados Experimentais de Reação Nuclear (EXFOR) são uma biblioteca que contém dados de 22.615 experimentos com partículas elementares. Completo com os bancos de dados CINDA (Índice de Computador de Dados de Reação Nuclear) e IBANDL (Biblioteca de Dados Nucleares de Análise de Feixes de Íons), é um dos maiores bancos de dados de física nuclear. Supervisionado pelo Laboratório Nacional Brookhaven nos EUA, mas contém experimentos de todo o mundo - incluindo
Rússia e China .
Centros Nacionais de Informação Ambiental - arquivo de dados ambientais. Aqui você terá acesso a vinte petabytes de dados oceânicos e geofísicos, além de informações sobre a atmosfera e as zonas costeiras. Em particular, existem informações sobre a profundidade do oceano, a superfície do Sol, registros de rochas sedimentares e imagens de satélite. Você pode usar o
catálogo para procurar o conjunto de dados desejado.
O ADS é um repositório de dados arqueológicos gerenciados pela Universidade de York. Existem publicações científicas antigas e novas, informações sobre escavações e artefatos. Existem três categorias para pesquisa: ArchSearch, Archives e Library. O primeiro armazena dados sobre escavações e artefatos. No segundo - um arquivo de todos os materiais baixados. Na terceira - publicações de revistas, livros e estudos. Existem opções de pesquisa para países, épocas e tipos de objetos.
DRYAD - este serviço ajuda a buscar informações para pesquisas científicas em um banco de dados de 80 mil arquivos. Pesquisas e artigos do banco podem ser usados sob a licença
CC0 . O assunto dos materiais inclui vários campos do conhecimento, mas a maioria das pesquisas está relacionada à medicina e à ciência da computação. De acordo com
estatísticas internas, em 2018, os usuários do site estavam mais interessados em canções de baleias, tolerância à temperatura de habitantes marinhos e atividade neural no lobo temporal do cérebro humano.
No laboratório “ Nanomateriais avançados e dispositivos optoeletrônicos ” da Universidade ITMOO GenBank é uma biblioteca de DNA fornecida pelo Centro Nacional de Informações sobre Biotecnologia dos EUA (NCBI), além de bancos de dados na Europa e no Japão.
A pesquisa por identificadores está disponível em um mecanismo de pesquisa especial, usando a ferramenta
BLAST ou
programaticamente .
O PubChem é um banco de dados composto e de bioensaio hospedado pelo Centro Nacional de Informações sobre Biotecnologia dos EUA. Existe uma interface da web com pesquisa avançada (um exemplo sobre os
efeitos colaterais da água ). Os dados são divulgados em domínio público.
O Banco de Dados de Proteínas (RCSB PDB) é um banco de imagens de proteínas e ácidos nucléicos, cuja história remonta a 1971. Foi originalmente desenvolvido como um projeto interno do Laboratório Nacional Brookhaven, mas depois se transformou no maior banco de dados internacional desse tipo. A maioria das revistas acadêmicas relacionadas à bioquímica obriga os autores a publicar modelos de proteínas obtidos durante a pesquisa no site.
O InterPro é um banco de dados que combina muitos conjuntos de dados de vários projetos científicos. Inclui o
SMART - um programa para analisar domínios em seqüências de proteínas, com base em tecnologias de aprendizado de máquina e um conjunto de dados de 1200 modelos. Apoiado pelo Instituto Europeu de Bioinformática.
Visitas fotográficas dos laboratórios da Universidade ITMO: