Dari Tula ke Berlin: Analisis Urban di Instagram


Bukan rahasia lagi bahwa di Instagram Anda dapat menemukan foto-foto kota besar mana pun. Bagaimana jika kita mencoba merekonstruksi keseluruhan gambar dari fragmen? Informasi yang diperoleh akan membantu untuk memahami ide tempat-tempat asing dan akan berguna bagi para pelancong, melengkapi panduan perjalanan tradisional.

Gagasan menganalisis kota berdasarkan foto pada umumnya bukan hal baru [ 1 , 2 , 3 ], tetapi terus terang, artikel yang ditemukan tidak terlalu banyak memberi tahu.

Cara mengumpulkan data dari instagram adalah topik yang telah dibahas berulang kali dan tidak dipertimbangkan dalam artikel ini. Sesuatu dapat ditarik melalui API, tetapi jika tidak ada akses ke sana, ada opsi alternatif .

Alat dasar kami adalah Python dan Plotly. Pada akhirnya, ada tautan ke laptop GitHub dan Jupyter untuk berbagai kota (grafiknya interaktif, oleh karena itu berisi lebih banyak informasi dan direkomendasikan untuk kenalan tatap muka). Script untuk pengumpulan data juga termasuk dalam repositori.

Pada artikel ini kita akan berkeliling Berlin. Dataset yang dipertimbangkan dalam artikel ini berisi sekitar 100rb foto untuk ~ 2rb lokasi.

Untuk setiap lokasi kita membutuhkan:

  1. Judul
  2. Koordinat
  3. Foto (10-100 pcs.)
  4. Jumlah posting (variabel edge_location_to_media pada halaman lokasi, itu tidak muncul dalam dokumentasi, tetapi dengan indikasi tidak langsung artinya persis seperti itu)


Jalan pertama


Letakkan data di peta. Untuk menyoroti tempat tersibuk, kami menggabungkan lokasi yang terletak di jalan yang sama menjadi satu penanda. Peta akan digambar menggunakan Mapbox.


Peta Berlin. Penanda menunjukkan jumlah lokasi

Mari berkenalan dengan nama-nama tempat utama. Untuk melakukan ini, kita perlu mengonversi koordinat tempat ke alamat - ini adalah tugas geocoding terbalik. Untuk mengatasinya, Google Geocoding API digunakan. Setelah mengumpulkan geodata, kami menyortir jalan-jalan dan area dengan jumlah lokasi.


Untuk kota-kota seperti Moskow, informasi tentang distrik tidak terlalu penting, semua yang ada di pusat hampir sama, tetapi Berlin lebih heterogen dan oleh karena itu berguna untuk membedakan, misalnya, Kreuzberg dari Prenzlauer Berg .

Mari kita lihat daftar tempat yang diurutkan berdasarkan popularitas.

Lokasi teratas
location, edge_location_to_media
Alexanderplatz Berlin, 695533
East Side Gallery, 537034
Brandenburger Tor, 525004
Berliner Dom, 411376
Berlin Kreuzberg, 364077
Berlin Mitte, 340891
Memorial to the Murdered Jews of Europe, 251433
Berlin Wall, 228749
Kreuzberg Berlin Germany, 218383
Potsdamer Platz, 182316
Checkpoint Charlie, 171895
Brandenburg Gate, 143530
Mercedes Benz Arena Berlin, 143498
Zoo Berlin, 140465
Berlin Hauptbahnhof, 138153
Gendarmenmarkt Berlin, 114615
Berliner Fernsehturm, 106127
Friedrichshain, 104376
Reichstag dome, 101895
Berlin Germany, 97402
East Side Gallery Berlin Wall, 96385
Jüdisches Museum Berlin Jewish Museum Berlin, 94647
Berlin the place to be, 92444
FAR AWAY, 91062
Berlin Reichstag, 90945
Museum Island, 84010
Potsdamer Platz Berlin, 80733
Hamburger Bahnhof Museum für Gegenwart Berlin, 79323
Kurfürstendamm, 75632
KaDeWe, 73312
Pergamonmuseum, 71524
Tempelhofer Feld, 70472
Azad Gence, 69566
Reichstag building, 69028
Tiergarten Berlin Germany, 65391
Berghain Panorama Bar, 60807
Mall of Berlin, 60718
Schöneberg Berlin Germany, 60482
Tiergarten Berlin, 60210
Hackescher Markt, 59899
Klunkerkranich, 59661
Berlin Victory Column, 57304
Berlin Prenzlauer Berg, 56705
Madame Tussauds Berlin, 55351
Hackesche Höfe, 55183
Bikini Berlin, 50920
Alexanderplatz, 48875
Alte Nationalgalerie, 48346
Museum für Naturkunde Berlin, 46786
The Wall Of Berlin, 46708
NENI Berlin Monkey Bar, 44770
Flughafen Berlin Tempelhof, 44197
Columbiahalle, 43717
Brandenburger Tor, 43484
Berlin Germany, 42739
Warschauer Straße, 41897
Reichstag, 41321
Berlin Holocaust Memorial, 39930
Brandebourg Tor Berlin , 38949
Berlinische Galerie, 37947
Sony Center, 37539
Berliner Philharmonie, 37431
Konzerthaus Berlin, 36905
Tempodrom, 35982
Berlin Mitte, 35895
Friedrichshain, 34693
Urban Spree, 34613
Kraftwerk Berlin, 34392
Bode Museum, 34205
Bundestag, 33998
SONY Center Berlin am Potsdamer Platz, 33628
Berlin Brandenburger Tor, 33098
Brandenburger Tor, 32857
Berlin Zoological Garden, 32718
Deutsches Historisches Museum, 32604
Humboldt Universität zu Berlin, 32308
C/O Berlin, 32294
Astra Kulturhaus Berlin, 30082
Badeschiff Berlin, 30007
Markthalle Neun, 29989
Michelberger Hotel, 29444
Altes Museum, 29009
Hotel Adlon Kempinski Berlin, 28889
Mauerpark, 28282
YAAM Berlin, 27925
Mitte, 27681
Hofbräu Berlin, 27561
Huxleys Neue Welt, 27546
Oberbaum Bridge, 27131
Friedrichstadt Palast Berlin, 27009
STATION Berlin, 26816
Velodrom Berlin, 26385
Moabit, 26350
Neues Museum, 26346
Gedächtniskirche, 26316


Ini mencampur tempat-tempat "formal" (monumen, museum, galeri) dengan "informal" (klub, bar, toko). Untuk memisahkan satu dari yang lain, kami membutuhkan data dari Wikipedia; tidak seperti instagram, API-nya tersedia untuk semua pendatang secara penuh. Pada satu poros, kami menunda jumlah posting di instagram, di sisi lain, berapa kali artikel Wikipedia dilihat tentang tempat ini. Dalam gambar ini, lebih banyak tempat "formal" akan ditempatkan lebih tinggi, lebih populer di sebelah kanan.

Untuk mengurangi kesalahan, kami akan mengelompokkan lokasi di sepanjang jalan, seperti pada peta. Dalam proses memilih artikel untuk lokasi, beberapa data hilang, sehingga gambar akan mengandung poin lebih sedikit daripada peta.
Grafik Insta-wiki. Untuk beberapa jalan, tempat paling signifikan ditandai. Lihat laptop untuk informasi lebih lanjut.

Ke mana harus pergi selfie? Perkirakan proporsi foto yang mengandung wajah. OpenCV dan kaskade Haar akan membantu kami dalam hal ini.
Bagikan foto yang berisi wajah. Poin di sisi kanan gambar adalah tempat populer untuk selfie (baik, atau pameran rias)

Lebih dalam


Selanjutnya, kami menerapkan jaringan saraf untuk menentukan lingkungan dalam foto. Kami menggunakan CNN Places365 , dilatih tentang dataset yang dikompilasi di MIT [4] . Tag yang paling cocok untuk tugas ini dipilih. Cari tahu mana yang lebih umum:
Peringkat Tag. Nama dibiarkan asli. Mereka tidak perlu dianggap secara harfiah: martial_arts_gym lebih seperti gym, dan tag disko dapat dengan mudah menandai ruangan gelap

Mari kita lihat tag mana yang sesuai dengan jalan:

Hal yang sama di peta:


Peta Berlin dengan tag paling khas. Lihatlah label disko di sebelah kanan - ini Friedrichshain, distrik kehidupan malam yang semarak

Halo Hallo, Hola


Salah satu cara untuk mempelajari sesuatu tentang kota baru adalah membandingkannya dengan kota yang Anda kenal. Kami mengambil vektor fitur untuk lokasi dua kota dan menggunakan t-SNE kami memperoleh koordinat dua dimensi. Untuk kejelasan, sosok lokasi tersembunyi itu berada di area kota lawan.

Perbandingan lokasi di Berlin dan Moskow. Label menunjukkan sifat dominan di lapangan. Kelompok warna yang berbeda yang terletak bersebelahan menunjukkan titik kontak antar kota, yaitu tempat yang serupa

Mari kita lihat perbedaan tanda:
Perbedaan tanda antara Berlin dan Moskow. Sepertinya di ibu kota kita lebih sering difoto di gym dan kamar pas

Artikel
1. Cara Belajar Kota di Instagram
2. Apa Yang Kami Instagram: Analisis Pertama Konten Foto Instagram dan Jenis Pengguna
3. Memperbesar ke Kota Instagram: Membaca lokal melalui media sosial
4. Tempat: 10 juta Database Gambar untuk Pengenalan Pemandangan

Laptop
Tula , Moskow , St. Petersburg , Berlin , Roma , Hong Kong

Github
github.com/pskryuchkov/voyage

Source: https://habr.com/ru/post/id447132/


All Articles