52 Datensatz fĂŒr Trainingsprojekte

  1. Mall Customers Dataset - Daten der Besucher des GeschÀfts: ID, Geschlecht, Alter, Einkommen, Ausgabenbewertung. ( Anwendungsfall: Kundensegmentierungsprojekt mit maschinellem Lernen )
  2. Iris Dataset - Datensatz fĂŒr AnfĂ€nger, der die GrĂ¶ĂŸe von KelchblĂ€ttern und BlĂŒtenblĂ€ttern fĂŒr verschiedene Blumen enthĂ€lt.
  3. MNIST- Datensatz - Datensatz handschriftlicher Nummern. 60.000 Trainingsbilder und 10.000 Testbilder.
  4. Der Boston Housing- Datensatz ist ein beliebter Mustererkennungsdatensatz. Es enthĂ€lt Informationen ĂŒber die HĂ€user in Boston: Anzahl der Wohnungen, Mietpreis, KriminalitĂ€tsindex.
  5. Fake News Detection Dataset - enthÀlt 7796 EintrÀge mit News Markup: true oder false. ( Anwendungsfall mit Python-Quelle: Fake News Detection Python Project )
  6. WeinqualitÀts- Datensatz - enthÀlt Weininformationen: 4898 DatensÀtze mit 14 Parametern.
  7. SOCR-Daten - Heights and Weights Dataset ist ein guter Anfang. EnthĂ€lt 25.000 Aufzeichnungen ĂŒber GrĂ¶ĂŸe und Gewicht von 18-JĂ€hrigen.
    EDISON Software - Webentwicklung
    Dieser Artikel wurde mit UnterstĂŒtzung von EDISON Software ĂŒbersetzt, einem Unternehmen, das hervorragende AuftrĂ€ge aus SĂŒdchina ausfĂŒhrt und auch Webanwendungen und Websites entwickelt .
  8. Parkinson-Datensatz - 195 DatensÀtze von Patienten mit Parkinson-Krankheit mit 25 Analyseparametern. Es kann zur vorlÀufigen Beurteilung des Unterschieds zwischen Kranken und Gesunden herangezogen werden. ( Anwendungsfall mit Python-Quelle: Maschinelles Lernprojekt zur Erkennung der Parkinson-Krankheit )
  9. Titanic-Datensatz - EnthÀlt Informationen zu Passagieren (Alter, Geschlecht, Angehörige an Bord usw.) 891 im Trainingssatz und 418 im Testsatz.
  10. Uber Pickups Dataset - Informationen zu 4,5 Millionen Reisen nach Uber 2014 und 14 Millionen 2015. ( Anwendungsfall mit Quelle in R: Uber Data Analysis Project in R )
  11. Chars74k Dataset - enthĂ€lt Bilder von britischen und kanadischen Zeichen aus 64 Klassen: 0-9, AZ, az. 7700 7.7k natĂŒrliche Bilder, 3400k handgeschriebene, 62000 computergenerierte Schriftarten.
  12. Credit Card Fraud Detection Dataset - enthÀlt Informationen zu Transaktionen mit manipulierten Kreditkarten. ( Anwendungsfall mit Quelle: Credit Card Fraud Detection Machine Learning Project )
  13. Chatbot Intents Dataset - JSON-Datei mit verschiedenen Tags: greetings, goodbye, hospital_search, pharmacy_search usw. EnthÀlt eine Reihe von Frage-Antwort-Vorlagen. ( Anwendungsfall mit Quelle in Python: Chatbot-Projekt in Python )
  14. Enron Email Dataset - EnthÀlt eine halbe Million E-Mails von 150 Enron-Managern.
  15. Der Yelp-Datensatz - enthĂ€lt 1,2 Millionen Empfehlungen von 1,6 Millionen Nutzern ĂŒber 1,2 Millionen Organisationen.
  16. Jeopardy Dataset - Über 200.000 Q & A-EintrĂ€ge aus einem beliebten Fernsehspiel.
  17. Recommender Systems Dataset ist ein Portal mit einer Sammlung von DatensÀtzen der UCSD University. EnthÀlt Rezensionen zu Rezensionen auf beliebten Websites (Goodreads, Amazon). Ideal zum Erstellen von Empfehlungssystemen. ( Anwendungsfall mit Quelle in R: Movie Recommendation System Project in R )
  18. UCI Spambase Dataset - Trainingsdatensatz zur Erkennung von Spam. EnthÀlt 4601 Buchstaben mit 57 Metadatenparametern.
  19. Flickr 30k Dataset - Über 30.000 Bilder und Untertitel. ( Flickr 8k-Datensatz - 8000 Bilder. Projekt mit Quelle in Python: Python-Projekt mit Bildbeschriftungsgenerator )
  20. IMDB-Testberichte - 25.000 Filmkritiken im Trainingssatz und 25.000 im Testsatz. ( Anwendungsfall mit Quelle in R: Sentiment Analysis Data Science Project )
  21. MS COCO-Datensatz - 1,5 Millionen getaggte Bilder.
  22. CIFAR-10- und CIFAR-100-Datensatz - CIFAR-10 enthÀlt 60.000 kleine Bilder 32 * 32 Pixel mit den Zahlen 0-9. CIFAR-100 bzw. 0-100.
  23. GTSRB-Datensatz - 50.000 Bilder von 43 Verkehrszeichen. ( Anwendungsfall mit Python-Quelle: Python-Projekt zur Verkehrszeichenerkennung )
  24. ImageNet-Datensatz - enthÀlt mehr als 100.000 Phrasen und etwa 1000 Bilder pro Phrase.
  25. Brusthistopathologie-Bilddatensatz - Der Datensatz enthÀlt Bilder von Brustkrebs-Proben. ( Anwendungsfall mit Quelle zu Breast Cancer Classification Python Project )
  26. Cityscapes Dataset - enthĂ€lt hochwertige Anmerkungen zu Videosequenzen von Straßen verschiedener StĂ€dte.
  27. Kinetics-Datensatz - EnthĂ€lt einen URL-Link zu etwa 6,5 ​​Millionen hochwertigen Videos.
  28. MPII-Datensatz fĂŒr menschliche Posen - Der Datensatz enthĂ€lt 25.000 Bilder von menschlichen Posen mit Anmerkungen fĂŒr die Gelenke.
  29. 20BN-Etwas-Etwas-Datensatz v2 ist ein Satz hochwertiger Videos, die zeigen, wie eine Person bestimmte Aktionen ausfĂŒhrt.
  30. Object 365- Datensatz - Datensatz mit hochwertigen Bildern mit Begrenzungsrahmen fĂŒr Objekte.
  31. Fotoskizzen-Datensatz - enthÀlt mehr als 1000 Bilder mit ihren Umrisszeichnungen.
  32. CQ500- Datensatz - Der Datensatz enthÀlt 491 CT-Scans des Kopfes mit 193.317 Schichten.
  33. IMDB-Wiki-Datensatz - Datensatz mit mehr als 5 Millionen Bildern von Personen, die mit Geschlecht und Alter gekennzeichnet sind. ( Anwendungsfall mit Quelle im Python-Projekt zur Erkennung von Geschlecht und Alter )
  34. Youtube 8M- Datensatz - Ein beschrifteter Videodatensatz, der 6,1 Millionen Youtube-Videokennungen enthÀlt
  35. Urban Sound 8K-Datensatz - Ein Satz von Stadt-Audiodaten (enthÀlt 8732 Stadt-Sounds aus 10 Klassen).
  36. LSUN-Datensatz ist ein Datensatz mit Millionen von Farbbildern von Szenen und Objekten (etwa 59 Millionen Bilder, 10 verschiedene Kategorien von Szenen und 20 verschiedene Kategorien von Objekten).
  37. RAVDESS Dataset ist eine audiovisuelle Datenbank fĂŒr emotionale Sprache. ( Anwendungsfall mit Quelle im Python-Projekt zur Erkennung von Sprachemotionen )
  38. Librispeech Dataset - Der Datensatz enthÀlt 1000 Stunden englische Sprache mit unterschiedlichen Akzenten.
  39. Baidu Apolloscape Dataset - Datensatz zur Entwicklung selbstfahrender Technologien.
  40. Quandl Data Portal - ein Speicher fĂŒr Wirtschafts- und Finanzdaten (es gibt kostenlose und kostenpflichtige Inhalte).
  41. Das Open Data Portal der Weltbank - Informationen zu Krediten der Weltbank an EntwicklungslÀnder.
  42. Das IWF-Datenportal ist ein internationales WĂ€hrungsfondsportal, das Daten ĂŒber internationale Finanzen, Schuldenquoten, Investitionen, Devisenreserven und Waren veröffentlicht.
  43. Das Datenportal der American Economic Association (AEA) ist eine Ressource zum Auffinden makroökonomischer Daten aus den USA.
  44. Google Trends-Datenportal - Mit Google Trends- Daten können Daten visuell untersucht und analysiert werden.
  45. Financial Times Market Data Portal - eine Ressource, um aktuelle Informationen zu FinanzmÀrkten aus der ganzen Welt zu erhalten.
  46. Das Data.gov-Portal ist ein offenes Datenportal der US-Regierung (Landwirtschaft, Gesundheitswesen, Klima, Bildung, Energie, Finanzen, Wissenschaft und Forschung usw.).
  47. Datenportal: Open Government Data (India) ist Indiens Open Government-Datenplattform.
  48. Lebensmittelumfeld Atlas Data Portal - EnthÀlt US-amerikanische Daten zur ErnÀhrungsforschung.
  49. Health Data Portal ist ein Portal des US-Gesundheitsministeriums.
  50. Datenportal der Zentren fĂŒr die Kontrolle und PrĂ€vention von Krankheiten - EnthĂ€lt eine breite Palette gesundheitsbezogener Daten.
  51. London Datastore Portal - Daten zum Leben von Menschen in London.
  52. Open Data Portal der kanadischen Regierung - ein Portal zum Öffnen von Daten ĂŒber Kanadier (Landwirtschaft, Kunst, Musik, Bildung, Regierung, Gesundheit usw.)


Lesen Sie mehr





Lesen Sie auch den Blog
EDISON Unternehmen:


20 Bibliotheken fĂŒr
spektakulÀre iOS-Anwendung

Source: https://habr.com/ru/post/de480408/


All Articles