52 Datensatz fĂŒr Trainingsprojekte
- Mall Customers Dataset - Daten der Besucher des GeschÀfts: ID, Geschlecht, Alter, Einkommen, Ausgabenbewertung. ( Anwendungsfall: Kundensegmentierungsprojekt mit maschinellem Lernen )
- Iris Dataset - Datensatz fĂŒr AnfĂ€nger, der die GröĂe von KelchblĂ€ttern und BlĂŒtenblĂ€ttern fĂŒr verschiedene Blumen enthĂ€lt.
- MNIST- Datensatz - Datensatz handschriftlicher Nummern. 60.000 Trainingsbilder und 10.000 Testbilder.
- Der Boston Housing- Datensatz ist ein beliebter Mustererkennungsdatensatz. Es enthĂ€lt Informationen ĂŒber die HĂ€user in Boston: Anzahl der Wohnungen, Mietpreis, KriminalitĂ€tsindex.
- Fake News Detection Dataset - enthÀlt 7796 EintrÀge mit News Markup: true oder false. ( Anwendungsfall mit Python-Quelle: Fake News Detection Python Project )
- WeinqualitÀts- Datensatz - enthÀlt Weininformationen: 4898 DatensÀtze mit 14 Parametern.
- SOCR-Daten - Heights and Weights Dataset ist ein guter Anfang. EnthĂ€lt 25.000 Aufzeichnungen ĂŒber GröĂe und Gewicht von 18-JĂ€hrigen.

Dieser Artikel wurde mit UnterstĂŒtzung von EDISON Software ĂŒbersetzt, einem Unternehmen, das hervorragende AuftrĂ€ge aus SĂŒdchina ausfĂŒhrt und auch Webanwendungen und Websites entwickelt .
- Parkinson-Datensatz - 195 DatensÀtze von Patienten mit Parkinson-Krankheit mit 25 Analyseparametern. Es kann zur vorlÀufigen Beurteilung des Unterschieds zwischen Kranken und Gesunden herangezogen werden. ( Anwendungsfall mit Python-Quelle: Maschinelles Lernprojekt zur Erkennung der Parkinson-Krankheit )
- Titanic-Datensatz - EnthÀlt Informationen zu Passagieren (Alter, Geschlecht, Angehörige an Bord usw.) 891 im Trainingssatz und 418 im Testsatz.
- Uber Pickups Dataset - Informationen zu 4,5 Millionen Reisen nach Uber 2014 und 14 Millionen 2015. ( Anwendungsfall mit Quelle in R: Uber Data Analysis Project in R )
- Chars74k Dataset - enthĂ€lt Bilder von britischen und kanadischen Zeichen aus 64 Klassen: 0-9, AZ, az. 7700 7.7k natĂŒrliche Bilder, 3400k handgeschriebene, 62000 computergenerierte Schriftarten.
- Credit Card Fraud Detection Dataset - enthÀlt Informationen zu Transaktionen mit manipulierten Kreditkarten. ( Anwendungsfall mit Quelle: Credit Card Fraud Detection Machine Learning Project )
- Chatbot Intents Dataset - JSON-Datei mit verschiedenen Tags: greetings, goodbye, hospital_search, pharmacy_search usw. EnthÀlt eine Reihe von Frage-Antwort-Vorlagen. ( Anwendungsfall mit Quelle in Python: Chatbot-Projekt in Python )
- Enron Email Dataset - EnthÀlt eine halbe Million E-Mails von 150 Enron-Managern.
- Der Yelp-Datensatz - enthĂ€lt 1,2 Millionen Empfehlungen von 1,6 Millionen Nutzern ĂŒber 1,2 Millionen Organisationen.
- Jeopardy Dataset - Ăber 200.000 Q & A-EintrĂ€ge aus einem beliebten Fernsehspiel.
- Recommender Systems Dataset ist ein Portal mit einer Sammlung von DatensÀtzen der UCSD University. EnthÀlt Rezensionen zu Rezensionen auf beliebten Websites (Goodreads, Amazon). Ideal zum Erstellen von Empfehlungssystemen. ( Anwendungsfall mit Quelle in R: Movie Recommendation System Project in R )
- UCI Spambase Dataset - Trainingsdatensatz zur Erkennung von Spam. EnthÀlt 4601 Buchstaben mit 57 Metadatenparametern.
- Flickr 30k Dataset - Ăber 30.000 Bilder und Untertitel. ( Flickr 8k-Datensatz - 8000 Bilder. Projekt mit Quelle in Python: Python-Projekt mit Bildbeschriftungsgenerator )
- IMDB-Testberichte - 25.000 Filmkritiken im Trainingssatz und 25.000 im Testsatz. ( Anwendungsfall mit Quelle in R: Sentiment Analysis Data Science Project )
- MS COCO-Datensatz - 1,5 Millionen getaggte Bilder.
- CIFAR-10- und CIFAR-100-Datensatz - CIFAR-10 enthÀlt 60.000 kleine Bilder 32 * 32 Pixel mit den Zahlen 0-9. CIFAR-100 bzw. 0-100.
- GTSRB-Datensatz - 50.000 Bilder von 43 Verkehrszeichen. ( Anwendungsfall mit Python-Quelle: Python-Projekt zur Verkehrszeichenerkennung )
- ImageNet-Datensatz - enthÀlt mehr als 100.000 Phrasen und etwa 1000 Bilder pro Phrase.
- Brusthistopathologie-Bilddatensatz - Der Datensatz enthÀlt Bilder von Brustkrebs-Proben. ( Anwendungsfall mit Quelle zu Breast Cancer Classification Python Project )
- Cityscapes Dataset - enthĂ€lt hochwertige Anmerkungen zu Videosequenzen von StraĂen verschiedener StĂ€dte.
- Kinetics-Datensatz - EnthĂ€lt einen URL-Link zu etwa 6,5 ââMillionen hochwertigen Videos.
- MPII-Datensatz fĂŒr menschliche Posen - Der Datensatz enthĂ€lt 25.000 Bilder von menschlichen Posen mit Anmerkungen fĂŒr die Gelenke.
- 20BN-Etwas-Etwas-Datensatz v2 ist ein Satz hochwertiger Videos, die zeigen, wie eine Person bestimmte Aktionen ausfĂŒhrt.
- Object 365- Datensatz - Datensatz mit hochwertigen Bildern mit Begrenzungsrahmen fĂŒr Objekte.
- Fotoskizzen-Datensatz - enthÀlt mehr als 1000 Bilder mit ihren Umrisszeichnungen.
- CQ500- Datensatz - Der Datensatz enthÀlt 491 CT-Scans des Kopfes mit 193.317 Schichten.
- IMDB-Wiki-Datensatz - Datensatz mit mehr als 5 Millionen Bildern von Personen, die mit Geschlecht und Alter gekennzeichnet sind. ( Anwendungsfall mit Quelle im Python-Projekt zur Erkennung von Geschlecht und Alter )
- Youtube 8M- Datensatz - Ein beschrifteter Videodatensatz, der 6,1 Millionen Youtube-Videokennungen enthÀlt
- Urban Sound 8K-Datensatz - Ein Satz von Stadt-Audiodaten (enthÀlt 8732 Stadt-Sounds aus 10 Klassen).
- LSUN-Datensatz ist ein Datensatz mit Millionen von Farbbildern von Szenen und Objekten (etwa 59 Millionen Bilder, 10 verschiedene Kategorien von Szenen und 20 verschiedene Kategorien von Objekten).
- RAVDESS Dataset ist eine audiovisuelle Datenbank fĂŒr emotionale Sprache. ( Anwendungsfall mit Quelle im Python-Projekt zur Erkennung von Sprachemotionen )
- Librispeech Dataset - Der Datensatz enthÀlt 1000 Stunden englische Sprache mit unterschiedlichen Akzenten.
- Baidu Apolloscape Dataset - Datensatz zur Entwicklung selbstfahrender Technologien.
- Quandl Data Portal - ein Speicher fĂŒr Wirtschafts- und Finanzdaten (es gibt kostenlose und kostenpflichtige Inhalte).
- Das Open Data Portal der Weltbank - Informationen zu Krediten der Weltbank an EntwicklungslÀnder.
- Das IWF-Datenportal ist ein internationales WĂ€hrungsfondsportal, das Daten ĂŒber internationale Finanzen, Schuldenquoten, Investitionen, Devisenreserven und Waren veröffentlicht.
- Das Datenportal der American Economic Association (AEA) ist eine Ressource zum Auffinden makroökonomischer Daten aus den USA.
- Google Trends-Datenportal - Mit Google Trends- Daten können Daten visuell untersucht und analysiert werden.
- Financial Times Market Data Portal - eine Ressource, um aktuelle Informationen zu FinanzmÀrkten aus der ganzen Welt zu erhalten.
- Das Data.gov-Portal ist ein offenes Datenportal der US-Regierung (Landwirtschaft, Gesundheitswesen, Klima, Bildung, Energie, Finanzen, Wissenschaft und Forschung usw.).
- Datenportal: Open Government Data (India) ist Indiens Open Government-Datenplattform.
- Lebensmittelumfeld Atlas Data Portal - EnthÀlt US-amerikanische Daten zur ErnÀhrungsforschung.
- Health Data Portal ist ein Portal des US-Gesundheitsministeriums.
- Datenportal der Zentren fĂŒr die Kontrolle und PrĂ€vention von Krankheiten - EnthĂ€lt eine breite Palette gesundheitsbezogener Daten.
- London Datastore Portal - Daten zum Leben von Menschen in London.
- Open Data Portal der kanadischen Regierung - ein Portal zum Ăffnen von Daten ĂŒber Kanadier (Landwirtschaft, Kunst, Musik, Bildung, Regierung, Gesundheit usw.)
Lesen Sie mehr

Lesen Sie auch den Blog
EDISON Unternehmen:
20 Bibliotheken fĂŒr
spektakulÀre iOS-AnwendungSource: https://habr.com/ru/post/de480408/
All Articles