52个培训项目数据集

  1. 购物中心客户数据集 -商店访客数据:身份证,性别,年龄,收入,消费等级。 ( 带有机器学习的客户细分项目
  2. Iris数据集 -初学者的数据集,包含各种花的萼片和花瓣的大小。
  3. MNIST数据集 -手写数字的数据集。 60,000个训练图像和10,000个测试图像。
  4. 波士顿房屋数据集是一种流行的模式识别数据集。 它包含有关波士顿房屋的信息:公寓数量,租金价格,犯罪指数。
  5. 假新闻检测数据集 -包含7796条新闻标记条目,为true或false。 ( Python来源的用例: 伪新闻检测Python项目
  6. 葡萄酒质量数据集 -包含葡萄酒信息:4898条带有14个参数的记录。
  7. SOCR数据-身高和体重数据集是一个好的开始。 包含25,000个18岁以下儿童的身高和体重记录。
    EDISON软件-网络开发
    本文是在EDISON Software的支持下翻译的,EDISON Software是一家从华南地区获得出色订单的公司,还开发了Web应用程序和网站
  8. 帕金森数据集 -帕金森氏病患者的195条记录,包含25个分析参数。 它可用于初步评估病人与健康人之间的差异。 ( Python来源的用例: 关于检测帕金森氏病的机器学习项目
  9. 泰坦尼克号数据集 -包含有关训练集中的旅客891(年龄,性别,船上亲戚等)的信息,以及测试集中的旅客418的信息。
  10. Uber Pickups Dataset-有关2014年和2015年1,400万次Uber出行的信息。 ( R上的用例案例:R中的Uber数据分析项目
  11. Chars74k数据集 -包含64个类别的英国和加拿大字符的图像:0-9,AZ,az。 7700个7.7k自然图像,3400k手写,62000个计算机合成字体。
  12. 信用卡欺诈检测数据集 -包含有关被盗信用卡交易的信息。 ( 用例来源: 信用卡欺诈检测机器学习项目
  13. Chatbot Intents数据集 -一个JSON文件,其中包含各种标签:问候语,再见,医院搜索,药房搜索等。 包含一组问答模板。 ( Python中带有源的用 :Python中的Chatbot项目
  14. 安然电子邮件数据集 -包含来自150位安然经理的半百万封电子邮件。
  15. Yelp数据集 -包含来自120万个组织的160万用户的120万条建议。
  16. 危险数据集 -受欢迎的电视游戏提供了超过200,000个问答条目。
  17. 推荐系统数据集是一个门户网站,其中包含来自UCSD大学的数据集。 包含对流行网站(Goodreads,亚马逊)的评论的评论。 非常适合创建推荐系统。 ( 带有R上的源的用例:R中的电影推荐系统项目
  18. UCI Spambase数据集 -用于检测垃圾邮件的训练数据集。 包含4601个字母和57个元数据参数。
  19. Flickr 30k数据集 -超过30,000个图像和标题。 Flickr 8k数据集 -8000张图像。Python中带有源代码的项目: 图像说明生成器Python项目
  20. IMDB评论 -训练集中有25,000个电影评论,测试集中有25,000个电影评论。 ( 带有R的用例: 情感分析数据科学项目
  21. MS COCO数据集-150万个标记图像。
  22. CIFAR-10和CIFAR-100数据集 -CIFAR-10包含60,000个小图像(32 * 32像素,数字0-9)。 CIFAR-100-分别为0-100。
  23. GTSRB(德国交通标志识别基准)数据集-43个路标的 50,000张图像。 ( Python来源的用例: 交通标志识别Python项目
  24. ImageNet数据集 -包含100,000多个短语,每个短语大约1000张图像。
  25. 乳房组织病理学图像数据集 -数据集包含乳腺癌样本的图像。 ( 用例与乳腺癌分类Python项目中的源一起使用
  26. Cityscapes数据集 -包含不同城市街道的视频序列的高质量注释。
  27. Kinetics数据集 -包含指向大约650万个高质量视频的URL链接。
  28. MPII人体姿势数据集 -该数据集包含25,000张人体姿势图像以及关节注释。
  29. 20BN-something-something数据集v2是一组高质量的视频,显示了人们如何执行某些动作。
  30. Object 365数据集 -具有对象边界框的高质量图像的数据集。
  31. 照片素描数据集 -包含1000多个图像及其轮廓图。
  32. CQ500数据集 -数据集包含491,317个切片的头部的CT扫描。
  33. IMDB-Wiki数据集 -包含超过500万个带有性别和年龄标记的人的图像的数据集。 ( 用例与“ 性别和年龄检测Python项目”上的源一起使用
  34. Youtube 8M数据集 -一个带有标签的视频数据集,包含610万个Youtube视频标识符
  35. Urban Sound 8K数据集 -一组城市音频数据(包含10类的8732个城市声音)。
  36. LSUN数据集是一个由数百万个场景和对象的彩色图像(约5900万幅图像,10个不同类别的场景和20个不同类别的对象)组成的数据集。
  37. RAVDESS数据集是情感演讲的视听数据库。 ( 语音情感识别Python项目的源的用例
  38. Librispeech数据集 -数据集包含1000个小时不同口音的英语语音。
  39. 百度Apolloscape数据集 -用于开发自动驾驶技术的数据集。
  40. Quandl Data Portal-经济和金融数据的存储库(有免费和付费内容)。
  41. 世界银行开放数据门户网站 -有关世界银行向发展中国家发放的贷款的信息。
  42. IMF数据门户网站是一个国际货币基金门户网站,可发布有关国际金融,债务利率,投资,外汇储备和商品的数据。
  43. 美国经济协会(AEA)数据门户网站可用于查找美国宏观经济数据。
  44. Google Trends数据门户-Google Trends数据可用于直观地检查和分析数据。
  45. 《金融时报》市场数据门户网站 -一种资源,用于从世界各地获取有关金融市场的最新信息。
  46. Data.gov门户是美国政府的开放数据门户(农业,健康,气候,教育,能源,金融,科学和研究等)。
  47. 数据门户:开放政府数据(印度)印度的开放政府数据平台。
  48. 食品环境Atlas数据门户 -包含美国营养研究数据。
  49. 健康数据门户网站是美国卫生与公共服务部的门户网站。
  50. 疾病控制和预防中心数据门户 -包含各种与健康相关的数据。
  51. 伦敦数据存储门户 -伦敦人们的生活数据。
  52. 加拿大政府开放数据门户 -用于打开有关加拿大人(农业,艺术,音乐,教育,政府,卫生等) 数据的门户


阅读更多





另请阅读博客
EDISON公司:


20个图书馆
壮观的iOS应用程序

Source: https://habr.com/ru/post/zh-CN480408/


All Articles