常用机器学习公开数据集大全

发布于:2025-08-14 ⋅ 阅读:(17) ⋅ 点赞:(0)

根据收集到的信息,以下是对数据挖掘常用公开数据集的分类整理,涵盖不同领域和任务类型,并附上获取方式和推荐理由:

一、经典入门数据集

  1. UCI机器学习库https://archive.ics.uci.edu/ml/)
    • 推荐数据集:Iris(鸢尾花分类)、Wine(葡萄酒分类)、Boston Housing(波士顿房价预测)
    • 特点:涵盖分类、回归、聚类等任务,数据格式规范,适合初学者练习。
  2. Kaggle竞赛数据集https://www.kaggle.com/datasets)
    • 推荐数据集:Titanic(泰坦尼克号生存预测)、House Prices(房价预测)、Digit Recognizer(手写数字识别)
    • 特点:结构化数据为主,附带详细描述和社区讨论,适合实战演练。

二、领域专用数据集

  1. 计算机视觉
  2. 自然语言处理
  3. 时间序列分析

三、近三年新增高质量数据集

  1. 医疗健康
  2. 地理空间与遥感
  3. 自动驾驶

四、特殊任务数据集

  1. 推荐系统
  2. 异常检测
  3. 多模态数据

五、获取建议


网站公告

今日签到

点亮在社区的每一天
去签到