Main Content

本页的翻译已过时。点击此处可查看最新英文版本。

样本数据集

Statistics and Machine Learning Toolbox™ 软件包括下表中的示例数据集。

要将数据集加载到 MATLAB® 工作区中,请键入:

load filename

其中 filename 是表中列出的文件之一。

数据集包含单独的数据变量、具有引用的描述变量以及封装数据集及其描述的数据集数组(如果适用)。

文件数据集的描述
acetylene.mat具有相关预测变量的化学反应数据
arrhythmia.mat来自 UCI 机器学习存储库的心律失常数据
carbig.mat汽车的测量值,1970-1982
carsmall.matcarbig.mat 的子集。汽车的测量值,1970、1976、1982
census1994.mat来自 UCI 机器学习存储库的成人数据
cereal.mat早餐谷物成分
cities.mat美国大都市地区的生活质量评分
discrim.mat用于判别分析的 cities.mat 版本
examgrades.mat0-100 分的考试成绩
fisheriris.matFisher 1936 年的鸢尾花数据
flu.matGoogle 流感趋势估计的美国不同地区的 ILI(流感样疾病)百分比,疾病预防控制中心根据哨点提供商报告对 ILI 百分比进行了加权
gas.mat1993 年马萨诸塞州的汽油价格
hald.mat水泥发热与原料混合
hogg.mat牛奶的不同配送方式中的细菌数量
hospital.mat仿真的医疗数据
humanactivity.mat五种活动的人体活动识别数据:坐、站、走、跑和跳舞
imports-85.mat1985 年来自 UCI 存储库的自动导入数据库
ionosphere.mat来自 UCI 机器学习存储库的电离层数据集
kmeansdata.mat四维聚类数据
lawdata.mat15 所法学院的平均分数和 LSAT 分数
mileage.mat两家工厂的三种汽车型号的里程数据
moore.mat关于五个预测变量的生化需氧量
morse.mat非编码人员对摩尔斯电码的识别情况
nlpdata.mat从 MathWorks® 文档中提取的自然语言处理数据。
ovariancancer.mat关于 4000 个预测变量的分组观测值 [1][2]
parts.mat36 个圆形零件的大小偏差
polydata.mat多项式拟合的样本数据
popcorn.mat爆米花机型和品牌的爆米花产出
reaction.matHougen-Watson 模型的反应动力学
spectra.mat60 份汽油样本的近红外光谱和辛烷值
stockreturns.mat仿真的股票回报

参考

[1] Conrads, Thomas P., Vincent A. Fusaro, Sally Ross, Don Johann, Vinodh Rajapakse, Ben A. Hitt, Seth M. Steinberg, et al. "High-Resolution Serum Proteomic Features for Ovarian Cancer Detection." Endocrine-Related Cancer 11 (2004): 163–78.

[2] Petricoin, Emanuel F., Ali M. Ardekani, Ben A. Hitt, Peter J. Levine, Vincent A. Fusaro, Seth M. Steinberg, Gordon B. Mills, et al. “Use of Proteomic Patterns in Serum to Identify Ovarian Cancer.” The Lancet 359, no. 9306 (February 2002): 572–77.