Main Content

大型文件和大数据

访问和处理文件集合以及大型数据集

大型数据集可以是现有内存无法容纳的大型文件,也可以是需要很长处理时间的文件。大型数据集也可以是许多小型文件的集合。大型数据集的处理无法通过单一方法来完成,因此 MATLAB® 提供了多个用于访问和处理大型数据的工具。

首先创建一个一次可访问小部分数据的数据存储。您可以使用数据存储管理数据的增量导入。要使用常见 MATLAB 函数(如 meanhistogram)分析数据,请基于数据存储创建一个 tall 数组。对于更复杂的问题,您可以编写一个 MapReduce 算法,用于定义数据的分块和归约。

类别