本地文件系统 (LFS) 和分布式文件系统 (DFS) 的区别

1. 本地文件系统(LFS)
Linux操作系统的基本文件系统称为本地文件系统。它以单一副本的形式存储任何数据文件。
它以树格式存储数据文件。在这里，任何用户都可以直接访问数据文件。LFS 不会复制数据块。它始终用于存储和处理个人数据(小数据)。

2. 分布式文件系统(DFS)
当我们需要存储和处理一个大数据文件(至少大约 1 TB 大小的文件)时，操作系统的本地文件系统是不合适的。在这种情况下，我们使用分布式文件系统。它可以在任何带有 Hadoop 的 Linux 操作系统上创建。DFS 通过将任何数据文件分成几个块来存储它。

该文件系统以 Master-Slave 格式工作，其中 Master 是 NameNode，DataNodes 是从机。一个 Data 文件的所有块都存储在不同的 DataNode 中，位置只有 NameNode 知道。每个数据块都被复制到不同的数据节点中，以避免任何数据节点发生故障时数据丢失。在 DFS 中，任何用户都无法直接访问数据文件，因为只有 NameNode 知道数据文件的数据块存储在哪里。

本地文件系统(LFS)和分布式文件系统(DFS)之间的区别：

本地文件系统	分布式文件系统
LFS 将数据存储为单个块。	DFS 将数据划分为多个块，并将其存储到不同的 DataNode 中。
LFS 使用 Tree 格式存储数据。	DFS 为数据存储提供主从架构。
LFS 中的数据检索很慢。	DFS 中的数据检索速度很快。
LFS不可靠，因为 LFS 数据不会复制数据文件。	DFS是可靠的，因为在 DFS 中，数据块被复制到不同的 DataNode 中。
LFS 更便宜，因为它不需要额外的内存来存储任何数据文件。	DFS 很昂贵，因为它需要额外的内存来复制相同的数据块。
LFS文件可以直接在 LFS 中访问。	在 DFS 中不能直接访问文件，因为数据块的实际位置只有 NameNode 知道。
LFS 不适合分析非常大的数据文件，因为它需要大量时间来处理。	DFS 适合分析大数据文件，因为与本地文件系统相比，它需要更少的时间来处理。
LFS 没有 DFS 复杂。	DFS 比 LFS 更复杂。