MongoDB GridFS

MongoDB GridFS

GridFS 是MongoDB用来存储和检索大型文件,如图像、音频文件、视频文件等的规范。它是一种文件系统,但其数据存储在MongoDB集合中。GridFS能够存储超过16MB的文件。

GridFS将文件分割成片段,并将每个数据片段存储在一个单独的文档中,每个文档的最大大小为255k。

GridFS默认使用两个集合 fs.filesfs.chunks 来存储文件的元数据和片段。每个片段由其唯一的_id ObjectId字段标识。fs.files作为一个父文档。fs.chunks文档中的 files_id 字段将片段与其父文档关联起来。

下面是fs.files集合的示例文档−

{
   "filename": "test.txt",
   "chunkSize": NumberInt(261120),
   "uploadDate": ISODate("2014-04-13T11:32:33.557Z"),
   "md5": "7b762939321e146569b07f72c62cca4f",
   "length": NumberInt(646)
}

文档指定了文件名、分块大小、上传日期和长度。

以下是fs.chunks文档的示例文档-

{
   "files_id": ObjectId("534a75d19f54bfec8a2fe44b"),
   "n": NumberInt(0),
   "data": "Mongo Binary Data"
}

添加文件到GridFS

现在,我们将使用GridFS存储一个mp3文件,使用 put 命令。为此,我们将使用MongoDB安装文件夹中的bin文件夹里的 mongofiles.exe 实用程序。

打开命令提示符,导航到MongoDB安装文件夹中的bin文件夹中的mongofiles.exe,并输入以下代码 –

>mongofiles.exe -d gridfs put song.mp3

在这里, gridfs 是文件将存储的数据库的名称。如果数据库不存在,MongoDB会自动创建一个新的文档。Song.mp3是上传的文件的名称。要在数据库中查看文件的文档,您可以使用find查询 –

>db.fs.files.find()

上述命令返回了以下文档 –

{
   _id: ObjectId('534a811bf8b4aa4d33fdf94d'), 
   filename: "song.mp3", 
   chunkSize: 261120, 
   uploadDate: new Date(1397391643474), md5: "e4f53379c909f7bed2e9d631e15c1c41",
   length: 10401959 
}

我们还可以看到与前一个查询中返回的文档ID相关的存储文件在fs.chunks集合中的所有块,使用下面的代码:

>db.fs.chunks.find({files_id:ObjectId('534a811bf8b4aa4d33fdf94d')})

在我的情况下,查询返回了40个文档,这意味着整个mp3文档被分成了40个数据块。

Python教程

Java教程

Web教程

数据库教程

图形图像教程

大数据教程

开发工具教程

计算机教程