MongoDB两个字符串中间的值|极客教程

MongoDB两个字符串中间的值

在实际开发中，我们经常需要操作字符串数据，并且有时候需要获取两个字符串之间的部分内容。本文将介绍如何在MongoDB中实现提取两个字符串之间的值的操作，以及一些实际应用场景。

MongoDB的 $substr和$ indexOf

MongoDB提供了一些用于字符串操作的聚合表达式，其中包括 $substr和$ indexOf。 $substr用于截取字符串的一部分，而$ indexOf用于获取字符串中指定子串的位置。

$substr

$substr的语法如下：

{
  $substr: [ <string>, <start>, <length> ]
}

参数说明：

<string>：要操作的字符串字段名或字符串常量。
<start>：截取的起始位置，从0开始计数。
<length>：要截取的长度。

示例：
假设有如下的文档：

{
  "_id": 1,
  "name": "John Doe",
}

我们想要提取name字段中的姓氏，可以使用$substr表达式：

db.collection.aggregate([
  {
     $project: { "surname": {$ substr: [" $name", 0, {$ indexOfCP: ["$name", " "] }]
      }
    }
  }
])

运行结果如下：

{ "_id": 1, "surname": "John" }

$indexOf

$indexOf的语法如下：

{
   $indexOfCP: [] // 忽略大小写$ indexOf: [] // 区分大小写
}

参数说明：

<string>：被操作的字段名或字符串常量。
<searchString>：要搜索的子串。

示例：
继续以上面的文档为例，假设我们想要获取名字中的姓氏，我们就可以结合 $indexOf和$ substr来实现：

db.collection.aggregate([
  {
     $project: { "surname": {$ substr: [" $name", 0, {$ indexOfCP: ["$name", " "] }]
      }
    }
  }
])

上述查询得到的结果如下：

{ "_id": 1, "surname": "Doe" }

实际应用场景

提取网址中的域名

假设我们有一个包含网址的文档集合，我们想要提取每个网址的域名部分。我们可以利用 $indexOf和$ substr来实现：

db.urls.aggregate([
  {
     $project: { "domain": {$ substr: [
          " $url", {$ add: [8, {  $indexOfCP: ["$ url", "//"] }] }, // 开始位置
          {  $indexOfCP: ["$ url", "/", 8] } // 长度
        ]
      }
    }
  }
])

提取邮件地址中的域名

如果我们有一个邮件地址的集合，我们可以使用类似的方式来提取邮件地址中的域名部分。假设我们有如下的文档：

{
  "_id": 1,
  "email": "john.doe@example.com"
}

我们可以通过以下聚合查询来提取域名部分：

db.emails.aggregate([
  {
     $project: { "domain": {$ substr: [
          " $email", {$ add: [1, {  $indexOfCP: ["$ email", "@"] }] },
          {  $subtract: [{$ indexOfCP: [" $email", ".", {$ add: [{  $indexOfCP: ["$ email", "@"] }, 1] }] }, {  $indexOfCP: ["$ email", "@"] }] }
        ]
      }
    }
  }
])