Python 分词
行分词
在以下示例中,我们使用sent_tokenize函数将给定的文本分成不同的行。
当我们运行上面的程序时,会得到以下的输出 –
非英语的分词
在下面的示例中,我们对德语文本进行了分词。
当我们运行上述程序时,我们得到以下输出 −
词语标记化
我们使用nltk中提供的word_tokenize函数对词语进行标记化。
当我们运行上面的程序时,我们会得到以下输出 –
在以下示例中,我们使用sent_tokenize函数将给定的文本分成不同的行。
当我们运行上面的程序时,会得到以下的输出 –
在下面的示例中,我们对德语文本进行了分词。
当我们运行上述程序时,我们得到以下输出 −
我们使用nltk中提供的word_tokenize函数对词语进行标记化。
当我们运行上面的程序时,我们会得到以下输出 –