Python – 文本处理环境

Python – 文本处理环境

为了成功地创建和运行本教程中的示例代码,我们需要设置一个环境,其中既包括通用Python,也包括数据科学所需的特殊软件包。我们首先看一下安装通用Python,它可以是Python 2或Python 3。但是,由于它的成熟度和广泛的外部软件包支持,本教程将优先选择Python 2。

获取Python

最新的源代码、二进制文件、文档、新闻等都可以在Python的官方网站https://www.python.org/上找到。

您可以从https://www.python.org/doc/下载Python文档。文档可用HTML、PDF和PostScript格式。

安装Python

Python发行版适用于各种各样的平台。您只需要下载适用于您的平台的二进制代码,并安装Python即可。

如果您的平台上没有可用的二进制代码,您需要一个C编译器手动编译源代码。编译源代码在选择安装中所需的功能方面提供了更大的灵活性。

以下是在各种平台上安装Python的快速概述-

Unix和Linux安装

以下是在Unix/Linux机器上安装Python的简单步骤。

  • 打开Web浏览器,转到https://www.python.org/downloads/
  • 通过链接下载适用于Unix/Linux的压缩源代码。
  • 下载并提取文件。
  • 如果要自定义某些选项,则编辑* Modules/Setup *文件。
  • 运行./configure脚本
  • 制作
  • 安装

这将在标准位置* /usr/local/bin 安装Python及其库 /usr/local/lib/pythonXX *(其中XX是Python的版本)。

Windows安装

以下是在Windows机器上安装Python的步骤。

  • 打开Web浏览器,转到https://www.python.org/downloads/
  • 转到Windows安装程序* python-XYZ.msi *文件的链接,其中XYZ是您需要安装的版本。
  • 要使用此安装程序* python-XYZ.msi *,Windows系统必须支持Microsoft Installer 2.0。将安装程序文件保存到本地计算机,然后运行它以查看您的计算机是否支持MSI。
  • 运行下载的文件。这将带来Python安装向导,它非常容易使用。只需接受默认设置,等待安装完成,您就完成了。

Macintosh安装

最近的Macs附带了安装好的Python,但可能已经过时几年了。请参阅http://www.python.org/download/mac/,了解获取当前版本以及支持在Mac上进行开发所需的额外工具的说明。对于Mac OS X 10.3之前的旧版Mac OS,可以使用MacPython。

Jack Jansen维护它,并且您可以在他的网站上完全访问整个文档 – http://www.cwi.nl/~jack/macpython.html。您可以找到Mac OS安装的完整安装详细信息。

设置 PATH 变量

程序和其他可执行文件可能在很多目录中,所以操作系统提供了一个搜索路径,列出了操作系统用于搜索可执行文件的目录。

这个路径存储在一个环境变量中,它是操作系统维护的命名字符串。该变量包含对命令 Shell 和其他程序可用的信息。

在 Unix 中,该变量被命名为 PATH,而在 Windows 中被命名为 Path(Unix 区分大小写,Windows 不区分大小写)。

在 Mac OS 中,安装程序会处理路径细节。要从任何特定目录调用 Python 解释器,必须将 Python 目录添加到您的路径中。

在 Unix/Linux 设置路径

要将 Python 目录添加到 Unix 中的特定会话的路径中 –

  • 在 csh shell 中,输入 setenv PATH “$PATH:/usr/local/bin/python”,然后按回车键。
  • 在 bash shell 中(Linux),输入 export ATH=”$PATH:/usr/local/bin/python”,然后按回车键。
  • 在 sh 或 ksh shell 中,输入 PATH=”$PATH:/usr/local/bin/python”,然后按回车键。

注意 – /usr/local/bin/python 是 Python 目录的路径

在 Windows 中设置路径

要将 Python 目录添加到 Windows 中的特定会话的路径中 –

在命令提示符中 输入 path %path%;C:\Python,然后按回车键。

注意 – C:\Python 是 Python 目录的路径

Python 环境变量

以下是 Python 可以识别的重要环境变量 –

序号 变量 & 描述
1 PYTHONPATH 它的作用类似于 PATH。该变量告诉 Python 解释器在哪里定位程序导入的模块文件。它应该包括 Python 源代码库目录以及包含 Python 源代码的目录。PYTHONPATH 有时会被 Python 安装程序预设。
2 PYTHONSTARTUP 它包含一个包含 Python 源代码的初始化文件路径。每次启动解析器时都会执行它,它在 Unix 中被命名为 .pythonrc.py,并包含加载实用程序或修改 PYTHONPATH 的命令。
3 PYTHONCASEOK 在 Windows 中使用它来指示 Python 查找导入语句中的第一个不区分大小写的匹配项。将此变量设置为任何值即可激活它。
4 PYTHONHOME 它是一种替代的模块搜索路径。它通常嵌入在 PYTHONSTARTUP 或 PYTHONPATH 目录中,以便轻松切换模块库。

运行 Python

有三种不同的方法可以启动 Python –

交互解释器

您可以从 Unix、DOS 或任何其他提供命令行解释器或 shell 窗口的系统中启动 Python。

输入 python 命令行。

在交互解释器中立即开始编码。

$python # Unix/Linux
or
python% # Unix/Linux
or
C:> python # Windows/DOS

下面是所有可用命令行选项的列表 –

序号 选项 & 描述
1 -d 它提供了调试输出。
2 -O 它生成优化的字节码(生成 .pyo 文件)。
3 -S 不要运行导入 site 查找 Python 路径的命令。
4 -v 详细输出(有关导入语句的详细跟踪)。
5 -X 禁用基于类的内置异常(仅使用字符串);从版本 1.6 开始已过时。
6 -c cmd 运行作为 cmd 字符串发送的 Python 脚本
7 file 从给定的文件中运行 Python 脚本

从命令行执行脚本

可以通过在应用程序上调用解释器来在命令行上执行Python脚本,例如以下操作:

$python script.py # Unix/Linux

或者

python% script.py # Unix/Linux

或者 

C: >python script.py # Windows/DOS

注意 – 确保文件权限模式允许执行。

集成开发环境

如果你的系统有支持Python的图形用户界面(GUI)应用程序,也可以在GUI环境中运行Python。

  • Unix – IDLE是Python的第一个Unix IDE。
  • Windows – PythonWin是Python的第一个Windows界面,是一个带GUI的IDE。
  • Macintosh – Macintosh版本的Python以及IDLE IDE可从主网站下载,可作为MacBinary或BinHex的文件。

安装NLTK包

将NLTK集成到Python环境中非常简单明了。使用以下命令将NLTK添加到环境中。

sudo pip install -U nltk

每章节将在需要时讨论其他库的添加以及它们在Python程序中的使用。

Python教程

Java教程

Web教程

数据库教程

图形图像教程

大数据教程

开发工具教程

计算机教程