介绍
专为数据科学和机器学习工作流程而设计的Anaconda是一个开源包管理器、环境管理器和Python和R编程语言的分布,通常用于大规模数据处理、科学计算和预测分析。
提供一系列超过1000个数据科学包,Anaconda既可供免费和付费的企业版本。Anaconda分发船与conda
命令行实用程序。您可以通过阅读官方的Anaconda文档(https://docs.anaconda.com/)了解更多关于Anaconda和conda
的信息。
本教程将指导您在Ubuntu 18.04服务器上安装Python 3版本的Anaconda。
前提条件
在您开始使用本指南之前,您应该在您的服务器上设置具有 sudo 特权的非根用户。
您可以通过完成我们的 Ubuntu 18.04初始服务器设置指南来实现此前提条件。
安装Anaconda
安装 Anaconda 的最佳方法是下载最新 Anaconda 安装程序 bash 脚本,验证它,然后运行它。
在 Anaconda 下载页面找到最新的Python 3版Anaconda。在写作时,最新的版本是2019.03,但如果可用的话,您应该使用更晚的稳定版本。
接下来,更改到您的服务器上的 /tmp
目录. 这是一个很好的目录来下载短期项目,如 Anaconda bash 脚本,我们运行后不需要它。
1cd /tmp
使用弯曲
下载您从Anaconda网站复制的链接:
1curl -O https://repo.anaconda.com/archive/Anaconda3-2019.03-Linux-x86_64.sh
现在我们可以通过 SHA-256 验证加密哈希验证来验证安装程序的数据完整性,我们将使用sha256sum
命令以及脚本的文件名:
1sha256sum Anaconda3-2019.03-Linux-x86_64.sh
您将收到类似于此的输出:
1[secondary_label Output]
245c851b7497cc14d5ca060064394569f724b67d9b5f98a926ed49b834a6bb73a Anaconda3-2019.03-Linux-x86_64.sh
您应该检查在 Anaconda with Python 3 on 64-bit Linux page上可用的哈希对比输出,以便找到适当的Anaconda版本。
现在我们可以运行剧本:
1bash Anaconda3-2019.03-Linux-x86_64.sh
您将收到以下输出:
1[secondary_label Output]
2
3Welcome to Anaconda3 2019.03
4
5In order to continue the installation process, please review the license
6agreement.
7Please, press ENTER to continue
8>>>
按ENTER
继续,然后按ENTER
阅读许可证.一旦您完成了阅读许可证,您将被要求批准许可证条款:
1[secondary_label Output]
2Do you approve the license terms? [yes|no]
只要你同意,输入是
。
在此时,您将被提示选择安装的位置. 您可以按ENTER
来接受默认位置,或指定不同的位置来修改它。
1[secondary_label Output]
2Anaconda3 will now be installed into this location:
3/home/sammy/anaconda3
4
5 - Press ENTER to confirm the location
6 - Press CTRL-C to abort the installation
7 - Or specify a different location below
8
9[/home/sammy/anaconda3] >>>
安装过程将继续,请注意可能需要一段时间。
一旦安装完成,您将收到以下输出:
1[secondary_label Output]
2...
3installation finished.
4Do you wish the installer to prepend the Anaconda3 install location
5to PATH in your /home/sammy/.bashrc ? [yes|no]
6[no] >>>
输入是
以便您可以使用conda
命令,接下来您将收到以下输出:
1[secondary_label Output]
2Appending source /home/sammy/anaconda3/bin/activate to /home/sammy/.bashrc
3A backup will be made to: /home/sammy/.bashrc-anaconda3.bak
4...
您现在可以通过源 ~/.bashrc
文件来激活安装:
1source ~/.bashrc
一旦完成,您可以通过使用conda
命令来验证您的安装,例如列表
:
1conda list
您将通过 Anaconda 安装获得所有可用的包的输出:
1[secondary_label Output]
2# packages in environment at /home/sammy/anaconda3:
3#
4# Name Version Build Channel
5_ipyw_jlab_nb_ext_conf 0.1.0 py37_0
6alabaster 0.7.12 py37_0
7anaconda 2019.03 py37_0
8...
现在Anaconda已安装,我们可以继续设置Anaconda环境。
安康达环境的设置
Anaconda 虚拟环境允许您通过 Python 版本和所需的包来组织项目. 对于您设置的每个 Anaconda 环境,您可以指定使用哪个版本的 Python,并且可以将所有相关的编程文件保存在该目录中。
首先,我们可以检查哪些Python版本可供我们使用:
1conda search "^python$"
您将收到与不同的Python版本的输出,你可以瞄准,包括Python 3和Python 2版本. 由于我们正在使用Anaconda与Python 3在本教程中,你将只有访问Python 3版本的包。
让我们使用最新的Python版本3创建一个环境,我们可以通过将版本3分配给python
论点来实现这一目标,我们会称这个环境为my_env,但你可能想要使用一个更为描述性的环境名称,特别是如果你使用环境来访问多个Python版本。
1conda create --name my_env python=3
我们将收到输出信息,说明下载了什么和将安装哪些软件包,然后被要求继续使用y
或n
。
conda
实用程序现在将收集环境的包,并让您知道它什么时候完成。
您可以通过键入以下方式激活您的新环境:
1conda activate my_env
随着环境的激活,您的命令提示前缀会改变:
在环境中,您可以验证您正在使用您打算使用的Python版本:
1python --version
1[secondary_label Output]
2Python 3.7 :: Anaconda, Inc.
当您准备关闭 Anaconda 环境时,您可以通过键入:
1conda deactivate
请注意,您可以将源
字代替为.
来获得相同的结果。
要瞄准 Python 的更具体版本,您可以将特定版本传递给python
参数,例如3.5
:
1conda create -n my_env35 python=3.5
您可以按照以下命令在相应的环境中更新 Python 的版本(如在更新 Python 3.5.1 到 Python 3.5.2 中):
1conda update python
如果你想瞄准 Python 的更具体的版本,你可以将其传递给python
参数,如在python = 3.3.2
中。
您可以通过此命令检查您设置的所有环境:
1conda info --envs
1[secondary_label Output]
2# conda environments:
3#
4base * /home/sammy/anaconda3
5my_env /home/sammy/anaconda3/envs/my_env
6my_env35 /home/sammy/anaconda3/envs/my_env35
星座表示当前的活跃环境。
您使用conda create
创建的每个环境都将配备几个默认包:
openssl
pip
python
readline
setuptools
sqlite
tk
wheel
xz
zlib
您可以使用以下命令添加额外的包,例如numpy
:
1conda install --name my_env35 numpy
如果你知道在创建时你想要一个无聊
的环境,你可以在你的conda create
命令中瞄准它:
1conda create --name my_env python=3 numpy
如果您不再在特定项目上工作,并且不再需要相关环境,则可以删除该环境。
1conda remove --name my_env35 --all
现在,当您键入conda info --envs
命令时,您删除的环境将不再列出。
Anaconda 更新
您应定期确保 Anaconda 是最新的,以便您能够使用所有最新版本。
要做到这一点,你应该先更新conda
实用程序:
1conda update conda
当被提示这样做时,键入y
以继续更新。
一旦conda
更新完成,您可以更新 Anaconda 发行版:
1conda update anaconda
再次,当被要求这样做时,键入y
来继续。
这将确保您正在使用最新版本的conda
和Anaconda。
取消 Anaconda
如果您不再使用 Anaconda,并发现您需要卸载它,您应该从anaconda-clean
模块开始,该模块将在您卸载 Anaconda 时删除配置文件。
1conda install anaconda-clean
当被要求这样做时,输入y
。
一旦安装,您可以运行以下命令. 在删除每个命令之前,您将被要求回答y
。
1anaconda-clean
这也会在您的主目录中创建一个名为 .anaconda_backup
的备份文件夹:
1[secondary_label Output]
2Backup directory: /home/sammy/.anaconda_backup/2018-05-23T213826
您现在可以通过输入以下命令删除您的整个 Anaconda 目录:
1rm -rf ~/anaconda3
最后,您可以从 Anaconda 添加的 .bashrc
文件中删除 PATH 行。
1nano ~/.bashrc
然后滚到文件的尽头(如果这是最近的安装)或键入CTRL + W
来搜索 Anaconda。
1[label /home/sammy/.bashrc]
2...
3# added by Anaconda3 installer
4export PATH="/home/sammy/anaconda3/bin:$PATH"
当您完成编辑文件时,键入CTRL + X
来退出和y
来保存更改。
Anaconda 已从您的服务器中删除。
结论
本教程向您介绍了Anaconda的安装,使用conda
命令行实用程序,设置环境,更新Anaconda,并在您不再需要时删除Anaconda。
您可以使用 Anaconda 来帮助您管理数据科学、科学计算、分析和大规模数据处理的工作负载. 从这里,您可以查看我们关于 数据分析和 机器学习的教程,以了解您可以使用的各种工具和项目的更多信息。