时间:2023-07-29 20:12:01 | 来源:网站运营
时间:2023-07-29 20:12:01 来源:网站运营
手把手教你用Google云平台搭建自己的深度学习工作站:Hello,大家好,最近开通了自己的专栏,一直以来被各种任务缠身,始终没有养成记录自己学习的点滴的习惯。最近忙于申请实习拿到了两个还不错的offer,但无奈一些原因没能去,于是打算接下来做一些别的事情,输出一些质量高的博文就是其中一项。sudo fdisk –l
接下来我们需要对空白磁盘进行分区,同样是使用fdisk命令进入一个交互式的环境,这个环境下所有的操作都不会立刻写进分区表,除非显式地通过w保存操作:sudo fdisk /dev/sdb
根据相应的快捷键提示可以很容易完成分区,我的整个磁盘只有一个分区,如果你的磁盘很大也可以分多个区,n新建分区,d删除分区,w保存分区表,q不保存直接退出。sudo mkfs.ext4 /dev/sdb1
接下来我们在/media目录下新建一个挂载点(我这里名称为disk),把刚才格式化好的设备挂载进来:sudo mkdir /media/disksudo mount /dev/sdb1 /media/disk
如果你不想每次开机都手动挂载这个设备的话,可以设置上面说到的那个启动脚本,启动脚本的设置需要在关机状态下进行,待会你重启时记得设置:仍然是在Compute Engine/VM实例下面,点击VM的名称进入VM详情页面,点击最上面修改,往下拉找到自定义元数据,键设为startup-script,值设置为下面的脚本内容,然后点保存重启虚拟机。#! /bin/bashmount /dev/sdb1 /media/disk
同样的方法也可以设置shutdown-script,可以在关机或被抢占时保存模型或给自己发个邮件提醒之类的。sudo apt-get install -y make build-essential libssl-dev zlib1g-dev libbz2-dev libreadline-dev libsqlite3-dev wget curl llvm libncurses5-dev libncursesw5-dev xz-utils tk-dev valgrind cmake unrar gfortran python3-pip python3-dev python3-wheel swig git git-core htop
建议日常的机器学习之类的调试训练都在虚拟环境下进行,虚拟环境配置可以参考下面命令:sudo apt-get install python-pip python-setuptoolssudo pip install --upgrade pipsudo pip install virtualenvcurl -L https://raw.github.com/yyuu/pyenv-installer/master/bin/pyenv-installer | bash
设置虚拟环境对应的环境变量sudo vim ~/.bash_profile
在文件最后加上下面这些内容:export PATH="/home/yourname/.pyenv/bin:$PATH"eval "$(pyenv init -)"eval "$(pyenv virtualenv-init -)"
生效更改然后安装python 3.5.2:source ~/.bash_profilepyenv install 3.5.2
注意把默认的python设置为系统对应的python版本# 查看可用的python版本,注意默认版本pyenv versions# 把默认版本设为系统自带的python版本pyenv global system
在当前目录下创建一个名为pyenv35的虚拟环境virtualenv -p .pyenv/versions/3.5.2/bin/python3.5 pyenv35
激活刚创建的虚拟环境source pyenv35/bin/activate
安装常用机器学习包(这个根据自己的需求来)pyenv35/bin/pip3.5 install numpy scipy matplotlib pandas seaborn sklearn lightgbm xgboost tqdm
安装CUDA运行时环境dpkg -l | grep -i nvidia
否则使用以下命令删除多余的包及配置文件:sudo apt-get remove --purge name_of_ packagesudo apt-get autoremove
然后我们需要下载CUDA的安装包和cuDNN:sudo wget http://developer.download.nvidia.com/compute/cuda/repos/ubuntu1604/x86_64/cuda-repo-ubuntu1604_8.0.61-1_amd64.debsudo wget http://developer.download.nvidia.com/compute/redist/cudnn/v6.0/cudnn-8.0-linux-x64-v6.0.tgzsudo wget https://developer.nvidia.com/compute/cuda/8.0/Prod2/patches/2/cuda-repo-ubuntu1604-8-0-local-cublas-performance-update_8.0.61-1_amd64-deb
接下来安装驱动和运行时:sudo dpkg -i cuda-repo-ubuntu1604_8.0.61-1_amd64.debsudo dpkg -i cuda-repo-ubuntu1604-8-0-local-cublas-performance-update_8.0.61-1_amd64.debsudo apt-get update
查看可用的CUDA运行时版本:sudo apt-cache policy cuda
安装CUDA8.0sudo apt-get install cuda=8.0.61-1
添加源并更新到最新驱动:sudo add-apt-repository ppa:graphics-drivers/ppa
这里记得需要敲回车键确认添加源sudo apt-get updatesudo apt-get upgradesudo reboot
安装cuDNNtar -xvf cudnn-8.0-linux-x64-v6.0.tgzsudo cp cuda/include/cudnn.h /usr/local/cuda/includesudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*
设置环境变量:sudo vim ~/.bashrc
在文件最后添加下面内容:export LD_LIBRARY_PATH="$LD_LIBRARY_PATH:/usr/local/cuda/lib64:/usr/local/cuda/extras/CUPTI/lib64"export CUDA_HOME=/usr/local/cudaexport PATH="$CUDA_HOME/bin:$PATH"
生效更改source ~/.bashrc
最后敲nvidia-smi确认驱动安装成功sudo apt-get install openjdk-8-jdkecho "deb [arch=amd64] http://storage.googleapis.com/bazel-apt stable jdk1.8" | sudo tee /etc/apt/sources.list.d/bazel.listcurl https://bazel.build/bazel-release.pub.gpg | sudo apt-key add -sudo apt-get update && sudo apt-get install bazel
先进入虚拟环境,然后执行以下命令安装:pyenv35/bin/pip3.5 install opencv-python tensorflow-gpu http://download.pytorch.org/whl/cu80/torch-0.3.0.post4-cp35-cp35m-linux_x86_64.whl torchvision mxnet-cu80==1.0.0
配置远程jupyter notebookpyenv35/bin/pip3.5 install jupyter notebook
进入python交互式环境,生成hash密码:from notebook.auth import passwdpasswd()
输入密码并记下形如'sha1:daa96*06c24059c807b08'的字串。jupyter notebook --generate-config
编辑配置文件,设置密码和权限等:sudo vim .jupyter/jupyter_notebook_config.py
设置以下几项并保存:c.NotebookApp.ip = '*'c.NotebookApp.password = u'sha1:daa96*06c24059c807b08'c.NotebookApp.open_browser = Falsec.NotebookApp.port = 8888
执行jupyter notebook打开notebook,然后在本地浏览器打开http://yourip:8888/,如果正常的话,输入密码就可以使用了。如果有问题可以确认一下防火墙。关键词:深度,学习,工作,把手,平台