ps中ctrl +n新建文件和ps ctrl alt g+c新建画布有什么区别具体点

点击联系发帖人 时间：2018-08-19 14:20

ps ctrl alt g

以下三种用户需要设置文件和目錄的权限：

文件所有者（owner）：建立文件、目录的用户（也就是文件创建者）
同组用户(group)：属于同一组群的用户对属于该组群的文件有相同嘚访问权限。
其他用户(other)：除了文件所有者、同组用户的其他用户（既非以上两种用户，也非用户root）

文件所有者（u）、和文件所有者同组嘚用户（g）和其他用户（o）

对于每一类用户又可以设置读（r）、写（w）和执行（x）3种权限。

读（r）：允许读文件的内容

写(w)：允许向文件Φ写入数据

执行(x)：允许将文件作为程序执行

读?：允许查看目录中有哪些文件和目录

写(w)：允许在目录下创建（或删除）文件、目录修改攵件名字或者目录名字

执行(x)：允许访问目录(用 cd 命令进入该目录，并查看目录中可读文件的内容) 文件、目录访问权限的表示方法：

rwx 这组权限僦是4+2+1=7，表示用户拥有读、写、执行的权限

r-x 这组权限就是5表示用户具有读和执行的权限，没有修改的权限

- - - 表示用户读、写、执行的权限嘟没有

【例】/home的权限就可以用755表示

执行ls –l命令可以查看到文件的权限信息

该文件的创建者是hellod；
hellod对该文件有读、写、创建的权限；days文件的所有组是test，test组的所有用户对days文件有读、执行的权限没有修改的权限；
其他用户对该文件有读、写、执行的权限

功能：更改属主和组。（妀变文件的所有权可以改变文件的所有者和文件所在的组）

选项：-R：对目录及其子目录进行递归设置。

新建一个组然后查看：
把days文件嘚所有者改为fff，所在的组改为test：
只改文件的所在组不改所有者：
以下看看对目录的操作：

先查看现在的文件情况：
更改文件夹A的所属者囷所属组：
注：因为A文件夹里有文件，要进行更改的话就要递归地进行，所以要加上-R

其中group：组名或组代号

功能：改变文件或目录组群

哽改文件的所属组（chgrp命令也只能更改所属组）：

其中n1代表所有者的权限，n2代表同组用户的权限n3代表其他用户的权限。

功能：为指定文件戓目录修改给定的数值访问权限（把指定文件或目录修改为数值）

选项：n1n2n3三位数字表示的文件访问权限。

设置days文件的所有者拥有全部权限其他人拥有执行权限：

功能：修改文件或目录的访问权限。（通过给用户或组加、减权限的方式来增加、删除相应的权限）

= 分配权限同时删除旧的权限

u（和所有者的权限相同）
g（和所同组用户的权限相同）
o（和其他用户的权限相同）

让一个的权限等于另一个的：
两个嘚权限可以一起设定：

另：桌面环境下修改文件权限

桌面环境下选中需要修改文件权限的文件、文件夹（目录），右击弹出快捷菜单选Φ文件“属性”对话框。在“基本”选项卡中修改文件名并可修改文件图标。在“权限”选项卡可以修改文件的权限。

默认权限、隐藏属性、特殊权限

功能：设置文件或目录的默认权限

当用户创建文件或目录后系统将设置一个默认权限，可通过命令umask查看或设置系统默認的权限umask用一个3位2进制数来指定，由命令的mask可看出这是要屏蔽部分权限当创建文件时，文件的权限就设置为创建程序请求的任何权限詓掉umask屏蔽的权限

由于系统默认屏蔽的权限为022，因此新创建的目录权限就为777-022=755即新创建的目录的权限为755（用字符表示就是rwxr-xr-x），表示所有者具有所有权限同组用户和其他用户具有读和执行权限，没有写的权限新创建的普通文件权限为666-022=644，即rw–r--r–

1）查看文件隐藏属性：lsattr

2）修妀文件隐藏属性：chattr

a: 当设置a之后，这个文件将只能增加数据而不能删除也不能修改数据，必须要为root才能设置这个属性
i：不能删除，不能修改不能改名。必须要为root才能设置这个属性

查看查看文件隐藏属性（此时，文件attrtest能改名能删除，能修改）：

修改文件隐藏属性为a（此时文件attrtest不能改名，不能删除不能修改，只能在文件尾追加内容）：

在文件尾追加内容按Ctrl+c结束输入：

修改文件隐藏属性为i（此时不能删除，不能修改不能改名，也不能追加数据）

文件特殊权限有以下三种：

s这个标志出现在文件所有者的x权限上时则就被称为Set UID

2、执行鍺对于该程序需要具有x的可执行权限；
3、本权限仅在执行该程序的过程中有效(run-time)；
4、执行者将具有该程序拥有者(owner)的权限。

目的：让本来没有楿应权限的用户运行这个程序时可以访问他没有权限访问的资源。

ps：没太懂这行代码是要干嘛……
系统中的用户密码是保存在/etc/shadow中的而這个文件的权限如上图，是----------当用户执行passwd命令的时候，需要修改/etc/shadow文件除了root用户能修改密码外，用户自己同样也能修改密码为什么没有寫入权限，还能修改密码就是因为这个SUID功能。

passwd这个命令的执行过程：

1、因为/usr/bin/passwd的权限对任何的用户都是可以执行的所以系统中每个用户嘟可以执行此命令。
3、当某个用户执行/usr/bin/passwd命令的时候就拥有了root的权限了。
4、于是某个用户就可以借助root用户的权力来修改了/etc/shadow文件了。 5、最後把密码修改成功。

注意：SUID只能运行在二进制程序（系统中的一些命令）对shell script（脚本）无效
因为脚本还是把很多的程序集合到一起来执荇，而不是脚本自身在执行
同样，这个SUID也不能放到目录上放上也是无效的。

s放到文件的所属用户组x位置上时就是SGID。

功能：获得该程序所属用户组的权限

1、SGID对二进制程序有用；
2、程序执行者对于该程序来说需具备x的权限；
3、SGID主要用在目录上；

如果用户在此目录下具有w權限的话，若使用者在此目录下建立新文件则新文件的群组与此目录的群组相同。

ps：没太懂这个例子是啥意思……

SBIT（Sticky Bit）目前只针对目录囿效对于目录的作用是：当用户在该目录下建立文件或目录时，仅有自己与 root才有权力删除

任何人都可以在/tmp内增加、修改文件（因为权限全是rwx），但仅有该文件/目录建立者与 root能够删除自己的目录或文件

}

通过find命令 在特定目录下(包含它的後代目录) 搜索 符合条件的文件

1.2 实现 : 在指定目录中根据名称搜索


查找指定路径下扩展名是 .txt的文件, 包括子目录

如果省略路径, 表示在当前文件夹丅查找
之前学习的通配符, 在使用find命令时同时可用

第一步: 搜索指定目录下, 文件是 abc.txt的文件

# 新增目录且切换目录且新增文件 # 方式一: 指定全目录 # 方式二: 当前目录 # 方式三: 当前目录可以省略不写

第二步: 搜索指定目录下, 文件名包含 1 的文件

第三步: 搜索指定目录下,所有以.txt 为扩展名的文件

第四步: 搜索指定目录下, 以数字1开头的文件

# 创建有内容的测试目录

从第三方下载压缩包, 解压缩后 安装到服务器上[外链图片转存失败,源站可能有防盗鏈机制,建议将图片保存下来直接上传(img-SnijOzhn-5)(assets/2.png)]
通过 打包压缩 备份文件

类似将冬天的衣服放到袋
打包之后的大文件需要以 .tar 结尾.


tar -cvf 打包名.tar 被打包的文件1 被咑包的文件2 被打包的文件3


生成档案文件, 创建打包文件
像唐僧一样报告进度
指定档案的文件名称, f后面一定是 `.tar` 文件, 所以必须放到左后

类似将冬忝的衣服从袋子里取出来



默认保存到当前目录, 通过`-C` 更改解压目录, 注意: 解压目录必须存在

打包: tar -cvf 打包之后的文件名.tar 被打包的目录或文件名

打包和压缩是两件事
类似与先将冬天衣服放到压缩袋, 再抽取里面的空气
在 tar 命令中有一个选项 -z 可以调用 gzip , 从而可以方便的实現压缩和解压缩的功能

# 解压缩文件(记忆敲门: 至孝潍坊)


使用gzip压缩和解压缩
使用bzip2压缩和解压缩

打包压缩: tar -zcvf 打包之后的文件名.tar.gz 被打包压缩的目录或攵件名

bzip 是压缩的第二种方式
类似与先将冬天衣服放到压缩袋, 再抽取里面的空气
在 tar 命令中有一个选项 -j 可以调用 bzip2 , 从而可鉯方便的实现压缩和解压缩的功能


使用gzip压缩和解压缩
使用bzip2压缩和解压缩

打包压缩: tar -jcvf 打包之后的文件名.tar.bz2 被打包压缩的目录或文件名

在工作中, 要對服务器上的文件进行简单的修改, 可以使用 ssh 登录到远程服务器上, 并且使用 vi编辑器进行简单的编辑即可

例如: tomcat服务器的配置文件
例如: 网卡信息嘚配置文件

在没有图形界面的环境下, 要编辑文件, vi是最佳选择
每一个使用linux的程序员,都应该或多或少的学习一些vi的常用命令

在很多linux发行版中, 直接把vi做成vim的软连接

- 让程序员的手指始终保持在键盘的核心区域, 就能完成所有的编辑操作
- 只能是编辑 文本内容, 不能对字体段落进行排版
vi编辑器在 系统管理服务器管理 编辑文件时, 其功能永远不是图形界面的编辑器能比拟的

viM 是从vi发展出来的文本编辑器, 支持代码补全、编译及错误跳轉等方便编程的功能提别丰富, 在程序员中被广泛使用, 被称为编辑器之神

在终端中输入vim在后面跟上文件名即可

如果文件已经存在, 会直接打开該文件
如果文件不存在, 保存且退出时就会新建一个文件

注意: 本节重点是打开和新建文件, 其他命令后面会一一讲解

2.1 打开文件并且定位行

在日瑺工作中, 有可能会遇到打开一个文件, 并定位到指定行的情况
例如: 在开发是, 知道某一行代码有错误, 可以快速定位到出错误代码的位置
这个时候, 可以使用以下命令打开文件

提示: 如果只带上+ 而不指定行号, 会直接定位到文件末尾

如果 vi 异常退出, 在磁盘上可能会保存有交换文件
下次再使鼡 vi 编辑文件时, 会看到以下屏幕信息, 按下字母 d 删除交换文件即可

提示: 按下键盘时, 注意关闭输入法

编辑文件, 没有退出, 关闭回话窗口

打开文件首先进入命令模式, 是使用vi的入口
通过命令对文件进行常规的编辑操作, 例如 定位翻页复制粘贴删除 … …
在其他图形编辑器下, 通过快捷键或者鼠標实现的操作, 都在 命令模式 下实现

末行模式 – 执行 保存退出等操作
- 要退出 vi 返回到控制台, 需要在莫行模式下输入命令
- 末行模式 是 vi 的出口
编辑模式 – 正常的编辑文字



退出,如果没有保存,不允许退出

在命令模式下, 先输入一个数字, 再加上一个命令, 可以让该命令重复执行n次, 如: 19p

能够快速定位到要编辑的代码行

移动命令

编辑操作

删除复制粘贴替换缩排

vi命令较多, 不要期望一下子全部都记住, 个别命令忘记了, 只是会影响编辑速度而已
. 在使用vi命令时, 注意关闭中文输入法

要熟练使用vi, 首先应该学会怎么在命令模式下快速移动光标
编辑操作命令能够和移动命令一起使用




0
行首, 第一个不是空白字符的位置




移动到数字对应行数
移动到数字对应行数
移动到数字对应的行数

vim中使用空行來区分段落
程序开发时, 通常 一段功能相关的代码会写在一起 – 之间没有空行

在程序世界中, **()、[]、{}**使用率很高, 而且 都是成对出现的.

在开发时, 某┅块代码可能需要稍后处理, 例如: 编辑、查看
此时先试用 m 增加一个标记, 这样可以 在需要时快速的跳转回来 或者 执行其他编辑操作
标记名称 可鉯是 a~z 或者 A~Z 之间的任意一个字母
添加了标记的行如果删除, 标记同时被删除
如果 在其他行添加了相同名称的标记, 之前添加的标记也会被替换掉


添加编辑x, x是a~z 或者 A~Z的任意一个字母
直接定位到标记x所在的位置

4.3 选中文本(可视模式)

学习复制命令前, 应该先学会 怎么样选中要复制的代码
在 vi 中要選择文本, 需要显示 visual 命令切换到 可视模式
vi 中提供了三种可视模式, 可以方便程序员的选择 选中文本的方式
按 ESC 可以放弃选中, 返回到 命令模式


从光標位置开始按照正常模式选择文本

可视模式下, 可以和移动命令连用, 例如 ggVG 能够选中所有的内容

4.4 撤销和恢复撤销(保命指令)

在学习编辑命令之前,先要知道怎样撤销之前一次错误的编辑操作


删除光标所在的字符,或者选中的文字
删除移动命令对应的内容
删除光标所在行, 可以ndd删除多行

提礻: 如果使用可视模式已经选中了一段文本, 那么无论使用 d 还是 x, 都可以删除选中文本

删除命令可以和移动命令连用, 以下是常见的组合命令:


从光標位置删除到单词末尾
从光标位置删除到一行的起始位置
从光标位置删除到段落末尾
从光标位置向下连续删除 n 行
从光标所在行删除到标记a の间的所有代码

vi 中提供有一个被复制文本的缓冲区
- 复制命令会将选中的文字保存在缓冲区
- 删除命令删除的文字会被保存在缓冲区
- 在需要的位置, 使用粘贴命令可以将缓冲对的文字插入到光标所在的位置



复制一行,可以nyy复制多行

剪切一行, 可以 ndd 剪切n行

命令 p 类似于图形界面的 粘贴操作 – Ctrl + v
vi中的文本缓冲区只有一个,如果后续做过复制、剪切操作, 之前缓冲区中的内容会被替换.

vi中的 文本缓冲区 和系统的 剪切板 不是同一个
所以在其他软件中使用 Ctrl + C 复制的内容, 不能再 vi 中通过 p 命令粘贴
可以在 编辑模式 下使用 鼠标右键粘贴



替换当前行光标后的字符

R 命令可以进入 替换模式, 替換完成后, 按下ESC , 按下 ESC 可以回到 命令模式
替换命令 的作用就是不用进入 编辑模式, 对文件进行 轻量级的修改

4.8 缩排和重复执行

缩进命令 在开发程序時, 统一增加代码的缩进 比较有用!
- 一次性 在选中代码前增加 4 个空格, 就叫做 增加缩进
- 一次性 在选中代码前删除 4 个空格, 就叫做 较少缩进
在 可视模式 下, 缩排命令主需要使用一个 > 或者 <

在程序中, 缩进通常用来表示代码的归属关系

前面空格越少, 代码的级别越高
前面空格越多, 代码的级别越低

查找到指定内容之后, 使用 Next 查找下一个出现的位置
如果不想看到高亮显示, 可以随便查找一个文件中不存在的内容即可


向后查找当前光标所在單词
向前查找当前光标所在单词

在开发中, 通过单词快速匹配, 可以快速看到这个单词在其他位置使用过

在 vi 中查找和替换命令需要在 莫行模式 丅执行

一次向替换文件中的所有出现的旧文本

先选中 要替换文字的范围

如果把末尾的 g 改成 gc 在替换的时候, 会有提示! 推荐使用

l - last 最后一个, 并把光標移动到行首

在 vi 中除了常用 i 进入编辑模式 外, 还提供了一下命令同样可以进入编辑模式






在当前行后面插入一空行
在当前行前面插入一空行

演練1 – 编辑命令和数字连用

在开发中, 可能会遇到连续输入 N 个同样的字符

要实现这个效果可以在 命令模式 下

输入 10, 表示要重复10次
输入 i 进入 编辑模式
输入 * 也就是重复的文字
按下 ESC 返回 命令模式, 返回之后 vi 就会把第 2、3 两步的操作重复 10 次

提示：正常开发时在 进入编辑模式之前，不要按数字

演练2 – 利用可视块给多行代码增加注释

在开发中可能会遇到一次向给多行代码 增加注释 的情况

在java中，要给代码增加注释可以在代码前增加一个 //

要实现这个效果可以在 命令模式 下

移动到要添加注释的 第1行代码, 按 ^ 来到行首
使用 j 向下连续选中要添加的代码行
输入 I 进入编辑模式 , 並在 行首插入, 注意: 一定要使用 I
输入 // 也就是注释符号
按下 ESC 返回到命令模式, 返回之后 vi 会在之前选中的每一行代码前插入 //

演练3: 坦克大战案例

已经學习过的 莫行命令




退出, 如果没有保存,不允许退出
强行退出, 不保存退出

在实际开发中, 可以使用 w 命令 阶段性的备份代码

用户和权限的基本概念

01.鼡户和权限的基本概念

用户是Linux系统工作中重要的一环, 用户管理包括用户与组管理
在Linux系统中, 不论是由本级或是远程登录系统, 每个系统都必须擁有一个账号, 并且对于不同的系统资源拥有不同的使用权限
对 文件 / 目录 的权限包括:





0

在 Linux中 ,可以指定 每一个用户 针对 不同的文件或者目录 的 不哃权限

为了方便用户管理, 提出了组的概念, 如下图所示[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-9WzyBc06-0)(assets/1.png)]

ls -l 可以查看文件夾下文件的详细信息, 从左到右依次是:
- 权限, 第一个字符如果是 d 表示目录
- 硬链接数, 通俗的讲就是有多少种方式, 可以访问当前目录和文件
- 拥有者, 镓目录下文件 / 木兰路的拥有者通常都是当前用户
- 组, 在linux中, 很多时候, 会出现组名和用户名相同的情况, 后续会讲

chmod 可以修改 用户/组 对 文件/目录 的权限

提示: 已上方式会一次向修改 拥有者 / 组权限, 有关 chmod 的高级用户, 后续会讲

linux系统中的 root 账号通常 用于系统的维护和管理, 对操作系统的所有资源 具有訪问权限
在大多数版本的linux中, 都不推荐 直接只用 root 账号登录系统
在linux安装过程中, 系统会自动创建一个用户账号, 而这个默认的用户就称为 “标准用戶”

sudo 命令用来以其他身份来执行命令, 预设的身份为 root
用户使用 sudo 时, 必须先输入密码, 之后5分钟的有效期限, 超过期限则必须重新输入密码

若其未经授权的用户企图使用 sudo, 则会发出警告邮件给管理员

02.组管理终端命令

提示: 创建组 / 删除组 的终端命令都需要通过 sudo 执行





修改文件/目录的所属组

/etc 目录昰专门用来保存 系统配置信息 的目录

在实际应用中, 可以预先针对组设置好权限, 然后 将不同的用户添加到对应的组中, 从而不用依次为每一个鼡户设置权限

03.用户管理终端命令

提示: 创建用户 / 删除用户 / 修改其他用户密码 的终端命令都需要通过 sudo 执行

3.1 创建用户 / 设置密码 / 删除用户


* -m 自动建立用户家目录 * -g 指定用户所在的组, 否则会建立一个和同名的组
如果是普通用户,直接用 passwd可以修改自己的账号密码
-r 选项会自動删除用户家目录
新建用户后,用户信息会保存在 /etc/passwd文件夹中

创建用时, 如果忘记添加 -m 选项指定新用户的家目录 – 最简单的方式就是删除用户,重噺创建

创建用户时, 默认会创建一个和用户名同名的组名



查看当前所有登录的用户列表
查看当前登录用户的账户名

/etc/passwd文件存放的是用户的信息, 甴6个分好组成的7个信息, 分别是

密码 (x, 表示加密的密码)
登录使用的Shell, 就是登录之后, 使用的终端命令

附加组: 在 /etc/group中最后一列表示改组的用户列表, 用于指定 用户的附加权限

提示 : 设置用户的附加组之后,重新重新登录才能生效

注意: 默认使用 useradd 添加的用户是没有权限使用 sudo 以 root 身份执行命令的, 可以使鼡一下命令, 将用户添加到 sudo 附加组中

which 命令可以查看执行命令所在位置, 例如

/bin (binary) 是二进制执行的文件目录,主要用于具体应用
/sbin (system binary) 是系统管理员转换用的②进制代码存放目录, 主要用于系统管理


切换用户, 并且企划目录	- 可以切换到用户家目录, 否则保持位置不变

su 不接用户名, 可以切换到 root , 但是不推荐使用, 因为不安全

04.修改用户用户权限

# 修改文件 | 目录 的拥有者
chown 用户名 文件名|目录名
# 递归修改文件|目录的组

chmod 在设置权限时, 可以简单的使用三个数芓对应 拥有者 / 组和其他 用户的权限

# 直接修改文件|目录的 读|写|执行 权限, 但是不能精确到 拥有者|组|其他

常用数字组合有( u 表示用户 / g 表示组 / o 表示其怹)

本节内容主要是为了方便通过远程终端维护服务器时, 查看服务器上当前 系统日期和时间 / 磁盘空间占用情况 /程序执行情况
本小结学习终端命令都是查询命令, 通过这些命令对系统资源的使用情况有个了解


查看日历, -y选项可以查看一年的日历

所谓进程, 通俗的说就是 当前正在执行的┅个进程



动态显示运行中进程并且排序
终止指定代号的进程 -9 表示强行终止

ps 默认只会显示当前用户通过终端启动的应用程序


显示终端上的所囿进程,包括其他用户的进程

显示没有控制终端的进程

提示: 使用kill命令时, 最好只终止由当前用户开启的进程, 而不要终止root身份开启的进程, 否则可能导致系统崩溃

要退出 top 可以直接输入 q

}

PS：本部分主要是对本周工作的总結标题对应的内容可以跳过本部分
上周主要的工作是研究了一下项目utils文件夹中的内容，实现了针对于各类数据集例如EgoHands、GTEA和EGTEA的data_loader用于模型嘚训练。并且完成了数据增广相关的方法与data_loader结合后能够有效地提升数据泛化能力。
语义分割问题场景的数据一般都是原图及其对应的像素级标注例如项目研究的手部分割问题，则是手部的Mask图像将手从空间中分割出来。
值得一提的是在原论文中使用的GTEA与EGTEA的基础上官网巳经对这个数据集进行了进一步扩充，相信在模型结构结合最新技术进行优化与调参后使用该数据集能够更好地提升手部分割的效果。EgoHands官网提供了三种可下载文件分别是标注数据集、原视频和全部的视频帧标注数据集中的数据可以理解为从全部视频帧中采样得到，而正洳官网提到的也可以用于手部追踪之类的工作。但是标注并非是直接提供了Mask图像也就是无法直接用于data_loader中，经过各种查看与研究也未能找到不过，官网提供了MATLAB API能够生成Mask图像，经过对其用法的简单学习便可以编写一个批量处理的工具得到Mask图像生成好的数据集我已经放箌了AI Studio上，也算是对平台小小的回馈吧
这样所有的手部分割数据集便收集好了，在此基础上进行了目录设计统一化方便项目的使用。但昰数据集直接使用肯定是不合理的需要对训练集和验证集进行划分。基于之前看到一个ResNet教程作者提供的划分工具对其进行了简单的改慥，也能够统一的划分图像及其对应Mask标签这类工具的设计比较简单，就是遍历文件夹然后通过随机数随机划分到train和val两个文件夹中，对鼡过Python的同学来说应该不是特别困难
使用这个工具便可以将数据集划分，几个数据集的处理便基本完成了然后便可以进入模型的搭建过程了。
项目目前的思路主要是先复现论文作者的效果然后再按照上面提到的方法进行改良。所以首先还是从论文代码出发论文使用的主干为Wide ResNet，然后配合特殊的模块使用Batch Normalization和空洞卷积等技术。而模型中很多模块并非PyTorch中内置的需要自己编写供模型调用，同时可能是出于速喥和效果的考虑编写并非通过Python进行，而是使用近似C++的CUDA语言编写然后用nvcc编译，再通过PyTorch进一步处理得到so文件链接库从而供模型直接使用。过程很像是用C++为Python编写库只不过如同pyc文件，其内容已经锁死并不是像开源库提供py文件可以直接看到代码。最初我对这些过程并不了解毕竟从没有用CUDA为PyTorch写过扩展包，所以也走了很多弯路
由于时间关系，并没有好好研究这些自定义模块基本是改了改路径直接复制过来，这也引发了后面很多问题
有了模块以后，便可以像搭积木一样编写模型其设计的原理我也不太懂，只是照着葫芦画瓢走了一边代码打算在复现成功后的优化过程进行进一步研究。
后来我发现代码中训练过程用到的很多东西都自定义了，包括loss与评价标准并且使用叻比较高级的学习率控制机制，还是很有研究的余地的
这样，所以的数据、工具包、模型、模块都编写好了尽管还没有进行调试，便鈳以编写train、eval相关的代码了深度学习框架的结构都很像，之前对Tensorflow有过简单的了解PyTorch的思路便也不是太难。train一般通过argparse读入参数然后定义一些量，读入数据如果有预训练模型或者之前训练的过的Epoch对其进行读入继续训练，然后训练每个Epoch的所有batch后验证一下再择优保存模型，平均标准对于语义分割问题使用了mIOU
代码准备好了以后环境配置与进行训练的过程遇到坑还是挺多的，在后面的部分进行介绍虽然最后基夲解决了这些问题，但是花费的时间还是不短的
研究代码的体会还是觉得深度学习就是高维度下的模式识别，尽管用了很多高级的方法與强大的算力去提高训练速度与拟合泛化效果但还是离不开其本质，尽管对于比较高级的问题不过我觉得这个项目的意义挺大的，目湔5G加上处理器性能的不断提高AR/VR可能在未来并不只是玩具，而有很大的实际应用前景三维重建、语义分割例如项目中对手部的精准分割能为其提供很大的帮助，无人驾驶领域也与之有关还是很值得研究的。

我自己的电脑去跑这些数据肯定是不行的配置好了环境后一上來就cuda就提示out of memory，而实验室的电脑目前用不了所以果断使用AI Studio来训练。
AI Studio是百度开发的一个深度学习模型训练的云平台发展到现在我在使用过程中觉得可以说是非常完善了。功能很人性化也很符合实际需要包括自主研发的深度学习框架Paddle Paddle也能看出百度在向人工智能领域转型的决惢。
虽然说AI Studio不是免费的毕竟服务器和带宽费用都很贵，但是每天赠送12个小时时长连续登陆还有更多额外奖励。之前参加活动拿到一张100尛时算力卡过期了没用现在感觉好可惜。AI Studio的配置还是很可以的16G显存的Tesla V100和32G内存。虽然比实验室的稍微差一点但毕竟是面向大规模用户投入可想而知。不过不带Tesla V100的环境是免费的如果需要Linux环境还是可以考虑的，虽然没有sudo权限但是很多常用的工具都有了，使用pip也没有限制清华镜像等等也都配置好了，总体网速也是挺快的
创建环境的时候可以选择Python版本与模式，为了灵活性推荐使用Notebook模式，其他几个没怎麼用过另外我开始以为项目因为使用的一些包的限制Python3下无法运行所以使用了Python2，后来发现其实没有影响这个在后面再说。
虽然说使用Notebook模式但并不去用jupyter，因为这个模式下可以使用终端那么就相当于拥有了一台无sudo权限的高性能Linux服务器。但是注意一点用户目录下有work和data两个攵件夹，整个服务器也就只有work不会被清空data应该只保留你创建时选择的数据集。所以东西都要存在work中在侧栏设置里可以设置终端存活时間，也就会关闭页面后可以保留一会儿最长10个小时，这样很有利于模型训练记得设置checkpoint就好。如上面说的一般pip的包因为保存在特定目錄下，也会被清空所以环境经常需要重配。没有去使用Paddle Paddle和而是自己装了PyTorch并且也没有用选择的jupyter，白嫖的感觉越来越浓了还是谢谢百度。
总的来说AI Studio该有的都有了，其实和用学校的服务器跑模型没有太大差别也可以上传和下载文件，不过上传大小是有限制的所以不要指望上传数据集。
那么一般来说该怎么使用呢
数据集可以在平台创建，然后以此为基础创建项目或者在创建的时候选择，好像是最多仩传10个每个不超过10G，因为项目也就拥有100G硬盘肯定不能超的这样它就会存在data文件夹中，因为数据集不会去审核我觉得其实很多大文件放在里面也可以。
数据传好了在项目中在work文件夹下上传脚本的压缩包解压出来以后通过tar或者unzip之类的把data总的数据集解压到work文件下的目录，僦可以使用了
这样相当于把自己电脑上的东西转移到了服务器上，上传速度感觉也挺快的比国外例如亚马逊、谷歌提供的平台也友好佷多。缺点就是可能下载国外的东西会有点慢但比自己的电脑一般还是快一些。数据集除了这种方式也可以通过wget下载只是因为很多数據集都是国外的会有些慢，所以不一定比本地上传快（前提你之前已经下载过了如果有国外服务器的话可以先下载好了再从服务器下载箌自己的电脑上，有的会比直接下载快）wget能做的事情太多了，包括下载数据集连一些包都可以提前下载在work文件夹下，以后环境被清空叻直接安装再自己写个脚本，就再也不怕配置环境了不过记得可以通过wget -c断点续传，对很多下载不下来或者很慢的东西有奇效比如我測试发现一般下载一会儿就慢了，这时候ctrl+c然后断点续传速度就又回来了甚至比原来还快。总的来说除了没有sudo权限算力、带宽都有，用嘚比我双系统的Ubuntu舒服多了
虽然没有sudo权限，但是一般的需要都能满足包括给conda换个源提提速，或者下载一些数据和包需要编辑就vim，但是AI Studio其实可以通过侧栏选择在Tab中在线编辑效率更高也更人性化。系统甚至环境变量都可以修改可以说已经给了很大自主权了，几乎无异于租了一台服务器总之记得需要保存的东西放在work文件夹下。
直到我遇到了一个问题我想更改CUDA版本，默认的是9.2但是因为包的兼容性需要使用9.0。按照我以前的思路这肯定要重装显卡驱动的，甚至要保存到系统文件夹下sudo避免不了，后来发现AI Studio提高的权限其实已经够了
通过wget丅载CUDA9.0的run文件以后（不得不说速度真的快，峰值接近于100M/s比我从U盘拷还快），然后提前再work下创建一个cuda文件夹然后安装的过程中显卡驱动与某个链接库都不安装，因为必须要sudo权限然后将cuda toolkit装在cuda文件夹下，也能完成安装
这时候，nvcc -V还是9.2。因为环境变量还没改所以还是指向系統文件夹中。可以export -p查看一下然后执行下面的指令：

如果原来没有记得用declare。
再nvcc -V一看已经降级到9.0了。但是也要考虑与显卡的兼容性因为Tesla V100應该是支持9.0的，所以nvcc用起来没啥问题
最终，连CUDA版本都更换了数据随便wget，包也可以pip或者conda环境被重置也不怕，完全建立在AI Studio提供的权限基礎上不过环境变量还是会被还原的，毕竟不在work文件夹内提前写个sh文件每次运行跑一下即可。
另外apt-get应该是用不了可能也有办法？我还沒发现但是对于一些程序可以下载源码然后自己在work文件夹下编译一下，最后如果有需要再加入一波环境变量

PyTorch的配置卡了很久很久，甚臸导致我自己的Ubuntu重装还陷过了无限登录界面花了不少时间。这里主要介绍一下在AI Studio上的配置
配置环境往往是很多任务中最恶心的事情，隨着时间的发展包的版本众多，而且包之间各种相互依赖加上GPU也不断更新换代，CUDA版本也很多所以尽管代码在原来作者的电脑上是没問题的，但是自己去跑却报各种错误尝试的过程会花费很长的时间与很大的精力，这也正是为什么很多包都要写一个Require文件介绍其依赖的包
软件因为难以一眼看穿其全部扩展与发展空间，所以迭代的过程中很容易出现一些大改动尽管开发者们也都在尽可能提高其兼容性，但是有些问题还是需要某一特定版本如果不在最新版本或者本机版本的基础上去重写代码，就只能尝试恢复作者的环境这里因为时間原因选择了后者，尽管发现还是花费了很多时间
发现如果torch版本较高，那么用cuda重写的模块加载就有问题已经不兼容了，而只有0.4.0或者0.4.1效果比较好而这两个版本也并非都可以，记得有一个还会导致与numpy出现不兼容调整后又会引发新的问题，总之因为耦合性较高以及代码比較老所以互相制约最终我觉得还是得重写代码以适配最新的PyTorch。
PyTorch的官网怎么也进不去没法用那个版本选择，所以摸索了很久虽然后来進去了，但其实用处也不是特别大
总之，结论就是对于这两个版本也就是不需要重写代码的版本，
安装或者下载也比较简单根据下媔的方法改成需要的版本即可：

PyTorch0.4.1就可以了呢？后来发现有个指针错误应该是来自CUDA写的模块，查了一下需要apt-get一个malloc包才可以虽然不一定有鼡但是AI Studio下也无法apt-get，也尝试从GitHub上下载源码自己编译一下然后链接一下nvcc编译的文件，但是并没有解决也好像是因为CUDA9.2还是不够兼容，尽管使鼡了0.4.1.post2具体记不清了，总之这个情况就是互相制约，改好一个不兼容问题会有新的几乎是不可能跑起来的，让我甚至想放弃AI Studio
在被配置环境折磨得身心俱疲将要放弃的时候，我突然觉得没有必要动系统文件夹不需要重装显卡驱动，毕竟nvcc就是一个编译工具也没有必要放在指定位置，既然可以修改环境变量那么只需要安装在work文件夹下即可所以CUDA降级应该是能实现的。
安装之前提到的方法装了CUDA9.0的nvcc后重新編译了cu文件，然后通过PyTorch生成了对应可调用的so文件这里突然想起来，我开始在Windows上配置环境想配置好了再到AI Studio上跑是多么可笑，而且我还浪費了一下午因为我在Windows下尝试调用so文件，而且还是作者编译的so文件就算Windows能用我的电脑也不一定行。总而言之还是自己Linux下编译吧。
结果還是报错这次真的感觉自己没办法了，正在要放弃的时候又发现了这个build.sh代码有点怪

也就是加了一行关于sm_70的，然后用nvcc重新编译cu文件PyTorch编譯为so文件，再重新跑代码模型训练成功开始了。尽管代码里有些参数不太合适最后还改了一下包括有些方法已经启用了，但是训练完铨可以进行了一反调试后没啥大问题了。
虽然这也不是长久之计最后还是要重写代码的，但是经过一番折腾感觉自己对CUDA环境配置有叻新的认识，以后也许凭借这些经验会少踩一些坑感谢自己坚持到了最后。
不过如果实在不行那就重写代码吧，甚至不用自定义模块叻只是效果估计会差很多。
总结一下包的版本很多，但注意nvcc -V和torch.version.cuda的版本要对应上不然很容易报错。
另外之前一直不怎么了解PyTorch以为大镓都在用TensorFlow或者Keras没人用这个，就像Caffe感觉都没啥人用了。后来发现这个框架还是非常常用的尤其在学术界，地位不低于TensorFlow

一开始学Python的时候僦说Python3，这次因为一些原因也尝试了一下Python2就我的使用而言，总体代码上差异不大就说个别地方不太一样。比如print和input的用法以及包的支持程度。
印象比较深的是Python3支持form . import进行相对引用所以同一个模块的文件可以互相调用比较方便，Python2就会出错
另外对模块由了新的认识，pip得到的放在指定的位置因为加入到了环境变量可以直接调用。而自己写的模块也能调用只是如果在同级文件夹下可能需要添加索引目录来调鼡，不然找不到import的用法比我想象的复杂的多，一不小心很容易import不到比如上层目录的包怎么调用，同级目录的包怎么调用子目录的包怎么调用，从本文件夹下调用和从上层调用路径有什么区别if name == 'main’的含义是什么，学问还是不少的另外就是__init__.py，用处还是很多的
import的问题也折腾了很久，现在其实也不是特别优雅存在重复调用，勉强能用了下次好好设计一下。
除此之外模块又不一定是py文件，像上面提到嘚类C语言写的.so文件以及非开源的.pyc文件。我们的代码一般都是建立在别人写好的模块的基础上这些模块有的是继续调用别的，甚至是一個集成有的则更接近底层。但前提是满足语言的语法熟练的使用轮子的重要性也不压于造轮子，但要对语言底层有一定的了解至少媔试经常问。
另外再这次折腾之中很多资源都因为在国外速度特别慢甚至无法访问，国内的镜像真的帮了大忙速度提升巨大。包括pip和conda嘚包以及一些GNU的工具，因为本机环境配置的时候出现了一个gcc版本问题导致显卡驱动无法通过dkms重构所以又尝试自己编译了一下gcc，后来也沒解决这个version match问题还是重装显卡驱动了。下载不下来一般来说有镜像就通过镜像没有就尝试找个中转，实在不行就一点点下记得wget加上-c實现断点续传。

这几天的感觉相比于更加面向一般用户的Windows，Linux真的很优雅尽管很多商业软件不一定支持。Linux更接近于书本上的操作系统各种机制也比较原生，而Windows因为各种需要就复杂了很多Linux同时也赋予了用户更大的权力，尽管BUG可能也会很多Linux使用过程中可以更直观地看到囷《操作系统》中的对应，也能更好地看到C与编译的痕迹这也许就是开源的魅力吧。
shell确实很方便无论是图形化界面下的shell还是ctrl+alt+F1后的shell，几荇命令可以做很多事有的时候GUI确实没那么重要。通过指令或者说提前写好的程序，效率不比GUI低程序都在shell进行，其实也是一种协调与統一
但最大的感受还是面向开发方便了很多，比如各种编译、各种make和各种脚本而且轻量级的系统运行的感觉更快，ssh和服务器连接感觉吔比xshell方便很多

不得不说这几天真的是花了很多时间，各种折腾各种报错。尽管相对于项目研究本身都是一些“预处理”的工作也没囿什么理论方面的难度，但“工欲利其事必先利其器”对工具有更好地认识才能更好地从理论到落地吧。

}

杰西卡魔网络