书接上回,上回书咱们说到, setup 函数的一番折腾,加载了根文件系统,顺着根 inode 可以找到所有文件,为后续工作奠定了基础。
而有了这个功能后,下一行 open 函数可以通过文件路径,从硬盘中把一个文件的信息方便地拿到。
1
2
3
4
5
6
| void init(void) {
setup((void *) &drive_info);
(void) open("/dev/tty0",O_RDWR,0);
(void) dup(0);
(void) dup(0);
}
|
那我们接下来的焦点就在这个 open 函数,以及它要打开的文件 /dev/tty0,还有后面的两个 dup。
open 函数会触发 0x80 中断,最终调用到 sys_open 这个系统调用函数,相信你已经很熟悉了。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
| // open.c
struct file file_table[64] = {0};
int sys_open(const char * filename,int flag,int mode) {
struct m_inode * inode;
struct file * f;
int i,fd;
mode &= 0777 & ~current->umask;
//
for(fd=0 ; fd<20; fd++)
if (!current->filp[fd])
break;
if (fd>=20)
return -EINVAL;
current->close_on_exec &= ~(1<<fd);
f=0+file_table;
//
for (i=0 ; i<64 ; i++,f++)
if (!f->f_count) break;
if (i>=64)
return -EINVAL;
(current->filp[fd]=f)->f_count++;
//
i = open_namei(filename,flag,mode,&inode);
if (S_ISCHR(inode->i_mode))
if (MAJOR(inode->i_zone[0])==4) {
if (current->leader && current->tty<0) {
current->tty = MINOR(inode->i_zone[0]);
tty_table[current->tty].pgrp = current->pgrp;
}
} else if (MAJOR(inode->i_zone[0])==5)
if (current->tty<0) {
iput(inode);
current->filp[fd]=NULL;
f->f_count=0;
return -EPERM;
}
if (S_ISBLK(inode->i_mode))
check_disk_change(inode->i_zone[0]);
f->f_mode = inode->i_mode;
f->f_flags = flag;
f->f_count = 1;
f->f_inode = inode;
f->f_pos = 0;
return (fd);
}
|
这么大一坨别怕,我们慢慢来分析,我先用一张图来描述这一大坨代码的作用。
- 第一步,在进程文件描述符数组 filp 中找到一个空闲项。**还记得进程的 task_struct 结构吧,其中有一个 filp 数组的字段,就是我们常说的文件描述符数组,这里先找到一个空闲项,将空闲地方的索引值即为 fd。
1
2
3
4
5
6
7
8
9
| int sys_open(const char * filename,int flag,int mode) {
...
for(int fd=0 ; fd<20; fd++)
if (!current->filp[fd])
break;
if (fd>=20)
return -EINVAL;
...
}
|
由于此时当前进程,也就是进程 1,还没有打开过任何文件,所以 0 号索引处就是空闲的,fd 自然就等于 0。
- 第二步,在系统文件表 file_table 中找到一个空闲项。**一样的玩法。
1
2
3
4
5
6
7
8
9
10
| int sys_open(const char * filename,int flag,int mode) {
int i;
...
struct file * f=0+file_table;
for (i=0 ; i<64; i++,f++)
if (!f->f_count) break;
if (i>=64)
return -EINVAL;
...
}
|
注意到,进程的 filp 数组大小是 20,系统的 file_table 大小是 64,可以得出,每个进程最多打开 20 个文件,整个系统最多打开 64 个文件。
- 第三步,将进程的文件描述符数组项和系统的文件表项,对应起来。**代码中就是一个赋值操作。
1
2
3
4
5
| int sys_open(const char * filename,int flag,int mode) {
...
current->filp[fd] = f;
...
}
|
- 第四步,根据文件名从文件系统中找到这个文件。其实相当于找到了这个 tty0 文件对应的
inode
信息。
1
2
3
4
5
6
7
8
9
| int sys_open(const char * filename,int flag,int mode) {
...
// filename = "/dev/tty0"
// flag = O_RDWR 读写
// 不是创建新文件,所以 mode 没用
// inode 是返回参数
open_namei(filename,flag,mode,&inode);
...
}
|
接下来判断 tty0 这个 inode 是否是字符设备,如果是字符设备文件,那么如果设备号是 4 的话,则设置当前进程的 tty 号为该 inode 的子设备号。并设置当前进程tty 对应的tty 表项的父进程组号等于进程的父进程组号。
这里我们暂不展开讲。
- 最后第五步,填充 file 数据。其实就是初始化这个 f,包括刚刚找到的 inode 值。最后返回给上层文件描述符 fd 的值,也就是零。
1
2
3
4
5
6
7
8
9
10
| int sys_open(const char * filename,int flag,int mode) {
...
f->f_mode = inode->i_mode;
f->f_flags = flag;
f->f_count = 1;
f->f_inode = inode;
f->f_pos = 0;
return (fd);
...
}
|
最后再回过头看这张图,是不是就有感觉了?
其实打开一个文件,即刚刚的 open 函数,就是在上述操作后,返回一个 int 型的数值 fd,称作文件描述符。
之后我们就可以对着这个文件描述符进行读写。
之所以可以这么方便,是由于通过这个文件描述符,最终能够找到其对应文件的 inode 信息,有了这个信息,就能够找到它在磁盘文件中的位置(当然文件还分为常规文件、目录文件、字符设备文件、块设备文件、FIFO 特殊文件等,这个之后再说),进行读写。
比如读函数的系统调用入口。
1
2
3
| int sys_read (unsigned int fd, char *buf, int count) {
...
}
|
写函数的系统调用入口。
1
2
3
| int sys_write (unsigned int fd, char *buf, int count) {
...
}
|
入参都有个 int 型的文件描述符 fd,就是刚刚 open 时返回的,就这么简单。
好,我们回过头看。
1
2
3
4
5
6
| void init(void) {
setup((void *) &drive_info);
(void) open("/dev/tty0",O_RDWR,0);
(void) dup(0);
(void) dup(0);
}
|
上一讲中我们讲了 setup 加载根文件系统的事情。
这一讲中利用之前 setup 加载过的根文件系统,通过 open 函数,根据文件名找到并打开了一个文件。
打开文件,返回给上层的是一个文件描述符,然后操作系统底层进行了一系列精巧的构造,使得一个进程可以通过一个文件描述符 fd,找到对应文件的 inode 信息。
好了,我们接着再往下看两行代码。接下来,两个一模一样的 dup 函数,什么意思呢?
其实,刚刚的 open 函数返回的为 0 号 fd,这个作为标准输入设备。
接下来的 dup 为 1 号 fd 赋值,这个作为标准输出设备。
再接下来的 dup 为 2 号 fd 赋值,这个作为标准错误输出设备。
熟不熟悉?这就是我们 Linux 中常说的 stdin、stdout、stderr。
那这个 dup 又是什么原理呢?非常简单,首先仍然是通过系统调用方式,调用到 sys_dup 函数。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
| int sys_dup(unsigned int fildes) {
return dupfd(fildes,0);
}
// fd 是要复制的文件描述符
// arg 是指定新文件描述符的最小数值
static int dupfd(unsigned int fd, unsigned int arg) {
...
while (arg < 20)
if (current->filp[arg])
arg++;
else
break;
...
(current->filp[arg] = current->filp[fd])->f_count++;
return arg;
}
|
我仍然是把一些错误校验的旁路逻辑去掉了。
那这个函数的逻辑非常单纯,就是从进程的 filp 中找到下一个空闲项,然后把要复制的文件描述符 fd 的信息,统统复制到这里。
那根据上下文,这一步其实就是把 0 号文件描述符,复制到 1 号文件描述符,那么 0 号和 1 号文件描述符,就统统可以通过一条路子,找到最终 tty0 这个设备文件的 inode 信息了。
那下一个 dup 就自然理解了吧,直接再来一张图。
气不气,消耗了你两次流量,谁让你不懂呢,哈哈哈哈~
ok,进程 1 的 init 函数的前四行就讲完了,此时进程 1 已经比进程 0 多了与 外设交互的能力,具体说来是 tty0 这个外设(也是个文件,因为 Linux 下一切皆文件)交互的能力,这句话怎么理解呢?什么叫多了这个能力?
因为进程 fork 出自己子进程的时候,这个 filp 数组也会被复制,那么当进程 1 fork 出进程 2 时,进程 2 也会拥有这样的映射关系,也可以操作 tty0 这个设备,这就是“能力”二字的体现。
而进程 0 是不具备与外设交互的能力的,因为它并没有打开任何的文件,filp 数组也就没有任何作用。
进程 1 刚刚创建的时候,是 fork 的进程 0,所以也不具备这样的能力,而通过 setup 加载根文件系统,open 打开 tty0 设备文件等代码,使得进程 1 具备了与外设交互的能力,同时也使得之后从进程 1 fork 出来的进程 2 也天生拥有和进程 1 同样的与外设交互的能力。
好了,本文就讲到这里,再往后看两行找找感觉,我们就结束。
1
2
3
4
5
6
7
8
9
| void init(void) {
setup((void *) &drive_info);
(void) open("/dev/tty0",O_RDWR,0);
(void) dup(0);
(void) dup(0);
printf("%d buffers = %d bytes buffer space\n\r",NR_BUFFERS, \
NR_BUFFERS*BLOCK_SIZE);
printf("Free mem: %d bytes\n\r",memory_end-main_memory_start);
}
|
接下来的两行是个打印语句,其实就是基于刚刚打开并创建的 0,1,2 三个文件描述符而做出的操作。
刚刚也说了 1 号文件描述符被当做标准输出,那我们进入 printf 的实现看看有没有用到它。
1
2
3
4
5
6
7
8
| static int printf(const char *fmt, ...) {
va_list args;
int i;
va_start(args, fmt);
write(1,printbuf,i=vsprintf(printbuf, fmt, args));
va_end(args);
return i;
}
|
看,中间有个 write 函数,传入了 1 号文件描述符作为第一个参数。
细节我们先不展开,这里知道它肯定是顺着这个描述符寻找到了相应的 tty0 也就是终端控制台设备,并输出在了屏幕上。我们赶紧看看实际上有没有输出。
仍然是 bochs 启动 Linux 0.11 看效果。
看到了吧,真的输出了,你偷偷改下这里的源码,再看看这里的输出有没有变化吧!
经过今天的讲解之后,init 函数后面又要 fork 子进程了,也标志着进程 1 的工作基本结束了,准确说是能力建设的工作结束了,接下来就是控制流程和创建新的进程了,可以到开头的全局视角中展望一下。