NoteBook/Note for Linux Programming.md at master · CoreBoxer/NoteBook

    Linux系统编程

POSIX:可移植性操作系统接口目录是可读名称到索引编号的之间的映射，名称和索引节点之间的配对称为链接（Link）。目录也是普通文件的形式存在，但只能通过特殊系统调用来操作目录间内的链接可以指向其他目录的索引节点，引起目录可以嵌套到其他目录中，形成目录层内核打开路径名时，会遍历路径中每个目录项（dentry），找到指向下一个索引节点的链接，依次向下

多个不同名称的链接映射到同一个索引节点时，称链接为硬链接当硬链接数减为0时，文件及其对应索引节点才会从文件系统删除硬连接不能跨越多个文件系统，需要符号链接符号链接可以指向任何地方甚至不存在的文件，它存有目标绝对路径

Linux四种特殊文件：块设备文件字符设备文件命名管道 UNIX域套接字通过系统调用创建他们

字符设备：作为线性字节队列访问，驱动程序把字符写入队列，用户空间读出队列块设备：作为字节数组访问，驱动把字节映射到客轮值的设备上，用户空间可按任意顺序和位置读命名管道：FIFO，将一个程序输出以“管道”通向另一程序输入，它们通过访问同一文件实现套接字：支持不同进程间通信，可本机，可网络

扇区（sector）：块设备最小寻址单元，介质物理属性块（block）：文件系统最小寻址单元，文件系统的抽象，不是物理介质的抽象块大小一般是2的指数倍的扇区大小（512B、1KB、4KB）页：内存最小寻址单元

进程

ELF（Executable and Linkable Format）

代码段：线性目标代码块数据段：初始化的数据 bss段：未初始化的全局数据

mmu（内存管理单元）： * 提供虚拟内存功能，使系统可执行比内存更大的程序 * 保护代码段等需要保护的内存区

IPC(Inter-Process Communication)进程间通信

gcc参数
* -o 产生目标 * -E 预处理头文件展开宏展开，.i文件 * -S 编译产生汇编文件，.s * -c 取消链接步骤，直接生成目标文件 .o * -Wall 对源文件代码有问题的部分发出警告 * -Idir 指定头文件目录路径 * -Ldir 指定库文件目录路径 * -llib 链接lib库 * -g 目标文件中添加调试信息，以便gdb调试

一个与共享库链接的可执行文件仅仅包含它用到的函数入口地址的一个表，而不是外部函数所在目标文件的整个机器码

生成静态库()

hello_fn.h hello_fn.c main.c gcc -Wall hello_fn.c -o hello_fn.o ar rcs libhello.a hello_fn.o ar是gnu归档工具，rcs表示(replace and create) gcc -Wall main.c libhello.a -o main gcc -Wall -L. main.c -o main -lhello

生成共享库(.so）

shared: 表示生成共享库格式 fPIC：产生位置无关码(position independent code) 库名规则：libxxx.so 示例：gcc -shared -fPIC hello.o –o libhello.so 使用共享库编译选项 l：链接共享库，只要库名即可(去掉lib以及版本号) L：链接库所在的路径. 示例： gcc main.o -o main –L. -lhello

程序运行时的动态链接库路径配置

1、拷贝.so文件到系统共享库路径下一般指/usr/lib 2、更改LD_LIBRARY_PATH 3、配置ld.so.conf，ldconfig更新ld.so.cache 然后调用ldconfig更新

静态库和共享库同时存在的时候，优先使用共享库

查看程序调用了那些库 ldd main 即可查看调用了哪些库

    Makefile

显式声明伪目标可以防止与同名文件冲突 .PHONY:clean

变量：定义 OBJECTS=main.c print.c 使用 $(OBJECTS)

自动化符号： $@ 所有目标 $< 第一个依赖 $^ 所有依赖

@ 取消命令执行输出

%.c 当前列表的所有.c文件

.c.o: 当前所有C文件变成O文件

    GDB（GNU Debugger）调试

gdb target 启动GDB l（list）显示C程序，Enter显示下一页 l（list）文件名：n 查看第n行 l（list）文件名：函数名查看函数 b（break） n 在第n行添加断点 b（break）函数名在程序人口地址插入断点 i（info） break 查看所有断点信息 r（run）执行程序（或重新执行） s（step）单步（进入函数） n（next）不进入函数 u（until）跳出循环 c 跳到下一个断点 p（print）变量名显示变量内容 f（finish）退出当前函数并打印函数返回时的堆栈地址和返回值及参数值等信息 q（quit）退出gdb break if - 条件成立时程序停住。如break if i=20 当i等于20时停住 info break(i b) - 查看断点 watch expr - 一旦变量值发生改变，程序停住 delete n - 删除断点

print - 查看变量值 ptype - 查看类型 print 数组名 - 查看数组此时数组名代表整个数组，&数组才是基地址 print *array@len - 查看动态内存 print x=5 - 改变运行时数据

回车（Enter）重复上一个命令

    系统调用

每个系统调用被赋予一个系统调用号在i386平台上，通过int 0x80 软中断进入内核空间 eax存放系统调用号 ebx、ecx、edx、esi、edi存储系统调用的参数超过5个参数的系统调用，用一个寄存器指向用户空间存储参数的缓存区

函数：perror("dada"); 输出内容：dada：错误码对应的字符串

函数：str = strerror(错误码) 将错误码转换为对应的字符串注意：包含 string.h

函数:fprintf("stderr", "close error with msg: %s\n", strerror(errno))

文件指针文件描述符 stdin STDIN_NO stdout STDOUT_NO stderr STDERR_NO

fileno(文件指针): 文件指针转换为文件描述符 fileopen(文件描述符): 文件描述符转换为文件指针

文件权限和umask： new prio = prio &~ umask 不是算数减法，而是逻辑减法 0777位1+2+4会被0022筛掉二进制第2位和第5位 0755为1+4没有二进制第2位和第5位，所以仍为0755

当整个程序结束时会把所有打开的文件描述符关闭

目录访问函数： opendir readdir closedir rmdir mkdir chmod fchmod chown fchown

获取文件元数据 int stat(const char *path, struct stat *buf); int fstat(int fd, struct stat *buf); int lstat(const char *path, struct stat *buf);\只可获取符号链接文件本身的元数据

readlink：获取链接文件指向的地址

同一进程多次打开的同一文件的文件表是各自独立的，但v节点表使用同一个

v节点信息？ i节点信息？

函数 void *memset(void *s, int c, size_t n); 在s指向的内存区的起始区域内填写n个c

复制文件描述符 dup(int oldfd); dup2(int oldfd, int newfd);等价于close newfd然后dup(oldfd); fcntl(fd, F_DUPFD, fd_start);从fd_start开始搜索可用的空文件描述符，而dup从0开始

输出重定向如先把1号文件描述符（标准输出）关闭，然后复制其它文件描述符，该文件描述符就会和1指向统一文件，标准输出变成该文件

fcntl多功能函数 * 复制文件描述符 - F_DUPFD(long) * 复制文件描述符 - F_GETFD(void) - F_SETFD(long) * 复制文件描述符 - F_GETFL(void) - F_SETFL(long) * 文件锁 - F_GETLK(flock *lock) 锁定成功返回 0 - F_SETLK, F_SETLKW 文件锁: 位置设置为SEEK_SET，偏移为0的时候，锁整个文件

    进程

进程控制块PCB: 内容： * 进程标识符 PID （非零正整数） * 父进程标识符 PPID（非零正整数） * 启动进程的用户ID UID * 所归属组 GID * 当前状态 * 优先级 * 资源占用

函数： FILE *popen(const char *command, const char *type); 打开管道 int pclose(FILE *stream); 关闭管道 command为可执行文件的全路径和执行参数因为管道被定义成单向的，所以type只能为读r或写w

子进程有自己的数据段，不会影响父进程的变量值 fork: 子进程创建成功：在父进程返回子进程的PID 在子进程中返回 0 创建失败：均返回 -1

当子进程需要修改数据段时，才开始拷贝原进程的数据段，这样可以推迟甚至避免拷贝操作

pid_t wait(int *status) pid_t waitpid(pid_t pid, int *status, int options): * 阻塞当前进程的运行，直到有信号到或子进程结束。 * 返回子进程标识符。 * status 返回子进程结束状态值，可设为NULL * waitpid 函数更灵活，可选择不阻塞立即返回或等N个子进程结束再返回 pid为等待的子进程的标识符 options： - WNOHANG: 如果没有已经结束的子进程，立即返回，不进行等待 - WUNTRACED: 如果子进程也被阻塞，则立即返回

unsigned int sleep(unsigned int seconds): 将当前进程阻塞 seconds 秒

vfork 创建的新进程往往会调用exec函数，子进程刚开始会共享父进程的地址空间，但调用exec之后，子进程完全由exec执行的新程序替换掉，仅仅保留进程标识符不变，子进程原来的数据段和堆栈段被丢弃，重新分配新的与fork另一个区别，vfork保证子进程先运行，子进程调用exec或exit之后父进程才可能被调度运行。所以，如果子进程调用exec或exit之前依赖了父进程，就会死锁

    exec函数族

exec的参数 * path: 可执行文件名的全路径名 * file: 可以是全路径名，也可以只是执行文件名 * arg: 可执行文件的命令行参数，可以多个，以NULL结尾 * argv: 字符串数组：传递命令行参数的另一种形式，一般为 - char * argv[] = {"full path", "param1","param2",...NULL}: * envp: 新进程的环境变量，字符串数组，一般为 - char *envp[] = {"name1=val1","name2=val2",...NULL}: - 对于有参数envp的函数调用，新进程中全局变量environ指针指向的环境变量数组将被envp中的内容替代命名规则： * l:list 命令行参数列表 * v:vector 指向各命令行参数的指针数组，将数组首地址传给他 * p:path 可执行文件在PATH环境变量的目录中搜寻不带p则第一个变量必须指定可执行文件的全路径 * e:environment 可以传入新的环境变量列表如果没有，则只能使用当前的默认环境变量

输出系统的各环境变量 char **penv = __environ; while(penv && *penv) { printf("%s", *penv++); }

终止进程

正常终止
- main函数里的return
- 调用exit()
- 调用_exit()
异常终止
- 调用abort()
- 收到导致终止的信号

_exit与exit函数： _exit较简单，直接停止进程运行，清除内存空间，注销相关数据结构 exit是_exit增强，还会检查文件打开情况，清理IO缓冲

每一个用f———函数打开的文件，在内存中都有一片缓冲区例如： printf("ABC\n"); printf("DEF"); _exit(); 因为DEF后没换行符，不会打印出DEF

printf("ABC\n");
printf("DEF");
exit();
正常打印

守护进程以超级用户（UID为0）的优先级运行，父进程为init进程，没有控制终端

父进程先于子进程退出，子进程变为孤儿进程，由init进程（UID为1）收养，变为init的子进程

进程组: 一个或多个进程的集合，有一个组长进程，进程组标识符等于组长进程的标识符，但不会因为组长进程结束而结束会话过程: 一个或多个进程组的集合，通常开始于用户的登录，终止于用户的退出，此期间用户运行的所有进程属于这个会话过程会话过程中的进程组共享一个控制终端，该控制终端通常也是创建进程的登录终端

创建守护进程：调用fork终止父进程、调用pid_t setsid(void)使子进程变成新的进程组和会话过程的组长进程，同时与原来的进程组和会话过程脱离。由于会话过程对控制终端具有独占性，子进程会脱离原控制终端的控制，所以可以关闭标准输入输出和错误输出，或者将它们重定向

chdir():改变工作目录,如chdir("/tmp"): umask()：改变文件权限掩码

服务器会保留父进程的循环状态以接受更多并发请求，创建子进程来处理请求而父进程等待子进程结束会影响并发性不等待会使子进程变成僵尸进程 signal(SIGCHLD,SIG_IGN);防止子进程变成僵尸进程

守护进程的输出： void syslog(int priority, char *format, ...); 会写入到/var/log/syslog之中参数: * priority 写入信息的等级和用途 * format 格式字符串，指定信息输出格式、

        管道

向管道读数据时，必须关闭写端pipe[1] 向管道写数据时，必须关闭读端pipe[0]

有名管道

如果管道文件大小 > 写入函数的数据的大小，Linux会保证写入的原子性如果管道文件大小 < 写入函数的数据的大小，将不保证原子性，一旦有空闲区域就写入部分数据，阻塞直到写操作完成

mkfifo(pathname,mode)

使用命名管道时，写数据时必须有进程在读，读进程时必须有进程在写打开时设置阻塞标志后，如果不满足上述要求，进程会阻塞

    信号

sigemptyset清空信号集中所有信号 kill函数，信号全局发送 raise函数，枝江信号发送给进程本身 abort函数，将SIG_ABORT信号发送给进程 sigqueue函数，向进程发送一个可带有附加信息的信号 int sigqueue(pit_t pid, const union sigval val) typedef union sigval{ int sival_int; void *sival_ptr; }sigval_t; 调用sigqueue函数时，sigval_t指定的信息会被复制到sa_sigaction的siginfo_t结构中，信号处理函数可以利用这些信息

atoi可以将路径转换为进程标识符

sigalarm(1)；一秒钟后产生闹钟信号

gettitimer(int which, struct itimerval *value); settitimer(int which, const struct itimerval *value, struct itimerval *ovalue) 参数which ITIMER_REAL:时间到向进程发送SIGALARM信号 ITIMER_VIRTUAL:仅在程序执行时计时，时间到向进程发送SIGVALARM信号 ITIMER_PROF:在进程执行和系统调用时计时，时间到发送SIGPROF信号 value:设定时间 ovalue:上次设定的时间

    信号集

操作函数： int sigempty(set) int sigaddset int sigdelset int sigfillset int sigismember int sigemptyset int sigprocmask 设置信号屏蔽码

    消息队列

打开 msgget(key, msgflg) key为消息队列的键值，通常是一个长整型，可以设置为任何整数，由用户直接设定，也可以调用ftok生成。如果设为IPC_PRIVATE，表示总是创建新的消息队列 msgflg建立消息队列并设定存取权限， IPC_CREAT | 0666 创建一个666消息队列，类似文件 IPC_EXCL 只有在指定消息队列不存在时，才创建新的消息队列返回值：成功：消息队列标识符失败：-1 key_t flock(const char *pathname, int proj_id) pathname:进程有存取权限的一个路径 proj_id：指定的键值 key_t ftok(pathname) 将地址转换为键值 msgctl(msqid, cmd, struct msqid_ds *buf) smqid消息队列的标识符 IPC_STAT:获取状态，返回信息在buf指向的msqid_ds结构中 IPC_SET:设置属性，属性存储在buf指向的msqid_ds结构中 IPC_RMID:删除消息队列，同时清除其中的所有消息消息队列不会自动清理查看系统中的消息队列 ipcs -q

读写消息队列 int msgsnd(int msqid， struct msgbuf *msgp, int msgsz, int msgflg) msqid消息队列标志符写入信息在msgp指向的msgbuf结构中大小由msgsz决定 msgflg控制空间不足时的执行动作 struct msgbuf { long mtype; /消息的类型/ char mtext[]; /消息的内容/ } msgrcv(int msqid， struct msgbuf *msgp, int msgsz, long msgtyp, int msgflg) msgtyp为请求读取的数据类型 msgtyp=0 返回消息队列的第一个消息 msgtyp>0 返回该类型的第一个消息 msgtyp<0 在类型值<=msgtyp的所有消息中，返回类型值最小的一个

即使没有读文件，消息队列也能顺利写入可以通过判断消息类型，只接收特定进程的消息

        信号量

大于或等于0时，表示可供并发进程使用的资源数；小于0时表示正等待使用资源的进程数如果进程需要访问某共享资源操作： * 测试控制该信号量 * 如果大于0，访问该资源，并将信号量减一 * 如果小于或等于0，进入休眠状态，直至信号量大于0被唤醒 * 进程不再使用共享资源时，将信号量加一，此时如果有等待的进程，将它们唤醒函数 semget(key, nsems, semflg) 键值自设，nsems元素个数，通常1，semflg创建信号量并设权限 semctl(semid, semnum, cmd, arg) semid信号量标识符 semnum元素个数 cmd控制命令，信号量的创建或删除 arg操作值 union semun{ int val; /信号量的值/ struct semid_ds *buf; unsigned short int *array; /所有信号量的值/ struct seminfo *__buf; } semop(int semid, struct sembuf *sops, unsigned short nsops)操作信号量 sops为指向信号量操作数组的指针 nsops为数组中元素个数

    struct sembuf{
        short int sem_num; 要操作信号量在信号量集中的序号
        short int sem_op;  执行的操作
            负数：本进程希望使用该资源，将该负数加到相应信号量上
                    如果相加结果为负数，进程阻塞，一直等待变为0
        short int sem_flg; 
    }

ipcs -s 显示创建的信号量集

        共享内存

创建打开共享内存 shmget(get, size, shmflg) size共享内存的大小，创建时必须指定 shmflg创建共享内存并获取权限返回值：成功：共享内存标识符失败：-1 shmctl(int shmid, int cmd, struct shmid_d *buf) 控制共享内存，类似msgctl

进程不能直接访问共享内存，需要调用 shmat(int shm_id, void *shm_addr, int shmflg) 映射到进程的地址空间 shmdt(void *shmaddr) 脱离进程的地址空间

    多线程

#include <pthread.h> 创建新线程 int pthread_create(pthread_t *thread, const pthread_attr_t *attr, void *(*start_routine) (void *), void *arg) * thread : 定义的线程对象，从中获取线程标识符 * attr : 传入线程的属性结构体，默认则NULL * void * : 新线程执行（void *）中的代码 * arg : 创给新线程的参数合并线程(减少分别访问线程的资源浪费) int pthread_join(pthread_t __th,void **__thread_return) 函数一直阻塞到被等待线程结束，当它返回时，被等待线程的全部资源会被收回 __th 为被等待线程的标识符， return 存储被等待线程的返回值

终止线程本线程调用pthread_exit(void *__retval) 其它线程调用pthread_cancel(pthread_t __th) pthread_setcanceltype()，设置被其他线程取消的方式是否可以被取消

线程属性 int pthread_attr_init(pthread_attr_t *__attr) typedef union { char size[__SIZEOF_PTHREAD_ATTR_T]; long int __align; }pthread_attr_t;

设置线程分离状态 pthread_attr_setdetachstate,默认非分离线程有时新线程执行过快，在create函数返回之前结束，引发错误可以加入pthread_cond_timewait或sleep函数,延长时间

线程的优先级 #include <bits/sched.h> struct sched_param { int __sched_param; }; pthread_attr_getschedparam pthread_attr_setschedparam 一般先读取->修改->回填

线程同步为了解决资源竞争三种方法

互斥量
- 使用
  - int pthread_mutex_init(pthread_mutex_t *__mutex, __const pthread_mutexattr_t * __mutexattr)
    - __mutex : 互斥信号量指针
    - __mutexattr : 属性结构
- 释放
  - pthread_mutex_destroy(pthread_mutex_t *__mutex)
- 加解锁
  - pthread_mutex_lock(pthread_mutex_t *__mutex)
  - pthread_mutex_unlock(pthread_mutex_t *__mutex)
信号量
条件变量
- pthread_cond_init(pthread_mutex_t *__cond, __const pthread_mutexattr_t * __condattr
- pthread_cond_destroy(pthread_mutex_t *__cond)
- pthread_cond_wait
- pthread_cond_timedwait
```
      网络编程
```

OSI(Open System Interconnection)开放系统互联模型层级（递增）功能物理层比特流传输（不管含义）数据链路层介质访问、链路管理（约定含义）网络层寻址和路由选择传输层建立端到端连接（可检测丢失的包，重传请求、整理收到的包）会话层建立、维护和管理主机间的会话表示层提供应用程序间通信（变换传输的数据、相互理解、数据压缩、加密、格式转换）应用层处理数据格式、数据加密（应用层与应用程序界面沟通）

封装Encapsulation 分用Demultiplexing

众所周知端口：0~~1023由IANA分配和控制注册端口：1024~~49151不受IANA控制，但由IANA登记并提供使用清单动态或私有端口：49152~65535，与IANA无关

IP->MAC 地址解析协议（ARP） MAC->IP 反向地址解析协议（PARP）（无盘工作站向PARP服务器询问自己的IP地址）

ICMP协议用于传递差错信息、时间、回显、网络信息等控制数据 ping即封装成ICMP协议来实现

    Socket编程

Socket编程步骤

1.创建套接字，socket函数 2.初始化地址 struct sockaddr_in sevaddr;结构体填充 bind函数绑定 socket函数返回的套接字描述符和 IP地址 3.监听套接字listen 属被动套接字，可以被连接 (套接字描述符，队列最大值（已完成队列+未完成队列（三次握手未成功的））) 4.接受连接accept 属主动套接字，用来通信，不能用来监听

TCP是基于流的协议，需要处理黏包问题（数据之间通过协议分割）基于字节流传输，只维护发送出去多少，确认了多少，并不维护消息边界

服务器端套接字在绑定时确定客户端在连接成功时确定

inet_ntoa 转换成点分十进制 xxx.xxx.xxx.xxx

REUSEADDR：设置setsockopt(listenfd, SOL_SOCKET, SO_REUSEADDR, &(1), sizeof(1)); 可以使服务器端断开后进入WAIT状态时，仍然可以重启

网络字节序：大端模式 只要是网络发送整数，就需要统一字节序 需要转化成主机字节序 ntohl()函数

聊天程序：一个进程用来接收，一个子进程用来输入通过信号来通知另一个进程来关闭

recv/send函数，只能读取socket描述符可以用MSG_PEEK读取时不清除socket缓冲区内的内容

获取名称和IP信息的函数 getsockname、getpeername gethostname、gethostbyname、gethostbyaddr

僵尸进程

通过忽略SIG_CHLD信号 signal(SIG_CHLD, SIG_IGN)
通过捕捉SIG_CHLD信号，进行处理signal(SIG_CHLD, chld_handler)

两边同时关闭，会进入CLOSING状态

往一个已经接受FIN的套接字中写是允许的，FIN仅仅代表对方不再发送数据此时如果再向对方发送数据，会导致TCP重置，会收到RST信号，再write会产生SIGPIPE 信号，这个信号通常可以忽略，默认终止进程，也能 signal(SIGPIPE, SIG_IGN)

可以把socket看做一条全双工管道，而一条读管道的进程已经被关闭，此时再写会产生RST，第二次写会报SIGPIPE的管道错误信号

当socket的引用数减为0时，才向对方发送FIN段 shutdown可以之关闭单一方向或全关闭，并且确保对方接收到

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

FilesExpand file tree

Note for Linux Programming.md

Latest commit

History

Note for Linux Programming.md

File metadata and controls