404频道

学习笔记

问题描述

无线wifi的essid支持英文和中文,中文的编码在802.11协议并没有规定,对于802.11协议而言仅将essid看作是二进制。而中文又存在多种编码方式,最常见的就是GB18030(我这里直接用GB18030代替了GB系列的字符集)和UTF-8了。

iwlist程序通过命令iwlist wlan0 scanning可以在终端上正常显示UTF-8编码的essid,对于其他编码的中文仍然是乱码,这也就非常容易理解了。因为具体的essid能否将中文正常显示在终端屏幕上跟essid的编码和当前终端环境的编码是否能够匹配有关,如果essid的编码和当前终端环境的编码均为UTF-8,则essid可以在屏幕上正常显示。如果当前网络中的可以搜索到的essid即包含了GB18030编码又包含了UTF-8编码,则打印在终端上的essid必然会有乱码的情况出现。

airodump-ng程序问题

对于airodump-ng程序而言,即时是essid的编码和终端编码一致也会出现某些中文字符乱码的问题,这一点比较奇怪。比如“免费”中的“免”字是乱码,“费”却能正常显示。通过这一现象有理由怀疑airodump-ng对essid做了某些处理。

经过查看源码发现,在airodump-ng.c文件中存在三处如下类似代码,作用为将essid中的ascii值在(126,160)之间的转换为”.”。看来airodump-ng程序并没有考虑到中文的情况,仅将ascii中无法显示的字符做了转换。将程序中的三处代码注释后就可以正常显示了。具体三处代码可以通过搜索’.’来查找。

1
2
3
4
5
6
7
8
9
for( i = 0; i < n; i++ )
{
c = p[2 + i];
if( c == 0 || ( c > 126 && c < 160 ) )
{
c = '.'; //could also check ||(c>0 && c<32)
}
st_cur->probes[st_cur->probe_index][i] = c;
}

NetworkManager

通过实践发现,GNOME和KDE桌面下的查看无线网络连接的ssid是可以正常显示的,即可以正常显示GB18030,又可以正常显示UTF-8编码的essid。则可以推测,在桌面环境下的搜索网络的程序肯定对编码做了某些处理,顺着这个思路,就可以查找GNOME或KDE的代码了。

在GNOME的源码中看到了network-manager-applet,该程序即为桌面上查看无线网络连接的小控件。在applet-device-wifi.c文件中看到了如下代码,其中的nm_utils_ssid_to_utf8函数即为将其他编码转换为UTF-8编码的函数。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
static char *
get_ssid_utf8 (NMAccessPoint *ap)
{
char *ssid_utf8 = NULL;
const GByteArray *ssid;

if (ap) {
ssid = nm_access_point_get_ssid (ap);
if (ssid)
ssid_utf8 = nm_utils_ssid_to_utf8 (ssid);
}
if (!ssid_utf8)
ssid_utf8 = g_strdup (_("(none)"));

return ssid_utf8;
}

nm_utils_ssid_to_utf8函数定义在NetworkManager工程中的nm-utils.c文件中。该函数的代码如下,该函数具体功能可以查看代码中的注释,已经非常详细了。其中以g_开头的函数是glib库中的函数。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
char *
nm_utils_ssid_to_utf8 (const GByteArray *ssid)
{
char *converted = NULL;
char *lang, *e1 = NULL, *e2 = NULL, *e3 = NULL;

g_return_val_if_fail (ssid != NULL, NULL);

if (g_utf8_validate ((const gchar *) ssid->data, ssid->len, NULL))
return g_strndup ((const gchar *) ssid->data, ssid->len);

/* LANG may be a good encoding hint */
g_get_charset ((const char **)(&e1));
if ((lang = getenv ("LANG"))) {
char * dot;

lang = g_ascii_strdown (lang, -1);
if ((dot = strchr (lang, '.')))
*dot = '\0';

get_encodings_for_lang (lang, &e1, &e2, &e3);
g_free (lang);
}

converted = g_convert ((const gchar *) ssid->data, ssid->len, "UTF-8", e1, NULL, NULL, NULL);
if (!converted && e2)
converted = g_convert ((const gchar *) ssid->data, ssid->len, "UTF-8", e2, NULL, NULL, NULL);

if (!converted && e3)
converted = g_convert ((const gchar *) ssid->data, ssid->len, "UTF-8", e3, NULL, NULL, NULL);

if (!converted) {
converted = g_convert_with_fallback ((const gchar *) ssid->data, ssid->len,
"UTF-8", e1, "?", NULL, NULL, NULL);
}

return converted;
}

nm_utils_ssid_to_utf8该函数位于libnm-util.so.1动态库中,可通过nm -D /usr/lib64/libnm-util.so.1 | grep nm_utils_ssid_to_utf8命令查看导出表中存在该函数。但是系统中并不存在该函数的头文件libnm-util.h,给该库的调用增加了不少难度。可以通过将相关头文件引入到该工程编译的方式来完成,但是可能会牵涉到的头文件比较多,比较繁琐。

我这里直接采用了将NetworkManager中相关代码抓取出来的思路,并将其封装成类的形式以方便调用。具体代码可以参照demo中的例子。

glib

glib是GTK底层调用的核心库,跟glibc是没有关系的,虽然名字中仅差一个字母。为了调用该库需要在编译的时候添加*pkg-config --cflags --libs glib-2.0*信息,以引入需要的头文件和要链接的库。

相关下载

文中用到的软件源码和程序demo

引用

题目一 Single Number

Given an array of integers, every element appears twice except for one. Find that single one.
Note:
Your algorithm should have a linear runtime complexity. Could you implement it without using extra memory?

题目二 Single Number II

Given an array of integers, every element appears three times except for one. Find that single one.
Note:
Your algorithm should have a linear runtime complexity. Could you implement it without using extra memory?

题目一分析及解答

针对题目一,一看就能看出是考察异或操作的特点,并迅速写出了解答方法。

1
2
3
4
5
6
7
8
9
10
11
class Solution {
public:
int singleNumber(int A[], int n) {
int result = 0;
for (int i = 0; i < n; i++)
{
result ^= A[i];
}
return result;
}
};

题目二分析及解答

要想实现时间复杂度为O(n),空间复杂度为O(1)的算法,还是跟题目一一样需要充分利用位操作特性,但是并没有直接可用的位操作特性可以完成,于是想到肯定是各种位操作的组合操作,但是并没有继续向下想到具体的算法。本质上该题目就是模拟一个三进制的操作,当一个位的最大值为2,当为3时直接清0。

参照网上的算法,利用一个int类型的数组来模拟一个三进制数,每个int值的最大值为3,当然这样存在一定空间上的浪费。算法需要将A中的每个值通过移位运算获取到该位的状态,并将值添加到用来模拟三进制的int数组中相应的位置,最后将模拟三进制int数组中的值为3的更改为0。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
class Solution {
public:
int singleNumber(int A[], int n) {
int count[32] = {0};
int result = 0;
for (int i = 0; i < 32; i++) {
for (int j = 0; j < n; j++{
if ((A[j] >> i) & 1) {
count[i]++;
}
}
result |= ((count[i] % 3) << i);
}
return result;
}
};

另外,还有上述算法的改进算法,更为节省空间,效率更高,但是确实不容易理解和记忆,属于下次仍然无法记忆的算法类型。这里仅提供代码,不再给出解释,自己领悟。

1
2
3
4
5
6
7
8
9
10
11
12
int singleNumber(int A[], int n) {
int ones = 0, twos = 0, threes = 0;
for (int i = 0; i < n; i++) {
twos |= ones & A[i];
ones ^= A[i];// 异或3次 和 异或 1次的结果是一样的
//对于ones 和 twos 把出现了3次的位置设置为0 (取反之后1的位置为0)
threes = ones & twos;
ones &= ~threes;
twos &= ~threes;
}
return ones;
}

前段时间参加了牛客网的答题活动,共两套试题,每套题目3个算法题,我只做了每套题的前两道。最近想查看之前做的题目的答案,却发现非常不方便,特此将我做过的4道题目记录一下,算法的思路就不再解释了。

题目一 奇数位上都是奇数或者偶数位上都是偶数

给定一个长度不小于2的数组arr。 写一个函数调整arr,使arr中要么所有的偶数位上都是偶数,要么所有的奇数位上都是奇数上。 要求:如果数组长度为N,时间复杂度请达到O(N),额外空间复杂度请达到O(1),下标0,2,4,6…算作偶数位,下标1,3,5,7…算作奇数位,例如[1,2,3,4]调整为[2,1,4,3]即可。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
class Solution {
public:
void oddInOddEvenInEven(vector<int>& arr, int len) {
int odd = 1;
int even = 0;
while (odd < len && even < len)
{
if (arr[odd] % 2 == 0)
{
while (arr[even] % 2 == 0)
{
even += 2;
}
if (even < len)
{
int tmp = arr[even];
arr[even] = arr[odd];
arr[odd] = tmp;
}
else
{
break;
}
}
else
{
odd += 2;
}
}
}
};

题目二 求正数数组的最小不可组成和

给定一个全是正数的数组arr,定义一下arr的最小不可组成和的概念: 1,arr的所有非空子集中,把每个子集内的所有元素加起来会出现很多的值,其中最小的记为min,最大的记为max; 2,在区间[min,max]上,如果有一些正数不可以被arr某一个子集相加得到,那么这些正数中最小的那个,就是arr的最小不可组成和; 3,在区间[min,max]上,如果所有的数都可以被arr的某一个子集相加得到,那么max+1是arr的最小不可组成和; 举例: arr = {3,2,5} arr的min为2,max为10,在区间[2,10]上,4是不能被任何一个子集相加得到的值中最小的,所以4是arr的最小不可组成和; arr = {3,2,4} arr的min为2,max为9,在区间[2,9]上,8是不能被任何一个子集相加得到的值中最小的,所以8是arr的最小不可组成和; arr = {3,1,2} arr的min为1,max为6,在区间[2,6]上,任何数都可以被某一个子集相加得到,所以7是arr的最小不可组成和; 请写函数返回arr的最小不可组成和。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
class Solution {
public:
int getFirstUnFormedNum(vector<int>& arr, int len) {
set<int> res;
for (int i=0; i<len; i++)
{
set<int> tmp = res;
for (set<int>::iterator iter = res.begin(); iter != res.end(); iter++)
{
tmp.insert(*iter + arr[i]);
}
res = tmp;
res.insert(arr[i]);
}

set<int>::iterator iter = res.begin();
int before = *iter;
iter++;
for (; iter != res.end(); iter++)
{
if (*iter - before > 1)
{
return before + 1;
}
before = *iter;
}
return before + 1;
}
};

题目三 最大的LeftMax与rightMax之差绝对值

给定一个长度为N的整型数组arr,可以划分成左右两个部分: 左部分arr[0..K],右部分arr[K+1..arr.length-1],K可以取值的范围是[0,arr.length-2] 求这么多划分方案中,左部分中的最大值减去右部分最大值的绝对值,最大是多少? 例如: [2,7,3,1,1] 当左部分为[2,7],右部分为[3,1,1]时,左部分中的最大值减去右部分最大值的绝对值为4; 当左部分为[2,7,3],右部分为[1,1]时,左部分中的最大值减去右部分最大值的绝对值为6; 最后返回的结果为6。 注意:如果数组的长度为N,请尽量做到时间复杂度O(N),额外空间复杂度O(1)

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
class Solution {
public:
int getMaxABSLeftAndRight(vector<int> vec, int len) {
if (len == 0)
{
return 0;
}

// find the max in array
int max = vec[0];
for (int i=1; i<(int)vec.size(); i++)
{
if (vec[i] > max)
{
max = vec[i];
}
}

// compare the head and tail in array
if (vec[0] < vec[len - 1])
{
return max - vec[0];
}
return max - vec[len - 1];
}
};

题目四 按照左右半区的方式重新组合单链表

给定一个单链表的头部节点head,链表长度为N。 如果N为偶数,那么前N/2个节点算作左半区,后N/2个节点算作右半区; 如果N为奇数,那么前N/2个节点算作左半区,后N/2+1个节点算作右半区; 左半区从左到右依次记为L1->L2->…,右半区从左到右依次记为R1->R2->…。请将单链表调整成L1->R1->L2->R2->…的样子。 例如: 1->2->3->4 调整后:1->3->2->4 1->2->3->4->5 调整后:1->3->2->4->5 要求:如果链表长度为N,时间复杂度请达到O(N),额外空间复杂度请达到O(1)

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
class Solution {
public:
void relocateList(struct ListNode* head) {
if (head == NULL || head->next == NULL)
{
return ;
}

// use one loop, find the right head
ListNode *right_head = head;
ListNode *node = head;
while (node != NULL)
{
if (node->next == NULL)
{
break;
}
if (node->next->next == NULL)
{
right_head = right_head->next;
break;
}
right_head = right_head->next;
node = node->next->next;
}

ListNode *left_node = head;
ListNode *right_node = right_head;
while (left_node->next != right_head)
{
ListNode *tmp = left_node->next;
left_node->next = right_node;
right_node = right_node->next;
left_node->next->next = tmp;
left_node = left_node->next->next;
}

left_node->next = right_node;
}
};

题目

Given an array of size n, find the majority element. The majority element is the element that appears more than ⌊ n/2 ⌋ times.
You may assume that the array is non-empty and the majority element always exist in the array.

分析

本题是一道非常简单的题目,但我能想到的思路有限,仅能想到排序法和哈希法两种算法,在Solution中提供了另外几种方法,这是非常值得我学习和思考的。本文仅将网站的思路拿过来,可以直接看该问题的Solution

解答

暴力枚举法

最原始的解决办法,逐个元素比较是否为该数组中的最多元素,只要满足条件即可终止。时间复杂度为O(n^2)。

哈希表法

将数组中的元素遍历一遍,并将数组中元素的个数保存到哈希中。然后遍历哈希,从哈希中找到最多元素。时间复杂度O(n),但需要占用一定的空间。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
int majorityElement(vector<int> &num) {
std::map<int, int> result_map;
for (vector<int>::iterator iter = num.begin(); iter != num.end(); iter++)
{
if (result_map.find(*iter) == result_map.end())
{
result_map.insert(map<int, int>::value_type(*iter, 1));
}
else
{
result_map[*iter]++;
}
}

int max_count = 0;
int result;
for (std::map<int, int>::iterator iter = result_map.begin(); iter != result_map.end(); iter++)
{
if (iter->second > max_count)
{
result = iter->first;
max_count = iter->second;
}
}
return result;
}

排序法

直接对元素进行排序,排序后元素的中间元素即为要求的最多元素。时间复杂度为O(nlogn)。

1
2
3
4
int majorityElementSort(vector<int> &num) {
sort(num.begin(), num.end());
return num[num.size() / 2];
}

随机抽取法

随机从数组中抽取元素,然后遍历数组判断该元素是否为最多元素。该算法利用了最多元素被随机抽取的概率最大的特点,但该算法效率的随机性较大,最好时间复杂度为O(n),最坏情况下一直随机不到最多元素。

二分法

将数组均分为两份,分别求出两个数组中的最多元素A和B,则整个数组中的最多元素必然在两个子数组的最多元素A和B中,这一点可以通过举例子的方式来证明,但是仅凭感觉不太容易得出该结论。如果A==B,则结果就是A。如果A!=B,则分别求出A和B在这个数组中的元素个数。时间复杂度接近O(nlogn)。

其他

还有一些比较不容易想到的算法,这里就不列举了。至少我看过一次之后,下次这些算法仍然是记不住的。

asleap是一个开源的vpn破解工具,最近查看了asleap的源码,该项目地址。本文的重点是对其中的带索引的字典文件的产生过程进行介绍,产生带索引的字典文件并不复杂,但是要想用简洁易懂的语言将该问题描述明白却不容易。

asleap破解vpn的机制是通过字典文件暴力破解的方式,该字典文件有dat数据文件和idx索引文件两个文件组成,两个文件均为二进制格式。asleap工程中自带了genkey程序,可以将文本的字典文件转换为asleap程序需要的带索引的字典文件。

本文以字典文件为以下内容讲解:

1
2
3
turquoise
da
test

读取字典文件并产生md4值

md4编码占16个字节,三个字典进行md4编码后的结果分别为:

1
2
3
18 07 33 43 f6 30 b5 f8 2c 38 c0 34 37 f2 81 6b
01 19 a3 80 94 40 60 3c 57 39 5e 73 f3 60 95 98
0c b6 94 88 05 f7 97 bf 2a 82 80 79 73 b8 95 37

将字典信息写入到临时文件

为了能够对最终生成的dat文件中的内容进行排序和便于索引,程序生成了256个临时文件,文件名格式为从genk-bucket-00.tmp到genk-bucket-ff.tmp。程序根据md4编码中的第14位将字典对应的信息分别写入到临时文件中,一个字典写入到临时文件的内容如下,如果一个临时文件中存在多个字典则依次存放:

1
2
3
4
5
struct hashpass_rec {
unsigned char rec_size; // 一个字典占用文件的大小,包括该变量+字典+字典对应的md4值共占用的字节数
char *password; // 字典
unsigned char hash[16]; // 字典对应的md4值
} __attribute__ ((packed));

本例子中turquoise对应结构体会写入到genk-bucket-81.tmp中,da和test对应结构体会依次写入到genk-bucket-95.tmp中。

读取临时文件并写入到dat数据文件中

最终dat文件中的数据内容为hashpass_rec的有序集合,排序的原则是按照md4的第14和15两个字节。依次读取256个临时文件中的hashpass_rec可以保证dat文件中的数据内容是按照第14字节排序的,但是不能够保证是按照第15个字节排序的。为了保证最终dat文件中的数据内容是按照第14和15字节有序的,在将一个临时文件中的内容写入到dat文件中前需要对该临时文件中的hashpass_rec结果按照hash变量的第15字节进行排序,直接使用C语言中的qsort进行排序。

该例子中da和test位于同一个临时文件中,需要根据hash变量的第15字节排序的结果为test、da,最终写入到dat文件中的排序结果为turquoise、test、da。

根据dat数据文件产生idx索引文件

idx索引文件中存放的是多个hashpassidx_rec结果,最多有256*256项,其结构定义如下:

1
2
3
4
5
struct hashpassidx_rec {
unsigned char hashkey[2]; // 对应md4编码的第14和15字节
off_t offset; // 第一个匹配的hashpass_rec结构在dat文件中的偏移,占用4个字节
unsigned long long int numrec; // dat文件中共有多少个匹配的hashpass_rec结果
} __attribute__ ((packed)); // 字节对齐,需要填充4个字节

最终完成的dat文件和idx文件的指向如下图所示:

最终完成的dat文件和idx文件的指向

bug

genkeys.c文件中在读取字典文件时存在bug,在文件的207行将内容更改为:

1
2
3
4
5
6
while (!feof(inputfl)) {
memset(password, 0, MAX_NT_PASSWORD + 1);
fgets(password, MAX_NT_PASSWORD+1, inputfl);
if (strlen(password) == 0) {
continue;
}

相关下载

字典文件等相关文件下载

本文对我编写的常用的排序算法进行整理和总结,方便用时进行查阅和参考。

快速排序

快速排序是实际应用中的最好选择,采用了分治法的思想。通过一趟排序将待排序记录分割成独立的两部分,其中一部分的关键字均比另外一部分的小,分别对这两部分记录进行排序,已达到整个有序。

是否稳定:不稳定

时间复杂度:O(nlogn)

空间复杂度:O(logn),需要栈来实现递归用

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
#include <stdio.h>
#include <vector>
#include <iostream>

int partition(std::vector<int> &numbers, int low, int high)
{
int pivotkey = numbers[low];
while (low < high)
{
while (low < high && numbers[high] >= pivotkey)
{
--high;
}
numbers[low] = numbers[high];
while (low < high && numbers[low] <= pivotkey)
{
++low;
}
numbers[high] = numbers[low];
numbers[low] = pivotkey;
}
return low;
}


void quick_sort(std::vector<int> &numbers, int low, int high)
{
if (low < high)
{
int pivotloc = partition(numbers, low, high);
quick_sort(numbers, low, pivotloc - 1);
quick_sort(numbers, pivotloc + 1, high);
}
}

void quick_sort(std::vector<int> &numbers)
{
quick_sort(numbers, 0, numbers.size() - 1);
}

int main()
{
std::vector<int> numbers = {49, 38, 65, 97, 76, 13, 27, 49};
quick_sort(numbers);
for (int i=0; i<numbers.size(); i++)
{
printf("%d\t", numbers[i]);
}
printf("\n");
}

归并排序

将两个或两个以上的有序表组合成一个新的有序表。合并两个有序表的方法为:比较两个有序表中第一个数,谁小先取谁。继续进行比较,只要有一个有序表为空,直接将另一个有序表取出即可。

是否稳定:稳定

时间复杂度:O(nlogn)

空间复杂度:O(n) (当使用顺序存储时,为了能够实现两个有序表之间的合并),或O(1)(当使用链式存储的时候,不再需要临时的空间来存储排序的结果)

顺序存储代码

以下为采用顺序存储结构的代码:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
/**
* 归并排序使用递归算法的效率比较低,具体应用中会采用非递归算法代替
*/
void merge(std::vector<int> &numbers, std::vector<int> &extra, int low, int high, int middle)
{
int i = low, j = middle+1, k = low;
for (; i<=middle && j<=high; k++)
{
if (numbers[i] <= numbers[j])
{
extra[k] = numbers[i];
i++;
}
else
{
extra[k] = numbers[j];
j++;
}
}

while (i <= middle)
{
extra[k++] = numbers[i++];
}

while (j <= middle)
{
extra[k++] = numbers[j++];
}

for (int m = low; m <= high; m++)
{
numbers[m] = extra[m];
}
}


void merge_sort(std::vector<int> &numbers, std::vector<int> &extra, int low, int high)
{
if (low == high)
{
return ;
}
int middle = (low + high) / 2;
merge_sort(numbers, extra, low, middle);
merge_sort(numbers, extra, middle + 1, high);
merge(numbers, extra, low, high, middle);
}

void merge_sort(std::vector<int> &numbers)
{
// 申请额外的存储空间来用于排序处理
std::vector<int> extra = numbers;
merge_sort(numbers, extra, 0, numbers.size() - 1);
}

int main()
{
std::vector<int> numbers = {49, 38, 65, 97, 76, 13, 27, 49};
merge_sort(numbers);

for (int i=0; i<numbers.size(); i++)
{
printf("%d\t", numbers[i]);
}
printf("\n");
}

链式存储代码

以下为采用链式存储结构的代码,本答案为我在LeetCode上的Sort List 题目的答案,源码放在我的Github上

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
struct ListNode {
int val;
ListNode *next;
ListNode(int x) : val(x), next(NULL) {}
};

/**
* 使用归并排序方法,核心思想为将数组拆分为两半,分别对两半进行排序,排序完成后再进行一次排序,排序算法就可以采用插入排序的方式。
* 对两半排序的算法仍然采用归并排序算法,即问题为递归问题
* 在使用线性存储结果的归并排序算法中,会使用额外的空间来存储临时结果,空间复杂度为O(n),而在链式存储中,空间复杂度为O(1)
* 归并排序的时间复杂度为O(nlogn)
* 如果存储结构为双向链表,可以使用快速排序
*/
ListNode* sortList(ListNode* head)
{
if (head == nullptr || head->next == nullptr)
{
return head;
}

if (head->next->next == nullptr)
{
// 仅有两个元素,对两个元素进行排序后直接返回
if (head->val < head->next->val)
{
return head;
}
else
{
ListNode *tmp = head->next;
tmp->next = head;
tmp->next->next = nullptr;
return tmp;
}
}

// 为了找到中间节点,这里采用快慢指针的方式,否则需要使用先遍历一次取长度,然后找到中间位置的两次遍历方式
ListNode *fast = head;
ListNode *slow = head;
ListNode *slow_prev = nullptr;
while (fast != nullptr && fast->next != nullptr)
{
fast = fast->next->next;
slow_prev = slow;
slow = slow->next;
}
fast = slow_prev->next;
slow_prev->next = nullptr;

// 分别对两段链表进行排序
slow = sortList(head);
fast = sortList(fast);

// 对两段链表进行合并
ListNode *node = nullptr, *result = nullptr;
while (slow != nullptr && fast != nullptr)
{
if (slow->val < fast->val)
{
if (result != nullptr)
{
node->next = slow;
node = node->next;
}
else
{
node = slow;
result = slow;
}
slow = slow->next;
}
else
{
if (result != nullptr)
{
node->next = fast;
node = node->next;
}
else
{
node = fast;
result = fast;
}
fast = fast->next;
}
}
if (slow != nullptr)
{
node->next = slow;
}

if (fast != nullptr)
{
node->next = fast;
}

return result;
}

直接插入排序

该排序算法的时间复杂度为O(n^2),算法复杂度过高。分为顺序存储和链式存储两种算法,其中顺序存储每比较一个元素是从该元素往前比较的,而链式存储是从链头开始比较的,这点有所不同,造成不同的是由存储结构决定的。

顺序存储代码

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
#include <stdio.h>
#include <iostream>
#include <algorithm>
#include <vector>
using namespace std;

void insertion_sort(std::vector<int> &numbers)
{
if (numbers.size() <= 1)
{
return;
}
for (int i = 1; i < numbers.size(); i++)
{
for (int j = i; j > 0; j--)
{
if (numbers[j] < numbers[j - 1])
{
swap(numbers[j], numbers[j - 1]);
}
else
{
break;
}
}
}
}

int main()
{
int a[] = { 49, 38, 65, 97, 76, 13, 27, 49 };
vector<int> numbers(a, a + sizeof(a) / sizeof(int));
insertion_sort(numbers);
for (int i = 0; i<numbers.size(); i++)
{
printf("%d\t", numbers[i]);
}
return 0;
}

链式存储代码

以下代码为LeetCode上的链式存储的情况时的直接插入排序算法的代码。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
ListNode* insertionSortList(ListNode* head) 
{
if (head == NULL)
{
return NULL;
}

// 初始化
ListNode *node = head->next;
ListNode *new_head = head;
new_head->next = NULL;
while (node != NULL)
{
ListNode *node_next = node->next; // 先将当前遍历的下一个节点保存

// 将当前节点插入到新链表中
ListNode *new_node_tmp = new_head;
if (node->val < new_node_tmp->val)
{
// 当前节点插入新链表的第一个位置
node->next = new_head;
new_head = node;
}
else
{
// 将当前节点插入到中间
while (new_node_tmp->next != NULL)
{
if (node->val < new_node_tmp->next->val)
{
node->next = new_node_tmp->next;
new_node_tmp->next = node;
break;
}
new_node_tmp = new_node_tmp->next;
}

// 将该节点插入到最后位置
if (new_node_tmp->next == NULL)
{
new_node_tmp->next = node;
node->next = NULL;
}
}

// 开始遍历当前节点的下一个节点
node = node_next;
}
return new_head;
}

我的年总结是依照农历的,因为在我心中春节才算是一年的真正开始,因为只有春节的时候才能找到年的滋味,年的感觉,才能称之为年,阳历的年只能称之为year。

2014年又在不经意间过去了,很多地方跟2013年一样是平淡,工作和学习仍然是生活的主旋律,闲暇时间抽个时间玩玩dota放松一下,周末偶尔爬个小山锻炼下身体,对我的人生中算是比较重要的一年。

学习

2014年经历了结婚、毕业答辩和考驾照几件占用时间的事情,留给我业余时间用来学习的就少之又少了。结婚占用两个月时间,毕业论文占用了我两个月时间,考驾照占用了多个周末,工作出差占用了我一个月时间,留给我能够独立学习的晚上也就6个月时间。

开始的时候小看了硕士论文,以为很简单一事情,搞过这么多软件项目还搞不了一篇硕士论文。一直以来我看不起软件工程类论文,就一项目套个模板一介绍就是一篇论文,于是我选择了写一篇理论研究类论文,没有高大上的理论,而是在公司实践中真正用到的,《将Windows平台的C/C++程序向Linux平台移植的技术研究》,选择论文的时候我已经看到了该题目不太适合作为硕士论文,当我还是毅然作为了我的硕士论文题目,不得不说这是我今年的一大败笔。第一篇论文失败后,我重新走起了保守路线,以之前熟悉的系统为主线,辅以各种文档的拼凑,完成了一篇我曾经嗤之以项目类硕士论文,并顺利通过答辩。对于我这样的新手而言,写论文是一件漫长又痛苦的过程,占用了我大量的宝贵时间。

一直以来对嵌入式linux方向比较好奇,今年终于抵不住好奇,买了个2140开发板自己捣鼓了一段时间,由于时间关系虽然到现在也没有入门,多多少少对嵌入式已经有所了解。

感谢我的另一半,给我提供了足够的时间来干我想干的事情。

书籍

比起2013年,今年读过的书籍少了一些。

  • 《Linux/Unix系统编程手册》
  • 《编程珠玑》
  • 《LINUX设备驱动程序》(部分章节)
  • 《LINUX内核设计与实现》(大部分章节)
  • 《深度探索linux操作系统》
  • 《剑指Office》
  • 《大规模C++程序设计》
  • 《程序员的自我修养》(第二遍)
  • 《文明之光》
  • 《程序员健康指南》
  • 《黄金时代》
  • 《一只特立独行的猪》
  • 《算法导论》(部分章节)

工作

已经比较熟练掌握了公司产品的大部分技术,工作起来算是得心应手,但是却少了许多挑战,是时候该接收大挑战的了。工作的职位从后台组长到研发部副经理到研发部经理,开始了工作的转型,这是我不期望这么早来到的,我自认为技术的成长空间还很大,不想过早的接触管理岗位。

五月份的出差成为了我心中抹不去的痛,莫名其妙接受了任务,匆忙出差,不过坑才刚刚开始。要维护的是一个我没见过界面的产品,不过基本原理我是清楚的。产品有很多bug,这我可以理解,要不然也不会让我出差了,但要命的是我没有产品的代码,我接受的任务仅是去应付客户、发现bug后反馈、更新产品、施工,这明白着是市场+测试+维护的话,跟我半毛钱关系都没有。以上这些都无所谓,要知道我可不是一个顽固不化的程序员,但工作地点竟然是机房,而且机房是我见过最脏最乱的机房,我就站在一排机柜的后面的一堆烂纸箱子上吹着空调的冷风和机器的热风办公,时而蹲着,时而站着,时而坐着,时而将衣领撩起保暖,时而浑身打颤,以至于到现在我留下了膝盖隐隐作痛的毛病。而且系统bug不断,一连在不吃晚饭的情况下加班到大半夜好多次,而我竟然坚持下来了。原本三五天的出差计划,一待就是二十多天。这短短的二十多天成为了我今年最难忘的痛,多少次期望回到家里温暖的被窝,多少次期望在家吃着我做的炖土豆。

今年面试了不少人,通过面试也发现大部分技术人员的水平太差了,我甚至都搞不明白他们是怎么厚着脸皮来面试技术岗位的。济南软件行业实在是不景气,甚至找一个靠谱点的web或者php程序员都成为了公司的一大难题。

生活

长达五年的恋情在今年终于得到了升华,当然这升华是我不愿意这么快就看到的,多么希望能迟来几年,给原本一直以为自己还是个孩子的我一个接受的缓冲区,但站在两家人面前,我的想法竟然不能主导我。我对结婚这件事情持怎么简单怎么办的态度,结婚本就一仪式,豪华也罢,没有也罢,都是过眼云烟,为一天忙碌了一阵子仅为了那一天,而之后又有谁记得。结婚之所以在中国的古代非常重视,那是因为在农业社会中人民的娱乐方式非常单一,结婚可以成为人民心中的一个盼头和没有灯光的饭后侃的资本,现在娱乐方式早已多元化,相比之下结婚的光鲜早已显得微不足道。可结婚毕竟不是我一个人的事,甚至不是两个人的事,而是两家人的事。

结婚定在酷夏,定下来的时间比较匆忙,从定下来要结婚到结婚仅一个月时间,对我来说是莫大的好事,因为拖得时间越长占用的准备时间就越多。半年的婚前和半年的婚后生活,其实真的没人什么两样,都是美满的二人世界,希望这种状况能持续几年。

我一向对车比较排斥,始终认为汽车是一个比较失败的发明,用户体验特别差。好的设计应该让用户忽略其内部实现细节,好的发明不应该让用户花费大量的时间来学习怎样使用,甚至需要多个课时的专业培训。汽车不仅是一个毫无用户体验的发明,而且危险到极致,危险到一失误就会要掉人的性命。

但今年我随波逐流了,毕竟驾照是早晚要考的,晚考成本只会更高。于是考驾照提上了议程,8月初已经计划报名,只可惜流程过于复杂,到现在也才到了科目二的程度。先是报名需要办暂住证,暂住证一办就是15个工作日,直接拖到了十一之后。找个离家近的驾校报个名,一等就是一个月才考科目一。科目一考完一等又是一个月才开始分车学科目二。科目二刚开始学又开始继续了,一共练了两个工作日后驾校又开始集训了,又没我啥事了。好在我找了个陪练,练了几把就顺手了。

虽然驾照没有考出来,仅考到了科目二,算是完成了驾照的一半,但却耗去了我的部分经历。找驾校、准备科目一、学习科目二、找陪练,这些花费的都是我的时间。要是驾校培训行业能够再成熟些,再人性化些能给多少学车的人带来方便。

玩游戏多少有些过了,虽然每周也就不想学习的两个晚上用来玩游戏,但我深知自己不是玩游戏的料。很多时候为了能够赢一局,会熬夜到下半夜,这是非常不理智的。另外,以后尽量用其他方式来代替游戏放松,当然我深知其中的苦难。

旅行

去过一次云南,都在这里了。

清明节时间去过一次天津,天津比我想象的要好很多,各个地方特色比较明显,有别墅区、意大利风情区、现代的商业区等,这之间能够非常明显的区分,不像济南太混杂。不过天津的人却给我留下的印象不是很好,这也是小小的遗憾。

展望

在我心中已经为2015年制定好了一些计划,为家庭,为自己,2015年会是我人生的一个转折点,期望2015年能够顺利。我会努力的。

题目

Find the contiguous subarray within an array (containing at least one number) which has the largest sum.

For example, given the array [−2,1,−3,4,−1,2,1,−5,4],
the contiguous subarray [4,−1,2,1] has the largest sum = 6.

分析

该题目为经典题目,存在多种解题思路。

动态规划

求动态规划的关键在于找到状态方程。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
/**
* 问题的关键是找到状态方式,找到状态方程后问题就迎刃而解
* 状态方程如下:
* b[j]表示第j处,以a[j]结尾的子序列的最大和
* b[j]=max(a[j] + b[j-1], a[j])
* b数据的最大值即为问题的解
* 问题转换为求解b数组
* 时间复杂度为O(1),空间复杂度为(n),空间复杂度可以降为O(1),为了使程序易读,不做调整
*/
int maxSubArray(int A[], int n) {
if (n == 0)
{
return 0;
}
int *b = new int[n];
b[0] = A[0];
int max_b = b[0];
for (int i=1; i<n; i++)
{
b[i] = std::max(A[i] + b[i-1], A[i]);
if (max_b < b[i])
{
max_b = b[i];
}
}
delete[] b;
return max_b;
}

分治法

《算法导论》的分治策略一章有关于该问题的详细解释。该题利用分治法来解决要比二分查找类最简单的分治算法要复杂。将数组一分为二后,最大数组存在三种情况:在左半或右半部分、跨越中点分别占据左部分一点和右部分一点。对于跨越中点的情况,转化为求从中点开始向左的最大值和从中点开始向右的最大值之和。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
class Solution {
public:
int compare_array[4];

int maxSubArray(int A[], int n) {
return maxSubArray(A, 0, n - 1);
}

/**
* leetcode not support stdarg.h
*/
int max(int count, ...)
{
va_list ap;
va_start(ap, count);
int max = INT_MIN;
for (int i=0; i<count; i++)
{
int temp = va_arg(ap, int);
if (max < temp)
{
max = temp;
}
}
va_end(ap);
return max;
}

int max_compare_array()
{
int max_num = compare_array[0];
for (int i=1; i<4; i++)
{
if (max_num < compare_array[i])
{
max_num = compare_array[i];
}
}
return max_num;
}

int maxSubArray(int A[], int begin, int end)
{
//printf("begin : %d, end : %d\n", begin, end);
if (begin == end)
{
return A[begin];
}
else if ((end - begin) == 1)
{
//return max(3, A[begin], A[begin] + A[end], A[end]);
compare_array[0] = A[begin];
compare_array[1] = A[begin] + A[end];
compare_array[2] = A[end];
compare_array[3] = INT_MIN;
return max_compare_array();
}
int middle = (begin + end) / 2;
// 处理左边子数组
int max_left = maxSubArray(A, begin, middle);
// 处理右边子数组
int max_right = maxSubArray(A, middle + 1, end);
// 处理跨越中点的情况
int max_cross = maxCrossMiddle(A, begin, end);

printf("begin : %d, end : %d, max_left = %d, max_right = %d, max_cross = %d\n", begin, end, max_left, max_right, max_cross);

// 返回三者中的最大值
compare_array[0] = max_left;
compare_array[1] = max_right;
compare_array[2] = max_cross;
compare_array[3] = INT_MIN;
return max_compare_array();
}

/**
* 处理跨越中点的情况
*/
int maxCrossMiddle(int A[], int begin, int end)
{
if (begin == end)
{
return A[begin];
}
int middle = (begin + end) / 2;
// 求得[begin -- middle-1]的最大值
int max_left = A[middle - 1];
int sum = 0;
for (int i=middle - 1; i>=begin && i >= 0; i--)
{
sum += A[i];
if (max_left < sum)
{
max_left = sum;
}
}

// 求得[middle+1 -- end]的最大值
int max_right = A[middle + 1];
sum = 0;
for (int i=middle + 1; i<=end; i++)
{
sum += A[i];
if (max_right< sum)
{
max_right = sum;
}
}

compare_array[0] = A[middle];
compare_array[1] = A[middle] + max_left;
compare_array[2] = A[middle] + max_right;
compare_array[3] = A[middle] + max_left + max_right;
return max_compare_array();
}
};

扫描算法

《编程珠玑》一书8.4节提到该算法,时间复杂度为O(1),是解决该问题最好的算法。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
int maxSubArray(int A[], int n) {
if (n == 0)
{
return 0;
}
int current_sum = 0;
int max_sum = INT_MIN;

for (int i=0; i<n; i++)
{
if (current_sum <= 0)
{
current_sum = A[i];
}
else
{
current_sum += A[i];
}
if (current_sum > max_sum)
{
max_sum = current_sum;
}
}
return max_sum;
}

最近在看《Linux/Unix系统编程手册》一书,这里对书中提到的函数类型进行总结。

可重入

POSIX标准中的解释如下:

Reentrant Function:
A function whose effect, when called by two or more threads,is guaranteed to be as if the threads each executed thefunction one after another in an undefined order, even ifthe actual execution is interleaved.

可重入函数跟信号相关,一种更容易理解的解释为:

程序执行到某个函数foo()时,收到信号,于是暂停目前正在执行的函数,转到信号处理函数,而这个信号处理函数的执行过程中,又恰恰也会进入到刚刚执行的函数foo(),便发生了所谓的重入。此时如果foo()能够正确的运行,而且处理完成后,之前暂停的foo()也能够正确运行,则说明它是可重入的。

可重入函数需要满足如下几个条件:

  • 不在函数内部使用静态或全局数据
  • 不返回静态或全局数据,所有数据均有函数调用者提供
  • 使用本地数据或通过复制全局数据来保护全局数据
  • 不调用不可重入函数

标准的异步安全信号函数

异步信号安全的函数指当从信号处理函数调用时,可保证实现是安全的。如果某一个函数是可重入的,或者信号处理函数无法将其中断时,称该函数是异步信号安全的。

我的理解是可重入函数和标准的异步安全信号函数基本等同,只是描述层面不同。

线程安全

若函数可同时供多个线程安全的调用,则该函数为线程安全的函数。比较容易理解。

线程安全与可重入之间的关系

可重入函数一定为线程安全的函数。线程安全函数不一定是可重入函数。

不可重入函数,函数调用结果不具有可再现性,可通过互斥锁等机制供多个线程安全的调用,这样该不可重入函数即为线程安全的函数。

malloc函数内部维护了全局数据结构,因此为不可重入的,但是内部通过递归互斥量来确保为线程安全的函数。并且该互斥量必须是可递归的,否则当malloc函数重入的情况下,会造成死锁。在glibc中,malloc有线程安全和非线程安全两个版本,两个区别在于内部是否使用递归锁,当编译程序时使用了_pthreads选项时使用线程安全版本,否则使用非线程安全版本。

自动重启

Linux中的某些系统调用在阻塞的过程中,如果接受到信号并转去处理信号处理函数,当从信号处理函数返回时这些阻塞的系统调用默认会返回EINTR。为了避免信号处理函数对阻塞中的系统调用的打断,可以通过设置SA_RESTART标志的sigaction()来建立信号处理函数,从而令内核代表进程自动重启系统调用,而无需处理系统调用返回的EINTR错误。

并非所有的系统调用都支持自动重启,具体可参考《Linux/Unix系统编程手册(上册)》的21.5节。

参考资料

《Linux/Unix系统编程手册(上册)》

对可重性和线程安全的小结

[TOC]

信号机制在Linux编程中一直是一个难点,因为信号往往跟进程、线程、定时器、I/O等多个层面都有牵涉,这些情况存在错综复杂的关系,堪比娱乐圈错综复杂的男女关系,要想全面理解信号机制确实不易。

信号种类

在Linux中可以通过如下命令来查看所有的信号:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
[kuring@localhost ~]$ kill -l
1) SIGHUP 2) SIGINT 3) SIGQUIT 4) SIGILL 5) SIGTRAP
6) SIGABRT 7) SIGBUS 8) SIGFPE 9) SIGKILL 10) SIGUSR1
11) SIGSEGV 12) SIGUSR2 13) SIGPIPE 14) SIGALRM 15) SIGTERM
16) SIGSTKFLT 17) SIGCHLD 18) SIGCONT 19) SIGSTOP 20) SIGTSTP
21) SIGTTIN 22) SIGTTOU 23) SIGURG 24) SIGXCPU 25) SIGXFSZ
26) SIGVTALRM 27) SIGPROF 28) SIGWINCH 29) SIGIO 30) SIGPWR
31) SIGSYS 34) SIGRTMIN 35) SIGRTMIN+1 36) SIGRTMIN+2 37) SIGRTMIN+3
38) SIGRTMIN+4 39) SIGRTMIN+5 40) SIGRTMIN+6 41) SIGRTMIN+7 42) SIGRTMIN+8
43) SIGRTMIN+9 44) SIGRTMIN+10 45) SIGRTMIN+11 46) SIGRTMIN+12 47) SIGRTMIN+13
48) SIGRTMIN+14 49) SIGRTMIN+15 50) SIGRTMAX-14 51) SIGRTMAX-13 52) SIGRTMAX-12
53) SIGRTMAX-11 54) SIGRTMAX-10 55) SIGRTMAX-9 56) SIGRTMAX-8 57) SIGRTMAX-7
58) SIGRTMAX-6 59) SIGRTMAX-5 60) SIGRTMAX-4 61) SIGRTMAX-3 62) SIGRTMAX-2
63) SIGRTMAX-1 64) SIGRTMAX

共64个信号,分为两种信号:非实时信号和实时信号。其中1-31个信号为非实时信号,32-64为实时信号。

当一信号在阻塞状态下产生多次信号,当解除该信号的阻塞后,非实时信号仅传递一次信号,而实时信号会传递多次。

对于非实时信号:内核会为每个信号维护一个信号掩码,并阻塞信号针对该进程的传递。如果将阻塞的信号发送给某进程,对该信号的传递将延时,直至从进程掩码中移除该信号为止。当从进程掩码中移除该信号时该信号将传递给该进程。如果信号在阻塞期间传递过多次该信号,信号解除阻塞后仅传递一次。

对于实时信号:实时信号采用队列化处理,一个实时信号的多个实例发送给进程,信号将会传递多次。可以制定伴随数据,用于产生信号时的数据传递。不同实时信号的传递顺序是固定的,优先传递信号编号小的。

信号阻塞

内核会为每个信号维护一个信号掩码,来阻塞内核将信号传递给该进程。如果将阻塞的信号发送给该进程,信号的传递将延后,从进程信号掩码中移除该信号后内核立刻将信号传递给该进程。如果一个信号在阻塞状态下产生多次,对于非实时信号稍后仅会传递一次,对于实时信号内核会进行排队处理,会传递多次。

信号处理函数

要想在进程中设置信号处理函数有两种选择:signal()和sigaction()。其中signal()函数提供的接口比较简单,但是在不同的UNIX系统之间存在差异,跨平台特性不是很好,signal()函数由于是C库函数,实现往往是采用sigaction()系统调用完成。sigaction()具有很好的跨平台性,但是使用较为复杂,但是却可以在信号处理程序中完成阻塞信号的作用。

在sigaction函数中可以指定调用信号处理函数时要阻塞的信号集,不允许这些信号中断信号处理函数的调用,直到信号处理函数调用完毕后信号才会传递。这一点通过signal函数是完不成的,利用signal函数设定的信号处理函数只能在信号处理函数开始时使用sigprocmask设置要阻塞的信号,在信号处理函数尾部利用sigprocmask还原信号,但在调用第一次调用sigprocmask函数之前和第二次调用sigprocmask函数之后的空白期内却无法防止要阻塞信号的传递。

信号处理函数中调用的函数尽量是异步信号安全的,C库中的函数不是异步信号安全的函数。

在信号处理函数中尽量避免访问全局变量,要访问全局变量可以使用volatile sig_atomic_t flag,volatile防止将编译器将变量优化到内存中,sig_atomic_t是一种整形数据类型,用来保证读写操作的原子性。

系统调用的中断

当系统调用阻塞时,之前创建了处理函数的信号传递过来。在信号处理函数返回后,默认情况下,系统调用会失败,并将errno置为EINTR。

如果调用指定了SA_RESTART标志的sigaction()函数来创建信号处理器函数,内核会在信号处理函数返回后自动重启系统调用,从而避免了信号处理函数对阻塞的系统调用产生的影响。比较不幸的是,并非所有的系统调用都支持该特性。

信号的同步生成和异步生成

这里的同步是对信号产生方式的描述,跟具体哪个信号无关。所有的信号均可同步生成,也可异步生成。

异步生成:引发信号产生的事件与进程的执行无关。例如,用户输入了中断字符、子进程终止等事件,这些信号的产生该进程是无法左右的。

同步生成:当执行特定的机制指令产生硬件异常时或进程使用raise()、kill()等向自身发生信号时,信号是同步传递的。这些信号的产生时间该进程是可以左右的。

信号传递的时机和顺序

同步产生的信号会立即传递给该进程。例如,当使用raise()函数向自身发送信号时,信号会在raise()调用前发生。

异步产生一个信号时,且在进程并未阻塞的情况下,信号也不会立即被传递。当且仅当进程正在执行,并且由内核态到用户态的下一次切换时才会传递信号。说人话就是在以下两种情况下会传递信号:进程获得调度时和系统调用完成时。这是因为内核会在进程在内核态和用户态进行的切换的时候才会检测信号。

非实时信号的传递顺序无法保障,实时信号的传递顺序是固定的,当多个不同的实时信号处于等待状态时,优先传递最小编号的信号。

信号和线程

信号模型是基于进程模型而设计的,应尽量避免在多线程中使用信号模型。

信号的发送可以针对整个进程,也可以针对特定线程。

当进程收到一个信号后,内核会任选一个线程来接收信号,并调用信号处理函数对信号进行处理。

每个线程可以独立设置信号掩码。

如果信号处理程序中断了对pthread_mutex_lock()和pthread_cond_wait()的调用,该调用会自动重启。

参考文章

《Linux/Unix系统编程手册》

0%