0%

基本信息

名称: Perl语言入门(中文版)(第6版)
作者信息: 作者: 施瓦茨 [ 中文 pdf ]

简单介绍

《Perl语言入门(第6版)(中文版)》从最基础的开始教起,然后逐渐深入,让你慢慢能够自行编写多至128行的程序——如今90%的Perl程序差不多都是这般大小,全书包括输入与输出;用正则表达式处理文本;字符串与排序等数章内容。

目录

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
第一章简介
问题与答案
这本书适合你吗?
为何有这么多的脚注?
关于习题和解答?
习题前标的数字是什么意思?
如果我是Perl讲师?
“Perl”这个词表示什么意思?
Larry为什么要创造Perl?
Larry干吗不用其他语言?
Perl算容易,还是算难?
Perl怎么会这么流行?
现在的Perl发展得怎么样了?
哪些事情最适合用Perl来做?
哪些事情不适合用Perl来做?
如何取得Perl?
CPAN是什么?
如何得到Perl的技术支持?
还有别的技术支持方式吗?
如果发现Perl有bug,我该怎么办?
我该怎么编写Perl程序?
一个简单的程序
程序里写的是什么?
我该如何编译Perl程序?
走马观花
习题
第二章标量数据
数字
所有数字的内部格式都相同
浮点数直接量
整数直接量
非+进制整数的直接量
数字操作符
字符串
单引号内的字符串直接量
双引号内的字符串直接量
字符串操作符
数字与字符串之间的自动转换
Perl的内置警告信息
标量变量
给变量取个好名字
标量的赋值
双目赋值操作符
用print输出结果
字符串中的标量变量内插
借助代码点创建字符
操作符的优先级与结合性
比较操作符
if控制结构
布尔值
获取用户输入
chomp操作符
while控制结构
undef值
defined函数
习题
第三章列表与数组
访问数组中的元素
特殊的数组索引
列表直接量
qw简写
列表的赋值
pop和push操作符
shift和unshift操作符
splice操作符
字符串中的数组内插
foreach控制结构
Perl最喜欢用的默认变量:$_
reverse操作符
sort操作符
each操作符
标量上下文与列表上下文
在标量上下文中使用产生列表的表达式
在列表上下文中使用产生标量的表达式
强制指定标量上下文
列表上下文中的 习题 第四章子程序 定义子程序 调用子程序 返回值 参数 子程序中的私有变量 变长参数列表 改进的&max子程序 空参数列表 关于词法(my)变量 use strict编译指令 return操作符 省略与号 非标量返回值 持久化私有变量 习题 第五章输入与输出 读取标准输入 来自钻石操作符的输入 调用参数 输出到标准输出 JNprintf格式化输出 数组和printf 文件句柄 打开文件句柄 以二进制方式读写文件句柄 有问题的文件句柄 关闭文件句柄 用die处理致命错误 用warn输出警告信息 自动检测致命错误 使用文件句柄 改变默认的文件输出句柄 重新打开标准文件句柄 用say来输出 …… 第六章哈希 第七章漫游正则表达式王国 第八章用正则表达式进行匹配 第九章用正则表达式处理文本 第十章其他控制结构 第十一章Perl模块 第十二章文件测试 第十三章目录操作 第十四章字符串与排序 第十五章智能匹配与given—when结构 第十六章进程管理 第十七章高级Perl技巧 附录 </stdin>

亚马逊链接

基本信息

名称: 人人都是产品经理 version 1.1
作者信息: 作者: 苏杰 [ 中文 pdf ]

简单介绍

《人人都是产品经理 version 1.1》书名的由来是因为作者觉得过去几年在做产品的过程中学到的思维方法与做事方式对自己很有帮助,而每个人也无时无刻在思考着同样的问题:”我们为了什么,在做什么事,解决什么人的什么问题?何时,和谁一起做?需要什么能力?”这些正对应了《人人都是产品经理 version 1.1》要说的几大话题:用户、需求、项目、团队、战略、修养。

目录

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
写在正文之前
为什么会有这本书
本书的产品定位
本书的风格与特色
本书的目录与内容
我与本书的局限性
第1章 写给-1到3岁的产品经理
1.1 为什么要做产品经理
1.2 我们到底是不是产品经理
1.3 我真的想做,怎么入行
1.4 一个产品经理的-1到3岁
第2章 一个需求的奋斗史
2.1 从用户中来到用户中去
2.1.1 用户是需求之源
2.1.2 你真的了解用户吗
2.2 需求采集的大生产运动
2.2.1 定性地说:用户访谈
2.2.2 定量地说:调查问卷
2.2.3 定性地做:可用性测试
2.2.4 定量地做:数据分析
2.2.5 需求采集人人有责
2.3 听用户的但不要照着做
2.3.1 明确我们存在的价值
2.3.2 给需求做一次DNA检测
2.4 活下来的永远是少数
2.4.1 永远忘不掉的那场战争
2.4.2 别灰心,少做就是多做
2.5 心急吃不了热豆腐
第3章 项目的坎坷一生
3.1 从产品到项目
3.2 一切从Kick Off开始
3.3 关键的青春期,又见需求
3.3.1 真的要写很多文档
3.3.2 需求活在项目中
3.4 成长,一步一个脚印
3.5 山寨级项目管理
3.5.1 文档只是手段
3.5.2 流程也是手段
3.5.3 敏捷更是手段
3.6 物竞天择适者生存
3.6.1 亲历过的特色项目
3.6.2 一路坎坷,你我同行
第4章 我的产品,我的团队
4.1 大产品,大设计,大团队
4.1.1 产品之大
4.1.2 设计之大
4.1.3 团队之大
4.2 游走于商业与技术之间
4.2.1 心思缜密的规划师
4.2.2 激情四射的设计师
4.2.3 “阴险狡诈"的运营师
4.3 商业团队,冲锋陷阵
4.3.1 好产品还需市场化
4.3.2 我们还能做什么
4.4 技术团队,坚强后盾
4.5 容易被遗忘的角落
4.6 大家好才是真的好
4.6.1 所谓团队文化
4.6.2 虚无的无授权领导
第5章 别让灵魂跟不上脚步
5.1 触及产品的灵魂
5.2 可行性分析三部曲
5.2.1 我们在哪儿
5.2.2 我们去哪儿
5.2.3 我们怎么去
5.3 做吧,准备出发
5.3.1 敢问路在何方
5.3.2 低头走路,抬头看天
5.4 KPI,KPI,KPI
5.5 本书的源头活水
第6章 产品经理的自我修养
6.1 爱生活,才会爱产品
6.2 有理想,就不会变咸鱼
6.3 会思考,活到老学到老
6.4 能沟通,在什么山头唱什么歌
6.5 产品经理主义
附录:它山之石 可以攻玉
别人眼中的产品经理
各种有用的信息

亚马逊链接

基本信息

名称: 爱上Processing
作者信息: 作者: Casey) 瑞斯 (Reas [ 中文 pdf ]

简单介绍

《爱上Processing》言简意赅,清晰、详细地介绍了Processing的各项功能和拓展的可能性,以及在计算机图形方面的主要优势和用法。

目录

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
前言
1 简介
草稿化和原型化
灵活性
巨人
家族树
加入我们

2 开始编程 第一个程序 显示(Show) 保存 分享 例子和引用

3 画图 基本形状 绘制顺序 图形的性质 颜色 自定义图形 注释 机器人1:绘制

4 变量 创造变量 Processing的变量 一些小小的数学问题 重复 机器人2:变量

5 响应 跟随 映射 点击 位置 类型 机器人3:响应

6 媒体 图像 字体 形状 机器人4:媒体

7 运动 速度和方向 在两者之间 随机 计时器 圆环 平移、旋转和缩放 机器人5:运动

8 函数 函数的基础 写一个函数 返回值 机器人6:函数

9 对象 类别和对象 机器人7:对象

10 数组 写一个数组 重复和数组 对象的数组 机器人8:数组

11 延伸 三维 图像和导出 你好Arduino 爱好者社区 A 编程小贴士 B 数据类型 C 操作的顺序 D 变量作用域

亚马逊链接

基本信息

名称: 推荐系统实践
作者信息: 作者: 项亮 [ 中文 pdf ]

简单介绍

《推荐系统实践》适合对推荐技术感兴趣的读者学习参考。

目录

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
目 录 

第1章 好的推荐系统 1 1.1 什么是推荐系统 1 1.2 个性化推荐系统的应用 4 1.2.1 电子商务 4 1.2.2 电影和视频网站 8 1.2.3 个性化音乐网络电台 10 1.2.4 社交网络 12 1.2.5 个性化阅读 15 1.2.6 基于位置的服务 16 1.2.7 个性化邮件 17 1.2.8 个性化广告 18 1.3 推荐系统评测 19 1.3.1 推荐系统实验方法 20 1.3.2 评测指标 23 1.3.3 评测维度 34

第2章 利用用户行为数据 35 2.1 用户行为数据简介 36 2.2 用户行为分析 39 2.2.1 用户活跃度和物品流行度的分布 39 2.2.2 用户活跃度和物品流行度的关系 41 2.3 实验设计和算法评测 41 2.3.1 数据集 42 2.3.2 实验设计 42 2.3.3 评测指标 42 2.4 基于邻域的算法 44 2.4.1 基于用户的协同过滤算法 44 2.4.2 基于物品的协同过滤算法 51 2.4.3 UserCF和ItemCF的综合比较 59 2.5 隐语义模型 64 2.5.1 基础算法 64 2.5.2 基于LFM的实际系统的例子 70 2.5.3 LFM和基于邻域的方法的比较 72 2.6 基于图的模型 73 2.6.1 用户行为数据的二分图表示 73 2.6.2 基于图的推荐算法 73

第3章 推荐系统冷启动问题 78 3.1 冷启动问题简介 78 3.2 利用用户注册信息 79 3.3 选择合适的物品启动用户的兴趣 85 3.4 利用物品的内容信息 89 3.5 发挥专家的作用 94

第4章 利用用户标签数据 96 4.1 UGC标签系统的代表应用 97 4.1.1 Delicious 97 4.1.2 CiteULike 98 4.1.3 Last.fm 98 4.1.4 豆瓣 99 4.1.5 Hulu 99 4.2 标签系统中的推荐问题 100 4.2.1 用户为什么进行标注 100 4.2.2 用户如何打标签 101 4.2.3 用户打什么样的标签 102 4.3 基于标签的推荐系统 103 4.3.1 实验设置 104 4.3.2 一个最简单的算法 105 4.3.3 算法的改进 107 4.3.4 基于图的推荐算法 110 4.3.5 基于标签的推荐解释 112 4.4 给用户推荐标签 115 4.4.1 为什么要给用户推荐标签 115 4.4.2 如何给用户推荐标签 115 4.4.3 实验设置 116 4.4.4 基于图的标签推荐算法 119 4.5 扩展阅读 119

第5章 利用上下文信息 121 5.1 时间上下文信息 122 5.1.1 时间效应简介 122 5.1.2 时间效应举例 123 5.1.3 系统时间特性的分析 125 5.1.4 推荐系统的实时性 127 5.1.5 推荐算法的时间多样性 128 5.1.6 时间上下文推荐算法 130 5.1.7 时间段图模型 134 5.1.8 离线实验 136 5.2 地点上下文信息 139 5.3 扩展阅读 143

第6章 利用社交网络数据 144 6.1 获取社交网络数据的途径 144 6.1.1 电子邮件 145 6.1.2 用户注册信息 146 6.1.3 用户的位置数据 146 6.1.4 论坛和讨论组 146 6.1.5 即时聊天工具 147 6.1.6 社交网站 147 6.2 社交网络数据简介 148    社交网络数据中的长尾分布 149 6.3 基于社交网络的推荐 150 6.3.1 基于邻域的社会化推荐算法 151 6.3.2 基于图的社会化推荐算法 152 6.3.3 实际系统中的社会化推荐算法 153 6.3.4 社会化推荐系统和协同过滤推荐系统 155 6.3.5 信息流推荐 156 6.4 给用户推荐好友 159 6.4.1 基于内容的匹配 161 6.4.2 基于共同兴趣的好友推荐 161 6.4.3 基于社交网络图的好友推荐 161 6.4.4 基于用户调查的好友推荐算法对比 164 6.5 扩展阅读 165

第7章 推荐系统实例 166 7.1 外围架构 166 7.2 推荐系统架构 167 7.3 推荐引擎的架构 171 7.3.1 生成用户特征向量 172 7.3.2 特征-物品相关推荐 173 7.3.3 过滤模块 174 7.3.4 排名模块 174 7.4 扩展阅读 178

第8章 评分预测问题 179 8.1 离线实验方法 180 8.2 评分预测算法 180 8.2.1 平均值 180 8.2.2 基于邻域的方法 184 8.2.3 隐语义模型与矩阵分解模型 186 8.2.4 加入时间信息 192 8.2.5 模型融合 193 8.2.6 Netflix Prize的相关实验结果 195

后记 196

亚马逊链接

基本信息

名称: Python标准库
作者信息: 作者: 荷尔曼 (Doug Hellmann) [ 英文 pdf ]

简单介绍

《Python标准库》的读者应该是中等水平的Python程序员,所以尽管书中对所有源代码都做了讨论,但只有一部分会逐行给出解释。每节会通过源代码和完全独立的示例程序的输出来重点介绍一个模块的特性。我会尽可能简洁地介绍各个特性,使读者能够把重点放在所展示的模块或函数上,而不会因支持代码而分心。

目录

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
译者序

前言
第1章文本
1.1string——文本常量和模板
1.1.1函数
1.1.2模板
1.1.3高级模板
1.2textwrap——格式化文本段落
1.2.1示例数据
1.2.2填充段落
1.2.3去除现有缩进
1.2.4结合dedent和fill
1.2.5悬挂缩进
1.3re——正则表达式
1.3.1查找文本中的模式
1.3.2编译表达式
1.3.3多重匹配
1.3.4模式语法
1.3.5限制搜索
1.3.6用组解析匹配
1.3.7搜索选项
1.3.8前向或后向
1.3.9自引用表达式
1.3.10用模式修改字符串
1.3.11利用模式拆分
1.4difflib——比较序列
1.4.1比较文本体
1.4.2无用数据
1.4.3比较任意类型
第2章数据结构
2.1 collections——容器数据类型
2.1.1 Counter
2.1.2 defaultdict
2.1.3 deque
2.1.4 namedtuple
2.1.5 OrderedDict
2.2 array——固定类型数据序列
2.2.1 初始化
2.2.2处理数组
2.2.3数组与文件
2.2.4候选字节顺序
2.3 heapq——堆排序算法
2.3.1示例数据
2.3.2创建堆
2.3.3访问堆的内容
2.3.4堆的数据极值
2.4 bisect——维护有序列表
2.4.1有序插入
2.4.2处理重复
2.5 Queue——线程安全的FIFO实现
2.5.1基本FIFO队列
2.5.2 LIFO队列
2.5.3优先队列
2.5.4构建一个多线程播客客户程序
2.6 struct——二进制数据结构
2.6.1 函数与Struct类
2.6.2打包和解包
2.6.3字节序
2.6.4缓冲区
2.7 weakref——对象的非永久引用
2.7.1 引用
2.7.2引用回调
2.7.3代理
2.7.4循环引用
2.7.5缓存对象
2.8 copy——复制对象
2.8.1浅副本
2.8.2深副本
2.8.3定制复制行为
2.8.4深副本中的递归
2.9 pprint——美观打印数据结构
2.9.1打印
2.9.2格式化
2.9.3任意类
2.9.4递归
2.9.5限制嵌套输出
2.9.6控制输出宽度
第3章 算法
3.1 functools——管理函数的工具
3.1.1修饰符
3.1.2比较
3.2 itertools——迭代器函数
3.2.1合并和分解迭代器
3.2.2转换输入
3.2.3生成新值
3.2.4过滤
3.2.5数据分组
3.3 operator——内置操作符的函数接口
3.3.1逻辑操作
3.3.2比较操作符
3.3.3算术操作符
3.3.4序列操作符
3.3.5原地操作符
3.3.6属性和元素“获取方法”
3.3.7结合操作符和定制类
3.3.8类型检查
3.4 contextlib——上下文管理器工具
3.4.1上下文管理器API
3.4.2从生成器到上下文管理器
3.4.3嵌套上下文
3.4.4关闭打开的句柄
第4章 日期和时间
4.1 time——时钟时间
4.1.1壁挂钟时间
4.1.2处理器时钟时间
4.1.3时间组成
4.1.4处理时区
4.1.5解析和格式化时间
4.2 datetime——日期和时间值管理
4.2.1 时间
4.2.2 日期
4.2.3 timedelta
4.2.4日期算术运算
4.2.5比较值
4.2.6结合日期和时间
4.2.7格式化和解析
……
第5章数学计算
第6章文件系统
第7章数据持久存储与交换
第8章数据压缩与归档
第9章加密
第10章进程与线程
第11章网络通信
第12章Internet
第113章Email
第14章应用构建模块
第15章国际化和本地化
第16章开发工具
第17章运行时特性
第18章语言工具
第19章模块与包

亚马逊链接

基本信息

名称: 传世经典书丛 UNIX编程艺术
作者信息: 作者: 埃瑞克•S.理曼德(Eric S. Raymond) [ 中文 pdf ]

简单介绍

《传世经典书丛:UNIX编程艺术》内容涉及社群文化、软件开发设计与实现,覆盖面广、内容深邃,完全展现了作者极其深厚的经验积累和领域智慧。

目录

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369

PartIⅠ1
第1章 哲学3
1.1 文化?什么文化3
1.2 Unix的生命力4
1.3 反对学习Unix文化的理由5
1.4 Unix之失6
1.5 Unix之得7
1.5.1 开源软件7
1.5.2 跨平台可移植性和开放标准8
1.5.3 Internet和万维网8
1.5.4 开源社区9
1.5.5 从头到脚的灵活性9
1.5.6 UnixHack之趣10
1.5.7 Unix的经验别处也可适用11
1.6 Unix哲学基础11
1.6.1 模块原则:使用简洁的接口拼合简单的部件14
1.6.2 清晰原则:清晰胜于机巧14
1.6.3 组合原则:设计时考虑拼接组合15
1.6.4 分离原则:策略同机制分离,接口同引擎分离16
1.6.5 简洁原则:设计要简洁,复杂度能低则低17
1.6.6 吝啬原则:除非确无它法,不要编写庞大的程序18
1.6.7 透明性原则:设计要可见,以便审查和调试18
1.6.8 健壮原则:健壮源于透明与简洁18
1.6.9 表示原则:把知识叠入数据以求逻辑质朴而健壮19
1.6.10 通俗原则:接口设计避免标新立异20
1.6.11 缄默原则:如果一个程序没什么好说的,就保持沉默20
1.6.12 补救原则:出现异常时,马上退出并给出足量错误信息21
1.6.13 经济原则:宁花机器一分,不花程序员一秒22
1.6.14 生成原则:避免手工hack,尽量编写程序去生成程序22
1.6.15 优化原则:雕琢前先得有原型,跑之前先学会走23
1.6.16 多样原则:决不相信所谓“不二法门”的断言24
1.6.17 扩展原则:设计着眼未来,未来总比预想快24
1.7 Unix哲学之一言以蔽之25
1.8 应用Unix哲学26
1.9 态度也要紧26
第2章 历史——双流记29
2.1 Unix的起源及历史,1969-199529
2.1.1 创世纪:1969-197130
2.1.2 出埃及记:1971-198032
2.1.3 TCP/IP和Unix内战:1980-199035
2.1.4 反击帝国:1991-199541
2.2 黑客的起源和历史:1961-199543
2.2.1 游戏在校园的林间:1961-198044
2.2.2 互联网大融合与自由软件运动:1981-199145
2.2.3 Linux和实用主义者的应对:1991-199848
2.3 开源运动:1998年及之后49
2.4 Unix的历史教训51
第3章 对比:Unix哲学同其他哲学的比较53
3.1 操作系统的风格元素53
3.1.1 什么是操作系统的统一性理念54
3.1.2 多任务能力54
3.1.3 协作进程55
3.1.4 内部边界57
3.1.5 文件属性和记录结构57
3.1.6 二进制文件格式58
3.1.7 首选用户界面风格58
3.1.8 目标受众59
3.1.9 开发的门坎60
3.2 操作系统的比较61
3.2.1 VMS61
3.2.2 MacOS64
3.2.3 OS/265
3.2.4 WindowsNT68
3.2.5 BeOS71
3.2.6 MVS72
3.2.7 VM/CMS74
3.2.8 Linux76
3.3 种什么籽,得什么果78
PartⅡ81
第4章 模块性:保持清晰,保持简洁83
4.1 封装和最佳模块大小85
4.2 紧凑性和正交性87
4.2.1 紧凑性87
4.2.2 正交性89
4.2.3 SPOT原则91
4.2.4 紧凑性和强单一中心92
4.2.5 分离的价值94
4.3 软件是多层的95
4.3.1 自顶向下和自底向上95
4.3.2 胶合层97
4.3.3 实例分析:被视为薄胶合层的C语言98
4.4 程序库99
4.4.1 实例分析:GIMP插件100
4.5 Unix和面向对象语言101
4.6 模块式编码103
第5章 文本化:好协议产生好实践105
5.1 文本化的重要性107
5.1.1 实例分析:Unix口令文件格式109
5.1.2 实例分析:newsrc格式110
5.1.3 实例分析:PNG图形文件格式111
5.2 数据文件元格式112
5.2.1 DSV风格113
5.2.2 RFC822格式114
5.2.3 Cookie—Jar格式115
5.2.4 Record—Jar格式116
5.2.5 XML117
5.2.6 WindowsINI格式119
5.2.7 Unix文本文件格式的约定120
5.2.8 文件压缩的利弊122
5.3 应用协议设计123
5.3.1 实例分析:SMTP,一个简单的套接字协议124
5.3.2 实例分析:POP3,邮局协议124
5.3.3 实例分析:IMAP,互联网消息访问协议126
5.4 应用协议元格式127
5.4.1 经典的互联网应用元协议127
5.4.2 作为通用应用协议的HTTP128
5.4.3 BEEP:块可扩展交换协议130
5.4.4 XML—RPC,SOAP和Jabber131
第6章 透明性:来点儿光133
6.1 研究实例135
6.1.1 实例分析:audacity135
6.1.2 实例分析:fetchmail的–v选项136
6.1.3 实例分析:GCC139
6.1.4 实例分析:kmail140
6.1.5 实例分析:SNG142
6.1.6 实例分析:Terminfo数据库144
6.1.7 实例分析:Freeciv数据文件146
6.2 为透明性和可显性而设计148
6.2.1 透明性之禅149
6.2.2 为透明性和可显性而编码150
6.2.3 透明性和避免过度保护151
6.2.4 透明性和可编辑的表现形式152
6.2.5 透明性、故障诊断和故障恢复153
6.3 为可维护性而设计154
第7章 多道程序设计:分离进程为独立的功能157
7.1 从性能调整中分离复杂度控制159
7.2 UnixIPC方法的分类160
7.2.1 把任务转给专门程序160
7.2.2 管道、重定向和过滤器161
7.2.3 包装器166
7.2.4 安全性包装器和Bernstein链167
7.2.5 从进程168
7.2.6 对等进程间通信169
7.3 要避免的问题和方法176
7.3.1 废弃的UnixIPC方法176
7.3.2 远程过程调用178
7.3.3 线程——恐吓或威胁180
7.4 在设计层次上的进程划分181
第8章 微型语言:寻找歌唱的乐符183
8.1 理解语言分类法185
8.2 应用微型语言187
8.2.1 案例分析:sng187
8.2.2 案例分析:正则表达式188
8.2.3 案例分析:Glade191
8.2.4 案例分析:m4193
8.2.5 案例分析:XSLT194
8.2.6 案例分析:TheDocumenter’s work bench Tools195
8.2.7 案例分析:fetchmail的运行控制语法199
8.2.8 案例分析:awk200
8.2.9 案例分析:PostScript202
8.2.10 案例分析:bc和dc203
8.2.11 案例分析:EmacsLisp205
8.2.12 案例分析:JavaScript205
8.3 设计微型语言206
8.3.1 选择正确的复杂度207
8.3.2 扩展和嵌入语言209
8.3.3 编写自定义语法210
8.3.4 宏—慎用210
8.3.5 语言还是应用协议212
第9章 生成:提升规格说明的层次215
9.1 数据驱动编程216
9.1.1 实例分析:ascii217
9.1.2 实例分析:统计学的垃圾邮件统计218
9.1.3 实例分析:fetchmailconf中的元类改动219
9.2 专用代码的生成225
9.2.1 实例分析:生成ascii显示的代码225
9.2.2 实例分析:为列表生成HTML代码227
第10章 配置:迈出正确的第一步231
10.1 什么应是可配置的231
10.2 配置在哪里233
10.3 运行控制文件234
10.3.1 实例分析:.Netrc文件236
10.3.2 到其它操作系统的可移植性238
10.4 环境变量238
10.4.1 系统环境变量238
10.4.2 用户环境变量240
10.4.3 何时使用环境变量240
10.4.4 到其它操作系统的可移植性242
10.5 命令行选项242
10.5.1 从–a到–z的命令行选项243
10.5.2 到其它操作系统的可移植性248
10.6 如何挑选方法248
10.6.1 实例分析:fetchmail249
10.6.2 实例分析:XFree86服务器251
10.7 论打破规则252
第11章 接口:Unix环境下的用户接口设计模式253
11.1 最小立异原则的应用254
11.2 Unix接口设计的历史256
11.3 接口设计评估257
11.4 CLI和可视接口之间的权衡259
11.4.1 实例分析:编写计算器程序的两种方式262
11.5 透明度、表现力和可配置性264
11.6 Unix接口设计模式266
11.6.1 过滤器模式266
11.6.2 Cantrip模式268
11.6.3 源模式268
11.6.4 接收器模式269
11.6.5 编译器模式269
11.6.6 ed模式270
11.6.7 Roguelike模式270
11.6.8 “引擎和接口分离”模式273
11.6.9 CLI服务器模式278
11.6.10 基于语言的接口模式279
11.7 应用Unix接口设计模式280
11.7.1多价程序模式
11.8 网页浏览器作为通用前端281
11.9 沉默是金284
第12章 优化287
12.1 什么也别做,就站在那儿287
12.2 先估量,后优化288
12.3 非定域性之害290
12.4 吞吐量和延迟291
12.4.1 批操作292
12.4.2 重叠操作293
12.4.3 缓存操作结果293
第13章 复杂度:尽可能简单,但别简过了头295
13.1 谈谈复杂度296
13.1.1 复杂度的三个来源296
13.1.2 接口复杂度和实现复杂度的折中298
13.1.3 必然的、可能的和偶然的复杂度299
13.1.4 映射复杂度300
13.1.5 当简洁性不能胜任302
13.2 五个编辑器的故事302
13.2.1 ed304
13.2.2 vi305
13.2.3 Sam306
13.2.4 Emacs307
13.2.5 Wily308
13.3 编辑器的适当规模309
13.3.1 甄别复杂度问题309
13.3.2 折衷无用312
13.3.3 Emacs是个反Unix传统的论据吗314
13.4 软件的适度规模316
PartⅢ319
第14章 语言:C还是非C321
14.1 Unix下语言的丰饶321
14.2 为什么不是C323
14.3 解释型语言和混合策略325
14.4 语言评估325
14.4.1 C326
14.4.2 C++327
14.4.3 Shell330
14.4.4 Perl332
14.4.5 Tcl334
14.4.6 Python336
14.4.7 Java339
14.4.8 EmacsLisp342
14.5 未来趋势344
14.6 选择X工具包346
第15章 工具:开发的战术349
15.1 开发者友好的操作系统349
15.2 编辑器选择350
15.2.1 了解vi351
15.2.2 了解Emacs351
15.2.3 非虔诚的选择:两者兼用352
15.3 专用代码生成器352
15.3.1 yacc和lex353
15.3.2 实例分析:fetchmailrc的语法356
15.3.3 实例分析:Glade356
15.4 make:自动化编译357
15.4.1 make的基本理论357
15.4.2 非C/C++开发中的make359
15.4.3 通用生成目标359
15.4.4 生成Makefile362
15.5 版本控制系统364
15.5.1 为什么需要版本控制364
15.5.2 手工版本控制365
15.5.3 自动化的版本控制366
15.5.4 Unix的版本控制工具367
15.6 运行期调试369
15.7 性能分析370
15.8 使用Emacs整合工具370
15.8.1 Emacs和make371
15.8.2 Emacs和运行期调试371
15.8.3 Emacs和版本控制371
15.8.4 Emacs和Profiling372
15.8.5 像IDE一样,但更强373
第16章 重用:论不要重新发明轮子375
16.1 猪小兵的故事376
16.2 透明性是重用的关键379
16.3 从重用到开源380
16.4 生命中最美好的就是“开放”381
16.5 何处找384
16.6 使用开源软件的问题385
16.7 许可证问题386
16.7.1 开放源码的资格386
16.7.2 标准开放源码许可证388
16.7.3 何时需要律师390
PartⅣ391
第17章 可移植性:软件可移植性与遵循标准393
17.1 C语言的演化394
17.1.1 早期的C语言395
17.1.2 C语言标准396
17.2 Unix标准398
17.2.1 标准和Unix之战398
17.2.2 庆功宴上的幽灵401
17.2.3 开源世界的Unix标准402
17.3 IETF和RFC标准化过程403
17.4 规格DNA,代码RNA405
17.5 可移植性编程408
17.5.1 可移植性和编程语言选择409
17.5.2 避免系统依赖性412
17.5.3 移植工具413
17.6 国际化413
17.7 可移植性、开放标准以及开放源码414
第18章 文档:向网络世界阐释代码417
18.1 文档概念418
18.2 Unix风格420
18.2.1 大文档偏爱420
18.2.2 文化风格421
18.3 各种Unix文档格式422
18.3.1 troff和Documenter’s Work bench Tools422
18.3.2 TEX424
18.3.3 Texinfo425
18.3.4 POD425
18.3.5 HTML426
18.3.6 DocBook426
18.4 当前的混乱和可能的出路426
18.5 DocBook427
18.5.1 文档类型定义427
18.5.2 其它DTD428
18.5.3 DocBook工具链429
18.5.4 移植工具431
18.5.5 编辑工具432
18.5.6 相关标准和实践433
18.5.7 SGML433
18.5.8 XML—DocBook参考书籍433
18.6 编写Unix文档的最佳实践434
第19章 开放源码:在Unix新社区中编程437
19.1 Unix和开放源码438
19.2 与开源开发者协同工作的最佳实践440
19.2.1 良好的修补实践440
19.2.2 良好的项目、档案文件命名实践444
19.2.3 良好的开发实践447
19.2.4 良好的发行制作实践450
19.2.5 良好的交流实践454
19.3 许可证的逻辑:如何挑选456
19.4 为什么应使用某个标准许可证457
19.5 各种开源许可证457
19.5.1 MIT或者Xconsortium许可证457
19.5.2 经典BSD许可证457
19.5.3 Artistic许可证458
19.5.4 通用公共许可证458
19.5.5 Mozilla公共许可证459
第20章 未来:危机与机遇461
20.1 Unix传统中的必然和偶然461
20.2 Plang:未来之路464
20.3 Unix设计中的问题466
20.3.1 Unix文件就是一大袋字节466
20.3.2 Unix对GUI的支持孱弱467
20.3.3 文件删除不可撤销468
20.3.4 Unix假定文件系统是静态的469
20.3.5 作业控制设计拙劣469
20.3.6 UnixAPI没有使用异常470
20.3.7 ioctl(2)和fcntl(2)是个尴尬471
20.3.8 Unix安全模型可能太过原始471
20.3.9 Unix名字种类太多472
20.3.10 文件系统可能有害论472
20.3.11 朝向全局互联网地址空间472
20.4 Unix的环境问题473
20.5 Unix文化中的问题475
20.6 信任的理由477
附录A 缩写词表479
附录B 参考文献483
附录C 贡献者495
附录D 无根的根:无名师的Unix心传499
Colophon510
索引511

亚马逊链接

基本信息

名称: JavaScript语言精粹(修订版)
作者信息: 作者: 道格拉斯•克罗克福德 (Douglas Crockford) [ 中文 pdf ]

简单介绍

《JavaScript语言精粹(修订版)》是介绍JavaScript语言本质的权威书籍,值得任何正在或准备从事JavaScript开发的人阅读,并且需要反复阅读。

目录

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
前言
第1章精华1
为什么要使用JavaScript2
分析JavaScript2
一个简单的试验场4
第2章语法5
空白5
标识符6
数字7
字符串8
语句10
表达式15
字面量18
函数19
第3章对象20
对象字面量20
检索21
更新22
引用22
原型22
反射23
枚举24
删除24
减少全局变量污染25
第4章函数26
函数对象26
函数字面量27
调用27
参数30
返回31
异常31
扩充类型的功能32
递归33
作用域36
闭包36
回调39
模块40
级联42
柯里化43
记忆43
第5章继承46
伪类46
对象说明符49
原型50
函数化51
部件55
第6章数组57
数组字面量57
长度58
删除59
枚举59
容易混淆的地方60
方法60
指定初始值62
第7章正则表达式64
一个例子65
结构69
元素71
第8章方法77
Array77
Function83
Number84
Object85
RegExp86
String88
第9章代码风格94
第10章优美的特性98
附录A毒瘤101
附录B糟粕109
附录CJSLint115
附录D语法图127
附录EJSON138
索引149

亚马逊链接

基本信息

名称: Linux命令行与shell脚本编程大全(第2版)
作者信息: 作者: Richard Blum [ 中文 pdf ]

简单介绍

美国Richard Blum、Christine Bresnahan编著的《Linux命令行与shell脚本编程大全(第2版)》是关于Linux命令行和shell命令的全面参考资料。秉承“大全”系列书籍的一贯优良品质,涵盖详尽的动手教程和实际应用中的实用信息,并提供相关参考信息和背景资料。书中内容共分为四部分27章,引领读者从Linux命令行基础入手,直到能写出自己的shell。 《Linux命令行与shell脚本编程大全(第2版)》内容全面,语言简练,示例丰富,适合于Linux系统管理员及Linux爱好者阅读参考。

目录

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
第一部分 Linux命令行
第1章 初识Linuxshell
1.1 什么是Linux
1.1.1 深入探究Linux内核
1.1.2 GNU工具链
1.1.3 Linux桌面环境
1.2 Linux发行版
1.2.1 核心Linux发行版
1.2.2 专业Linux发行版
1.2.3 LinuxLiveCD
1.3 小结
第2章 走进shell
2.1终端模拟
2.1.1 图形功能
2.1.2键盘
2.2 terminf0数据库
2.3 Linux控制台
2.4 xterm终端
2.4.1命令行参数
2.4.2 xterm主菜单
2.4.3 VT选项菜单
2.4.4 VT字体菜单
2.5 Konsole终端
2.5.1命令行参数
2.5.2标签式窗口会话
2.5.3 配置文件
2.5.4 菜单栏
2.6 GNOME Terminal
2.6.1命令行参数
2.6.2标签
2.6.3 菜单栏
2.7小结
第3章基本的bash shell命令
3.1 启动shell
3.2 shell提示符
3.3 bash手册
3.4浏览文件系统
3.4.1 Linux文件系统
3.4.2遍历目录
3.5文件和目录列表
3.5.1基本列表功能
3.5.2修改输出信息
3.5.3完整的参数列表
3.5.4过滤输出列表
3.6处理文件
3.6.1 创建文件
3.6.2 复制文件
3.6.3链接文件
3.6.4重命名文件
3.6.5删除文件
3.7处理目录
3.7.1创建目录
3.7.2删除目录
3.8查看文件内容
3.8.1 查看文件统计信息
3.8.2查看文件类型
3.8.3 查看整个文件
3.8.4查看部分文件
3.9小结
……
第4章 更多的bashshell命令
第5章 使用Linux环境变量
第6章 理解Linux文件权限
第7章 管理文件系统
第8章 安装软件程序
第9章 使用编辑器
第二部分 shell脚本编程基础
第10章 构建基本脚本
第11章 使用结构化命令
第12章 更多的结构化命令
第13章 处理用户输入
第14章 呈现数据
第15章 控制脚本
第三部分 高级shell脚本编程
第16章 创建函数
第17章 图形化桌面上的脚本编程
第18章 初识sed和gawk
第19章 正则表达式
第20章 sed进阶
第21章 gawk进阶
第22章 使用其他shell
第四部分 高级shell脚本编程主题
第23章 使用数据库
第24章 使用Web
第25章 使用E—mail
第26章 编写脚本实用工具
第27章 shell脚本编程进阶
附录A bash命令快速指南
附录B sed和gawk快速指南

亚马逊链接

基本信息

名称: 互联网进化论
作者信息: 作者: 刘锋 [ 中文 pdf ]

简单介绍

《互联网进化论》可以帮助互联网爱好者全面了解互联网的发展历史、演化规律和未来趋势,也可以供云计算、物联网、移动互联网、科技哲学和神经学领域的研究者参考。

目录

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
第1章关于互联网未来的三个疑问
1.1互联网繁荣背后的待解之谜
1.2互联网发展中隐含的启示
1.3盘旋在哲学家头顶的神秘现象
1.4各领域科学家的激烈讨论
第2章互联网虚拟大脑
2.1互联网虚拟大脑全景图
2.2互联网视觉神经系统
2.3互联网听觉神经系统
2.4互联网躯体感觉神经系统
2.5互联网运动神经系统
2.6互联网自主神经系统
2.7互联网中枢神经系统
2.8互联网神经元
2.9互联网神经纤维
2.10互联网的神经反射弧
第3章大脑中的互联网
3.1人类研究大脑的历史
3.2分歧的大脑研究方法
3.3解开大脑之谜的互联网
3.4大脑中的路由系统
3.5大脑中的百度和谷歌
3.6大脑中的微博
3.7大脑中的ip地址
3.8大脑中的维基百科
3.9互联网神经学的提出
第4章互联网纵览之化路线图
4.1科技不断延长人类器官
4.2互联网诞生前的准备工作
4.3核战争威胁下的互联网诞生
4.4互联网早期的应用
4.5电子公告牌的功能分裂
4.6互联网应用的第一次大融合
4.7互联网类神经元的出现
4.8互联网虚拟大脑的萌芽
4.9从生命起源到智慧宇宙的19张图
第5章互联网的商业模式
5.1曾经的互联网霸主——门户网站
5.2互联网上买卖商品——电子商务网站
5.3互联网信息统治者——搜索引擎
5.4在互联网上展示自我——博客
5.5互联网的百科全书——wiki
5.6互联网私人邮局——电子邮箱
5.7虚拟世界的“红娘”——婚恋网站
5.8高谈阔论的网上会场——bbs
5.9联合起来做广告——广告联盟
5.10互联网上以物易物——换客
5.11互联网上的生活帮手——分类网站
5.12共同推荐好新闻——掘客
5.13各行业的引领者——行业门户网站
5.14网上即时交流工具——im
5.15帮你买便宜商品——比价网站
5.16组团购物更省钱——团购网
5.17维护交易安全——第三方支付
5.18移动互联网的地理应用——lbs
5.19捍卫互联网和平——网络安全
5.20创新发动机——网络游戏
5.21互联网职业中介——招聘网站
5.22互联网中的虚拟社会——sns
5.23智慧创造财富——威客网站
第6章互联网纵览之技术要点
6.1互联网的信息基础二进制
6.2互联网的osi七层结构
6.3互联网之父
6.4html语言的发展史
6.5互联网的记忆系统——数据库
6.61p地址与mac地址的区别
6.7互联网抗核打击的原因
6.8物联网是互联网的一部分
6.9云计算不是一片云
6.10三网合一和四网合一
6.11帮助记住网站的域名
6.12互联网新人121——浏览器
6.13互联网开放式平台的意义
6.14移动互联网的巨大泡沫
6.15黑客和病毒并不是噩梦
6.16智慧地球与国家安全
6.17充满争议的web2.0
6.18互联网重要的操作系统
6.19让互联网变慢的p2p技术
6.20网站被用户同时访问的技术
6.21网站建设的lamp体系
6.22解决网站大访问量的方法
第7章互联网进化的九条规律
7.1连接规律:人脑离互联网越来越近
7.2信用规律:让互联网背后的那条狗站出来
7.3统一规律:大鱼吃小鱼的巨头世界
7.4维度规律:从字符迈向三维虚拟世界
7.5加速规律:我们将和互联网一起变聪明
7.6膨胀规律:发生在互联网身上的大爆炸
7.7消融规律:何处是虚拟,何处是真实
7.8映射规律:互联网是现实世界的镜子
7.9方向规律:互联网知道它的未来
第8章互联网问答录——思考与哲学
8.1互联网会成为人类的敌人吗
8.2互联网与人类永生
8.3“看不见的手”操控下的互联网进化
8.4在互联网中诞生的新生命
8.5黑暗森林与星际互联网
8.6互联网带来的科学突破
8.7互联网预示人类的未来

亚马逊链接

基本信息

名称: 大数据•互联网大规模数据挖掘与分布式处理
作者信息: 作者: Anand Rajaraman [ 中文 pdf ]

简单介绍

《大数据•互联网大规模数据挖掘与分布式处理》由拉贾拉曼Anand Rajarama、厄尔曼Jeffrey David Ullman所著,主要关注极大规模数据的挖掘。由于重点强调数据的规模,所以《大数据•互联网大规模数据挖掘与分布式处理》的例子大都来自web本身或者web上导出的数据。另外,《大数据•互联网大规模数据挖掘与分布式处理》从算法的角度来看待数据挖掘,即数据挖掘是将算法应用于数据,而不是使用数据来“训练”某种类型的机器学习引擎。

目录

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
第1章数据挖掘基本概念
1.1数据挖掘的定义
1.1.1统计建模
1.1.2机器学习
1.1.3建模的计算方法
1.1.4数据汇总
1.1.5特征抽取
1.2数据挖掘的统计限制
1.2.1整体情报预警
1.2.2邦弗朗尼原理
1.2.3邦弗朗尼原理的一个例子
1.2.4习题
1.3相关知识
1.3.1词语在文档中的重要性
1.3.2哈希函数
1.3.3索引
1,3.4二级存储器
1.3.5自然对数的底e
1.3.6幂定律
1.3.7习题
1.4本书概要
1.5小结
1.6参考文献
第2章大规模文件系统及Map-RedUCe
2.1分布式文件系统
2.1.1计算节点的物理结构
2.1.2大规模文件系统的结构
2.2Map-Reduce
2.2.1Map任务
2.2.2分组和聚合
2.2.3Reduce任务
2.2.4组合器
2.2.5Map-Reduce的执行细节
2.2.6节点失效的处理
2.3使用Map-Reduce的算法
2.3.1基于Map-Reduce的矩阵-向量乘法实现
2.3.2向量v无法放入内存时的处理
2.3.3关系代数运算
2.3.4基于Map-Reduce的选择运算
2.3.5基于Map-Reduce的投影运算
2.3.6基于Map-Reduce的并、交和差运算
2.3.7基于Map-Reduce的自然连接运算
2.3.8-般性的连接算法
2.3.9基于Map-Reduce的分组和聚合运算
2.3.10矩阵乘法
2.3.11基于单步Map-Reduce的矩阵乘法
2.3.12习题
2.4Map-Reduce的扩展
2.4.1工作流系统
2.4.2Map-Reduce的递归扩展版本
2.4.3Pregel系统
2.4.4习题
2.5集群计算算法的效率问题
2,5.1集群计算的通信开销模型
2.5.2实耗通信开销
2.5.3多路连接
2.5.4习题
2.6小结
2.7参考文献
第3章相似项发现
3.1近邻搜索的应用
3.1.1集合的Jaccard相似度
3.1.2文档的相似度
3.1.3协同过滤——一个集合相似问题
3.1.4习题
3.2文档的shingling
3.2.1k-Shingle
3.2.2shingle大小的选择
3.2.3对shingle进行哈希
3.2.4基于词的shingle
3.2.5习题
3.3保持相似度的集合摘要表示
3.3.1集合的矩阵表示
3.3.2最小哈希
3.3.3最小哈希及Jaccard相似度
3.3.4最小哈希签名
3.3.5最小哈希签名的计算
3.3.6习题
3.4文档的局部敏感哈希算法
3.4.1面向最小哈希签名的LSH
3.4.2行条化策略的分析
3.4.3上述技术的综合
3.4.4习题
3.5距离测度
3.5.1距离测度的定义
3.5.2欧氏距离
3.5.3Jaccard距离
3.5.4余弦距离
3.5.5编辑距离
3.5.6海明距离
3.5.7习题
3.6局部敏感函数理论
3.6.1局部敏感函数
3.6.2面向Jaccard距离的局部敏感函数族
3.6.3局部敏感函数族的放大处理
3.6.4习题
3.7面向其他距离测度的LSH函数族
3.7.1面向海明距离的LSH函数族
3.7.2随机超平面和余弦距离
3.7.3梗概
3.7.4面向欧氏距离的LSH函数族
3.7.5面向欧氏空间的更多LSH函数族
3.7.6习题
3.8LSH函数的应用
3.8.1实体关联
3.8.2一个实体关联的例子
3.8.3记录匹配的验证
3.8.4指纹匹配
3.8.5适用于指纹匹配的LSH函数族
3.8.6相似新闻报道检测
3.8.7习题
3.9面向高相似度的方法
3.9.1相等项发现
3,9.2集合的字符串表示方法
3.9.3基于长度的过滤~
3.9.4前缀索引
3.9.5位置信息的使用
3.9.6使用位置和长度信息的索引
3,9.7习题
3.10小结
3.11参考文献
第4章数据流挖掘
4.1流数据模型
4.1.1一个数据流管理系统
4.1.2流数据源的例子
4.1.3流查询
4.1.4流处理中的若干问题
4.2流当中的数据抽样
4.2.1一个富于启发性的例子
4.2.2代表性样本的获取
4.2.3一般的抽样问题
4.2.4样本规模的变化
4.2.5习题
4.3流过滤
4.3.1一个例子
4.3,2布隆过滤器
4.3.3布隆过滤方法的分析
4.3.4习题
4.4流中独立元素的数目统计
4.4.1独立元素计数问题
4,4.2FM算法
4.4.3组合估计
4.4.4空间需求
4.4.5习题
4.5矩估计
4.5.1矩定义
4.5.2二阶矩估计的AMS算法
4.5.3AMS算法有效的原因
4.5.4更高阶矩的估计
4.5.5无限流的处理
4.5.6习题
4.6窗口内的计数问题
4.6.1精确计数的开销
4.6.2DGIM算法
4.6.3DGIM算法的存储需求
4.6.4DGIM算法中的查询应答
4.6.5DGIM条件的保持
4.6.6降低错误率
4.6.7窗口内计数问题的扩展
4.6.8习题
4.7衰减窗口
4.7.1最常见元素问题
4.7.2衰减窗口的定义
4.7.3最流行元素的发现
4.8小结
4.9参考文献
第5章链接分析
5.1PageRank
5.1.1早期的搜索引擎及词项作弊
5.1.2PageRank的定义
5.1.3Web结构
5.1.4避免终止点
5.1.5采集器陷阱及“抽税”法
5.1.6PageRank在搜索引擎中的使用
5.1.7习题
5.2PageRank的快速计算
5.2.1转移矩阵的表示
5.2.2基于Map-Reduce的PageRank迭代计算
5.2.3结果向量合并时的组合器使用
5.2.4转移矩阵中块的表示
5.2.5其他高效的PageRank迭代方法
5.2.6习题
5.3面向主题的PageRank
5.3.1动机
5.3.2有偏的随机游走模型
5.3.3面向主题的PageRank的使用
5.3.4基于词汇的主题推断
5.3.5习题
5.4链接作弊
5.4.1垃圾农场的架构
5.4.2垃圾农场的分析
5.4.3与链接作弊的斗争
5.4.4TrustRank
5.4.5垃圾质量
5.4.6习题
5.5导航页和权威页
5.5.1HITS的直观意义
5.5.2导航度和权威度的形式化
5.5.3习题
5.6小结
5.7参考文献
第6章频繁项集
6.1购物篮模型
6.1.1频繁项集的定义
6.1.2频繁项集的应用
6.1.3关联规则
6.1.4高可信度关联规则的发现
6.1.5习题
6.2购物篮及A-Priori算法
6.2.1购物篮数据的表示
6.2.2项集计数中的内存使用
6.2.3项集的单调性
6.2.4二元组计数
6.2.5A-Priori算法
6.2.6所有频繁项集上的A-Priori算法
6.2.7习题
6.3更大数据集在内存中的处理
6.3.1PCY算法
6.3.2多阶段算法
6.3.3多哈希算法
6.3.4习题
6.4有限扫描算法
6.4.1简单的随机化算法
6.4.2抽样算法中的错误规避
6.4.3SON算法
6.4.4SON算法和Map-Reduce
6.4.5Toivonen算法
6.4.6Toivonen算法的有效性分析
6.4.7习题
6.5流中的频繁项计数
6.5.1流的抽样方法
6.5.2衰减窗口中的频繁项集
6.5.3混合方法
6.5.4习题
6.6小结
6.7参考文献
第7章聚类
7.1聚类技术介绍
7.1.1点、空间和距离
7.1.2聚类策略
7.1.3维数灾难
7.1.4习题
7.2层次聚类
7.2.1欧氏空间下的层次聚类
7.2.2层次聚类算法的效率
7.2.3控制层次聚类的其他规则
7.2.4非欧空间下的层次聚类
7.2.5习题
7.3k-均值算法
7.3.1k-均值算法基本知识
7.3.2k-均值算法的簇初始化
7.3.3选择七的正确值
7.3.4BFR算法
7.3.5BFR算法中的数据处理
7.3.6习题
7.4CURE算法
7.4.1CURE算法的初始化
7.4.2CURE算法的完成
7.4.3习题
7.5非欧空间下的聚类
7.5.1GRGPF算法中的簇表示
7.5.2簇表示树的初始化
7.5.3GRGPF算法中的点加入
7.5.4簇的分裂及合并
7.5.5习题
7.6流聚类及并行化
7.6.1流计算模型
7.6.2-个流聚类算法
7.6.3桶的初始化
7.6.4桶合并
7.6.5查询应答
7.6.6并行环境下的聚类
7.6.7习题
7.7小结
7.8参考文献
第8章Web广告
8.1在线广告相关问题
8.1.1广告机会
8.1.2直投广告
8.1.3展示广告的相关问题
8.2在线算法
8.2.1在线和离线算法
8.2.2贪心算法
8.2.3竞争率
8.2.4习题
8.3广告匹配问题
8.3.1匹配及完美匹配
8.3.2最大匹配贪心算法
8.3.3贪心匹配算法的竞争率
8.3.4习题
8.4Adwords问题
8.4.1搜索广告的历史
8.4.2Adwords问题的定义
8.4.3Adwords问题的贪心方法
8.4.4Balance算法
8.4.5Balance算法竞争率的一个下界
8.4.6多投标者的Balance算法
8.4.7-般性的Balance算法
8.4.8Adwords问题的最后论述
8.4.9习题
8.5Adwords的实现
8.5.1投标和搜索查询的匹配
8.5.2更复杂的匹配问题
8.5.3文档和投标之间的匹配算法
8.6小结
8.7参考文献
第9章推荐系统
9.1一个推荐系统的模型
9.1.1效用矩阵
9.1.2长尾现象
9.1.3推荐系统的应用
9.1.4效用矩阵的填充
9.2基于内容的推荐
9.2.1项模型
9.2.2文档的特征发现
9.2.3基于Tag的项特征获取
9.2.4项模型的表示
9.2.5用户模型
9.2.6基于内容的项推荐
9.2.7分类算法
9.2.8习题
9.3协同过滤
9.3.1相似度计算
9.3.2相似度对偶性
9.3.3用户聚类和项聚类
9.3.4习题
9.4降维处理
9.4.1UrV分解
9.4.2RMSE
9.4.3UV分解的增量式计算
9.4.4对任一元素的优化
9.4.5一个完整UV分解算法的构建
9.4.6习题
9.5NetFlix竞赛
9.6小结
9.7参考文献
索引

亚马逊链接