0%

社交网站的数据挖掘与分析

基本信息

名称: 社交网站的数据挖掘与分析
作者信息: 作者: 马修•罗塞尔 (Matthew A. Russell) [ 中文 pdf ]

简单介绍

《社交网站的数据挖掘与分析》为Jolt生产效率大奖获奖图书。

目录

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
前言
第1章 绪论:Twitter 数据的处理
Python 开发工具的安装
Twitter 数据的收集和处理
小结

第2章 微格式:语义标记和常识碰撞 XFN 和朋友 使用XFN 来探讨社交关系 地理坐标:兴趣爱好的共同主线 (以健康的名义)对菜谱进行交叉分析 对餐厅评论的搜集 小结

第3章 邮箱:虽然老套却很好用 mbox:Unix 的入门级邮箱 mbox+CouchDB= 随意的Email分析 将对话线程化到一起 使用SIMILE Timeline 将邮件“事件”可视化 分析你自己的邮件数据 小结

第4章 Twitter :朋友、关注者和Setwise 操作 REST 风格的和OAuth-Cladded API 干练而中肯的数据采集器 友谊图的构建 小结

第5章 Twitter:tweet ,所有的tweet ,只有tweet. 笔PK 剑:和tweet PK 机枪(?!?) 对tweet 的分析(每次一个实体) 并置潜在的社交网站(或#JustinBieber VS #TeaParty) 对大量tweet 的可视化 小结

第6章 LinkedIn :为了乐趣(和利润?)将职业网络聚类 聚类的动机 按职位将联系人聚类 获取补充个人信息 从地理上聚类网络 小结

第7章 Google Buzz:TF-IDF 、余弦相似性和搭配 Buzz=Twitter+ 博客(???) 使用NLTK 处理数据 文本挖掘的基本原则 查找相似文档 在二元语法中发Buzz 利用Gmail 在中断之前试着创建一个搜索引擎 小结

第8章 博客及其他:自然语言处理(等) NLP:帕累托式介绍 使用NLTK 的典型NLP 管线 使用NLTK 检测博客中的句子 对文件的总结 以实体为中心的分析:对数据的深层了解 小结

第9章 Facebook :一体化的奇迹 利用社交网络数据 对Facebook 数据的可视化 小结

第10章 语义网:简短的讨论 发展中的变革 人不可能只靠事实生活 期望

亚马逊链接

欢迎关注我的其它发布渠道