Books

《机器学习》 - 周志华 著 <2016.01>

机器学习是计算机科学与人工智能的重要分支领域,本书覆盖了机器学习几乎所有的主要分支领域,覆盖面超过了该领域国际著名书籍如ESL与PRML。本书作为该领域的入门教材,在内容上尽可能涵盖机器学习基础知识的各方面。为了使尽可能多的读者通过本书对机器学习有所了解,作者试图尽可能少地使用数学知识。然而,少量的概率、统计、代数、优化、逻辑知识似乎不可避免。

全书共16章,大致分为3个部分:第1部分(第1-3章)介绍机器学习的基础知识;第2部分(第4-10章)介绍一些经典而常用的机器学习方法(决策树、神经网络、支持向量机、贝叶斯分类器、集成学习、聚类、降维与度量学习);第3部分(第11-16章)为进阶知识,内容涉及特征选择与稀疏学习、计算学习理论、半监督学习、概率图模型、规则学习以及强化学习。此外,书中每章都提供了精心总结的阅读文献,对读者进一步深造提供了极大帮助。

Link:

《Pattern Recognition and Machine Learning》 - [美]Christopher Bishop 著 <2007.10>

PRML是模式识别和机器学习领域的经典著作,出版于2007年。该书作者 Christpher M. Bishop 是模式识别和机器学习领域的大家,其1995年所著的 “Nerual Networks for Pattern Recognition” 也是模式识别、人工神经网络领域的经典著作。

PRML深入浅出地介绍了模式识别与机器学习的基本理论和主要方法,同时还涵盖了模式识别与机器学习领域的一些最新进展,不仅适合初学者学习,而且对专业研究人员也有很大的参考价值。

Link:

《The Elements of Statistical Learning》 - [美]Trevor Hastie [美]Robert Tibshirani [美]Jerome Friedman 著 <2013.01>

During the past decade there has been an explosion in computation and information technology. With it have come vast amounts of data in a variety of fields such as medicine, biology, finance, and marketing. The challenge of understanding these data has led to the development of new tools in the field of statistics, and spawned new areas such as data mining, machine learning, and bioinformatics. Many of these tools have common underpinnings but are often expressed with different terminology. This book describes the important ideas in these areas in a common conceptual framework. While the approach is statistical, the emphasis is on concepts rather than mathematics. Many examples are given, with a liberal use of color graphics. It is a valuable resource for statisticians and anyone interested in data mining in science or industry. The book’s coverage is broad, from supervised learning (prediction) to unsupervised learning. The many topics include neural networks, support vector machines, classification trees and boosting—the first comprehensive treatment of this topic in any book.

This major new edition features many topics not covered in the original, including graphical models, random forests, ensemble methods, least angle regression & path algorithms for the lasso, non-negative matrix factorization, and spectral clustering. There is also a chapter on methods for wide’’ data (p bigger than n), including multiple testing and false discovery rates.

Trevor Hastie, Robert Tibshirani, and Jerome Friedman are professors of statistics at Stanford University. They are prominent researchers in this area: Hastie and Tibshirani developed generalized additive models and wrote a popular book of that title. Hastie co-developed much of the statistical modeling software and environment in R S-PLUS and invented principal curves and surfaces. Tibshirani proposed the lasso and is co-author of the very successful An Introduction to the Bootstrap. Friedman is the co-inventor of many data-mining tools including CART, MARS, projection pursuit and gradient boosting.

Link:

《数据仓库工具箱(第3版):维度建模权威指南》 - [美]Ralph Kimball [美]Margy Ross 著 <2015.01>

本书将围绕一系列商业场景或案例研究进行组织。我们相信通过实例来研究设计技术是最有效的方法,因为这样做可以使我们分享非常实际的指导以及现实世界的适用经验。尽管未提供完整的应用或业界解决方案,但这些案例可用来讨论出现在维度建模中的模式。据我们的经验来看,通过远离自己所熟悉的复杂问题,更容易抓住设计技术的要素。

本书的写作目标是基于作者60多年来从实际业务环境中获得的经验和来之不易的教训,为读者提供正式的维度设计和开发技术。DW/BI系统必须以业务用户的需求来驱动,如此才能真正从维度角度设计和展现。我们坚信,如果您能够接受这一前提,将会朝建立成功的DW/BI系统迈出巨大的一步。

Link:

《Java编程思想(第4版)》 - [美]Bruce Eckel 著, 陈昊鹏 译 <2007.06>

本书获得的各项大奖以及来自世界各地的读者评论中,不难看出这是一本经典之作。本书的作者拥有多年教学经验,对C、C++以及Java语言都有独到、深入的见解,以通俗易懂及小而直接的示例解释了一个个晦涩抽象的概念。本书共22章,包括操作符、控制执行流程、访问权限控制、复用类、多态、接口、通过异常处理错误、字符串、泛型、数组、容器深入研究、JavaI/O系统、枚举类型、并发以及图形化用户界面等内容。这些丰富的内容,包含了Java语言基础语法以及高级特性,适合各个层次的Java程序员阅读,同时也是高等院校讲授面向对象程序设计语言以及Java语言的好教材和参考书。

本书赢得了全球程序员的广泛赞誉,即使是晦涩的概念,在BruceEckel的文字亲和力和小而直接的编程示例面前也会化解于无形。从Java的基础语法到高级特性(深入的面向对象概念、多线程、自动项目构建、单元测试和调试等),本书都能逐步指导你轻松掌握。

Link:

《数学之美(第二版)》 - 吴军 著 <2014.11>

数学常常给人一种深奥和复杂的感觉,但它的本质常常是简单而直接的。英国哲学家弗朗西斯·培根在《论美德》这篇文章中讲:“美德就如同华贵的宝石,在朴素的衬托下最显华丽。”(Virtue is like a rich stone,best plain set.)数学的美妙也恰恰在于一个好的方法,常常是最简单明了的方法。因此,我会将“简单即是美”的思想贯穿全书。

最后,要说明一下本书为何用不少篇幅介绍很多我所熟知的自然语言处理和通信领域的世界级专家。这些世界级专家,他们来自不同的国家或民族,不过都有一个共同的特点,就是数学都非常好,同时运用数学解决了很多实际问题。通过介绍他们日常的工作和生活,希望读者能对真正的世界级学者有更多的了解和理解。了解他们的平凡与卓越,理解他们取得成功的原因,感受那些真正懂得数学之美的人们所拥有的美好人生。

《浪潮之巅(第三版)》 - 吴军 著 <2016.05>

一个企业的发展与崛起,绝非只是空有领导强人即可达成。任何的决策、同期的商业环境,都在都影响着企业的兴衰。《浪潮之巅》不只是一本历史书,除了讲述科技企业的发展规律,对于华尔街如何左右科技公司,以及金融风暴对科技产业的冲击,也多有着墨。此外,这本书也着力讲述很多尚在普及或将要发生的,比如微博和云计算,以及对下一代互联网科技产业浪潮的判断和预测。因为在极度商业化的今天,科技的进步和商机是分不开的。

诚如作者所言:“人的商业知识和眼光不是天生的,需要不断地、有心地学习。经过多年的学习、思考和实践,我认定这样一个规律,就是:科技的发展不是均匀的,而是以浪潮的形式出现。每一个人都应该看清楚浪潮,赶上浪潮,如此,便不枉此生。”