Pthon

matplotlib知识点整理

本文作为学习过程中对matplotlib一些常用知识点的整理,方便查找。强烈推荐ipython[br]无论你工作在什么项目上,IPython都是值得推荐的。利用ipython --pylab,可以进入PyLab模式,已经导入了matplotlib库与相关软件包(例如Numpy和Scipy),额可以直接使用相关库的功能。这样IPython配置为使用你所指定的matplotli

守护进程, 孤儿进程, 僵尸进程与waitpid

守护进程是在一类脱离终端在后台执行的程序, 通常以d结尾, 随系统启动, 其父进程(ppid)通常是init进程一般要让当前程序以守护进程形式运行, 在命令后加&并重定向输出即可$ python someprogram.py > /dev/null 2>&1 &或者使用nohup也可以这是直接运行程序的方式, 如果是用具体语言代码的形式来实现呢, 首先看一下守护进程的实现方

[原]数据流编程教程:如何使用Airflow构建数据科学工作流

概述Airflow 是一个我们正在用的工作流调度器,相对于传统的crontab任务管理,Airflow很好的为我们理清了复杂的任务依赖关系、监控任务执行的情况。我们喜欢它是因为它写代码太容易了,也便于调试、维护和继承重用,而不是像xml那样的配置文件用来描述DAG。通过SQL和HQL的临时查询,我们还可以快速生成前端图表,而且顺带连数据的API接口也都生成了,这几乎要让的W

【译】Seaborn教程(二)选择配色方案

原文:http://web.stanford.edu/~mwaskom/software/seaborn/tutorial/color_palettes.html选择配色方案配色是图表设计里最重要的方面之一,因为如果配色方案好,它可以清晰展现数据的模式和规律,否则就会把这些规律和模式隐藏起来。有非常多学习可视化配色的小技巧的资源,我只讨论了series of blog po

generator

前文我们了解如果书写一个Iterator,以及怎样在一个类中安装一个Iterator. 但,有时候我们只想要一个简单的iterator, 而且并不想这么复杂. 处于这个目的, 变成语言里面出现了generator 这个概念. 根据wiki的解释:In fact, all generators are iteratorsgenerator 同样也有iteartor的优势, 在

从零开始搭建论坛(一):Web服务器与Web框架

之前用 Django 做过一个小的站点,感觉Django太过笨重,于是就准备换一个比较轻量级的 Web 框架来玩玩。Web.py 作者已经挂掉,项目好久没有更新,所以不准备用它。而 Flask 也是一个成熟的轻量级 Web 框架,在 github 上有众多的 Star 和 Fork,文档和扩展也很丰富,值得学习。学习一个框架最好的方式就是用框架做一个项目,在实战中理解掌握框

Tornado Demo 之 chatdemo 不完全解读

tornado 源码自带了丰富的 demo ,这篇文章主要分析 demo 中的聊天室应用: chatdemo 首先看 chatdemo 的目录结构:├── chatdemo.py├── static│   ├── chat.css│   └── chat.js└── templates├── index.html├── message.html└── room.html非常

中文维基百科文本数据获取与预处理

照例,先讲下环境,Mac OSX 10.11.2 ,Python 3.4.3。下载数据方法1:使用官方dump的xml数据最新打包的中文文档下载地址是:https://dumps.wikimedia.org/zhwiki/latest/zhwiki-latest-pages-articles.xml.bz2 。方法2:也是官方,结构化数据(json)下载地址是:https:

[译] 解密 Airbnb 的数据科学部门如何构建知识仓库

顽疾Airbnb的数据团队很重要的一个职责就是传播基于数据的决策方法。我们将数据的获取民主化,使得每一个Airbnb的成员都可以量化他们基于数据的决策影响力并且借此洞察用户偏好,提升数据产品的用户体验。最近,我们开始解决一个令人头疼的问题。随着组织的扩大,如何确保我们如何确保一个洞见有效地通过社交网络,这在我们内部称之为知识扩张。当我们团队仅由几个乐于分享和发现研究技巧的人

Pthon 中的 MSQL 数据库连接池

从 Java 到 Python本文为我和同事的共同研究成果当跨语言的时候,有些东西在一门语言中很常见,但到了另一门语言中可能会很少见。例如 C# 中,经常会关注拆箱装箱,但到了 Java 中却发现,根本没人关注这个。后来才知道,原来是因为 Java 中没有真泛型,就算放到泛型集合中,一样会装箱。既然不可避免,那也就没人去关注这块的性能影响了。而 C# 中要是写出这样的代码,