Python包分发详解

用Python写过不少的脚本,现在要把脚本打包成模块并进行发布,然后才明白脚本Boy到正规的码农差距有多大= =。 踩了很多天的坑之后,自己学习到了Python的包分发机制,以及如何利用Pypi向全世界分发自己的模块。现在简单地做一些整理。

Read More

在Python中使用JSON

JSON介绍

JSON(JavaScript Object Notation) 是一种轻量级的数据交换格式。 易于人阅读和编写。同时也易于机器解析和生成。 它基于JavaScript Programming Language, Standard ECMA-262 3rd Edition - December 1999的一个子集。 JSON采用完全独立于语言的文本格式,但是也使用了类似于C语言家族的习惯(包括C, C++, C#, Java, JavaScript, Perl, Python等)。 这些特性使JSON成为理想的数据交换语言。

引用自json.org

Read More

正则表达式参考手册

一直都知道正则表达式的强大,但是总是觉得正则很难学不会,所以一直不得要领。这次因为工作原因,不得不用到正则,于是顺手将它学了起来。入门之后才发现,花费一点时间学习一下正则非常值得,可以成千上百倍地提升你的工作效率。特别是当你经常和批量数据以及规则文本打交道的时候,你会发现完全离不开正则。闲话到此为止,下面进入正题。

Read More

Hash以及Hash校验工具介绍

前一阵子的Xcodeghost事件给所有人都好好的上了一课——校验的重要性。无论何时,一定要校验!一定要校验!!一定要校验!!!重要的事情重复三遍总是没错的。如果真的无法做到这一点,最起码这些一定要注意:

  • 系统镜像
  • 底层开发工具

选择官方认证的软件源,地址尽可能地使用HTTPS而非HTTP以避免缓存影响

Read More

Vagrant——构建虚拟开发环境的新思路

说到虚拟开发环境,人人都觉得好,但是在实际应用中,人们还是在一台电脑上配置所有用到的环境。究其原因,还是因为搭建虚拟开发环境的过程不比在实体机上配置更简单。但是,Vagrant出现了。Vagrant抹平了不同的虚拟化软件的差异,以统一的命令取而代之;抛弃了传统的系统镜像分发安装方式,以直接封装好的虚拟磁盘代替。除此以外,还提供了各种已经封装好的环境下载,搭建一个虚拟开发环境的便利程度有了大幅提高。

Read More

微信公众平台数据抓取解决方案

有一个需求是将微信公众平台的数据导出到Excel以进行后续的数据分析。在关注人数等数据上,微信已经提供了Excel导出的接口,但是在图文分析上,尽管有很详细的数据提供,却没有提供一个好的导出接口。所以我需要寻求一个简单的方案来抓取微信公众平台的图文分析数据。

分析

图文分析页面是JS加载的,通过后台提交返回数据,然后使用JS渲染生成页面。对着页面分析了一会儿,没有发现比较简单的请求构造方式,但是发现微信给出的数据形式非常有规律,可以采用正则来获取我想要的信息。

Read More