Posts

  • 正则表达式参考手册

    一直都知道正则表达式的强大,但是总是觉得正则很难学不会,所以一直不得要领。这次因为工作原因,不得不用到正则,于是顺手将它学了起来。入门之后才发现,花费一点时间学习一下正则非常值得,可以成千上百倍地提升你的工作效率。特别是当你经常和批量数据以及规则文本打交道的时候,你会发现完全离不开正则。闲话到此为止,下面进入正题。

  • Hash以及Hash校验工具介绍

    前一阵子的Xcodeghost事件给所有人都好好的上了一课——校验的重要性。无论何时,一定要校验!一定要校验!!一定要校验!!!重要的事情重复三遍总是没错的。如果真的无法做到这一点,最起码这些一定要注意:

  • 使用pyQuery解析HTML

    pyQuery介绍

  • Vagrant——构建虚拟开发环境的新思路

    说到虚拟开发环境,人人都觉得好,但是在实际应用中,人们还是在一台电脑上配置所有用到的环境。究其原因,还是因为搭建虚拟开发环境的过程不比在实体机上配置更简单。但是,Vagrant出现了。Vagrant抹平了不同的虚拟化软件的差异,以统一的命令取而代之;抛弃了传统的系统镜像分发安装方式,以直接封装好的虚拟磁盘代替。除此以外,还提供了各种已经封装好的环境下载,搭建一个虚拟开发环境的便利程度有了大幅提高。

  • 低成本搭建谷歌镜像

    尽管自己已经搭建好了Shadowsocks等翻墙工具,但是总有一些时刻需要临时地使用Google查看一些网页,这个时候一个可用的谷歌镜像就显得很重要。本文旨在使用低成本方案来搭建一个可用的谷歌镜像服务,用以部分解决这个问题。

  • 我的五样

    此文用以记录自己用过&在用的各类工具及软件,欢迎推荐

  • 微信公众平台数据抓取解决方案

    有一个需求是将微信公众平台的数据导出到Excel以进行后续的数据分析。在关注人数等数据上,微信已经提供了Excel导出的接口,但是在图文分析上,尽管有很详细的数据提供,却没有提供一个好的导出接口。所以我需要寻求一个简单的方案来抓取微信公众平台的图文分析数据。

  • 多页批量规则数据抓取解决方案

    最近完成的一个工作是要抓取某公司的合作伙伴信息,跟上一次的区别在于,这个公司调用了Salesforce之类的第三方CRM服务。合作伙伴的详细信息是需要点开对应的连接之后才可以获得。

  • 单页批量规则数据抓取解决方案

    加入青云后接的第一个活儿是抓取某公司的经销商的全部信息。该公司通过一个动态页面来展示经销商信息,使用后台的POST提交请求数据,并使用JS在页面下方加载请求的经销商信息,而且网址不会发生变化。

  • 译-Ubuntu下五个最好的BT客户端

    本文是我加入LCTT后翻译的第一篇文章,感谢LCTT项目组伙伴们的支持,感谢组长wxy的仔细校对,也欢迎大家加入LCTT项目,共同翻译优质的Linux文章~