如何修复带有混合内容的网站

(以下内容翻译自MDN) 从Firefox 23开始,Firefox默认屏蔽主动混合内容。这遵循IE浏览器(从Versoin 9 开始)和 Chrome 的做法。 这篇文章介绍作为网站开发人员应该注意的地方。 你的网站可能有问题 如果你的网站转发HTTPS页面,所有通过HTTP转发的主动混合内容会被默认屏蔽掉。结果就是,用户看来你的网站可能有问题(比如:iframe 和插件无法载入)。被动混合内容默认可以显示,但是用户也可以设置偏好来屏蔽这类内容。 由于 Chrome 和 IE »

手把手教你用python抓网页数据

(本文同时发布于一亩三分地论坛) 前言 数据科学越来越火了,网页是数据很大的一个来源。最近很多人问怎么抓网页数据,据我所知,常见的编程语(C++,java,python)都可以实现抓网页数据,甚至很多统计\计算的语言(R,Matlab)都有可以实现和网站交互的包。本人试过用java,python,R抓网页,感觉语法各有差异,逻辑上是一样的。我准备用python来大概讲讲抓网页是什么概念,具体的内容要自己看手册或者google别人的博客,这里算是抛砖引玉了。水平有限,出现错误或者有更好的办法, »