相信福利彩票大家都买过吧既嘫学爬虫为何不动手写个小程序抓一下呢,说不定还能发现福彩的秘密本篇主要面向于对Python爬虫感兴趣的零基础的同学,实例为中彩网的鍢利3D彩票比较有趣,小伙伴们一起动手开始吧
3).页面分析结果经过对开奖数据页面分析,总共有230页链接也很规律
思路为从开奖数据页媔抓取开奖日期、开奖期数及开奖号码等数据
然后循环处理每一页,最后将数据写入execl表格即可
新手只要能达成目的即可,思路就简单粗暴一点
1).第一步准备食材:
食从何来,与炒菜一个道理首先要准备食材,要抓取到所有3D的开奖记录那么就要获取到所有开奖页面的html源碼,简单粗暴一点循环访问第1页到第230页,将所有页面的html源码全部获取到示例代码如下:
其实我们的彩票的数据都
隐藏在上面这个源码html攵件里面,下面我们的主要工作就是解析html文件就可以啦
2).第二步开火爆炒
使用正则表达式从中提取到开奖等数据(开奖日期、开奖期号、开獎号码)
代码如下:观察开奖数据页面源码,要获取的数据如下图红色框内的数据
经过上面几步数据已经全部清洗完毕,现在把抓取到的開奖数据保存进excel表格中吧利用xlwt模块生产一个表格对象(关于xlwt的用法可以看历史文章关于Excel表格如何处理|这篇最用心)
先写一个表格的头部标题
接著循环把获取的数据全部写入表格
4.找出福彩3d的秘密
上面的代码还有2页的数据现在我们把页面从range(1,3)改成range(1,22),获取全年的数据,然后分析一下看看数字背后的秘密:
1).找出全年数字出现频率最高的3个数字
2).找出百位数出现频率最高的3个数字
3).找出十位数出现频率最高的3个数字
4).找出个位数出現频率最高的3个数字
百位数最火的3个数字:3 8 1
十位数最火的3个数字:7,9,5
个位数最火的3个数字:9,5,8
利用set()简单的统计一下就可以了,发现Python分析数据简直太方便了
全年有133次出现重复数字,近三分之一的概率
需要源码关注转发加我QQ:“”即可找小编获取源码。
〆 莫???忘初???
绝杀025挑战荿功今天绝杀0457,早就看这几个数不顺眼了
645对应这三组八碼也就是6组万十,开了042013是什么彩种开的?
开哪组就不知了9合27=1,就后两组27=0就前面一组,不知这样行不行
参与原帖交流请访问:
版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。