下你所需,载你所想!
汇集开发技术源码资料

数据可视化爬虫源码 数据清洗导出文件例子

:478.042KB :1 :2019-12-21 07:31:59

部分简介

爬取招聘的招聘信息,提取出信息进行分析。

很懒没有写导入数据库的部分,但是为了方便导入数据库,自己写了一个保存为csv格式文件的函数,可以导出后手动导入到数据库里面。

r_data = 网页_访问S (url, 0, , , , , , , , , , , , , , , , , , , )
正则.创建 (#正则_列表爬取, r_data, , , , )
.计次循环首 (正则.取匹配数量 (), i)
o = 超级列表框2.插入表项 (, , , , , )
超级列表框2.置标题 (o, 10, 正则.取子匹配文本 (i, 1, )) ' 职位名称
超级列表框2.置标题 (o, 8, 正则.取子匹配文本 (i, 2, )) ' url
' 超级列表框1.置标题 (o, , 正则.取子匹配文本 (i, 3, ))’职位名称
超级列表框2.置标题 (o, 2, 正则.取子匹配文本 (i, 4, )) ' 公司名
超级列表框2.置标题 (o, 9, 正则.取子匹配文本 (i, 5, )) ' 公司url
' 超级列表框1.置标题 (o, , 正则.取子匹配文本 (i, 6, )) '公司名
超级列表框2.置标题 (o, 7, 正则.取子匹配文本 (i, 7, )) ' 城市
超级列表框2.置标题 (o, 1, 正则.取子匹配文本 (i, 8, )) ' 薪资
超级列表框2.置标题 (o, 0, 正则.取子匹配文本 (i, 9, )) ' 时间
.计次循环尾 ()
log (“第” + 页面 + “页 数据:” + 到文本 (正则.取匹配数量 ()) + “ 合计:” + 到文本 (超级列表框2.取表项数 ()))

数据可视化爬虫源码 数据清洗导出文件例子

热门推荐

相关文章