首页 python

python

  • python列表中del与remove用法详细介绍

    python列表中del与remove用法详细介绍

    今天在抓取数据的时候,遇到一个问题困扰了我好久,后来发现原来是基础不牢引发的bug。下面我就给大家分享一下,关于列表中的del与remove用法深究。看代码strlist11=['1','2','3','@','@','4','5','6','#','7','8','9','%',' ...

    python 2021年01月13日 52 0
  • 关键词快速分词工具Python版

    关键词快速分词工具Python版

    我这里已经有了一个关键词分词工具excle版的,但是需要激活后的office才能使用,或者购买wps会员版才能用。于是我就用Python写了一个,使用起来非常方便,这里给大家介绍下如何使用。一、打开guanjianci.xls,将需要分词的关键词复制到表格第一列,保存。记住不要覆盖原有的第一行,第一行是固定的关键词,方便让大家知道将关键词放在哪里。二、打开bxy.txt,设置分词,如下图:,设置好后保存。三、启动fenci.exe或者fenci2.exefenci.exe与fenci2.exe的 ...

    python 2021年01月10日 70 0
  • 图文介绍Python文章采集工具使用

    图文介绍Python文章采集工具使用

    这里用卢松松博客与我自己的博客作为例子,给大家介绍使用Python写的文章采集工具。一、卢松松博客文章的采集1、打开设置shezhi.xls,按照下面步骤设置a、主域名下面填写https://lusongsong.com,记住域名后面的/不能要,否则会出错。b、是否有翻页,但凡你要抓取的内容超过了一页,我们这里都选择Y,反之则选择N。c、输入页码前面的部分https://lusongsong.com/default_d、输入页码后面的部分.htmle、从哪一页开始抓因为卢松松博客第一页是http ...

    python 2021年01月10日 68 0
  • python定时启动、判定程序是否运行及启动程序实现代码

    python定时启动、判定程序是否运行及启动程序实现代码

    最近一直在研究一个脚步,始终没办法完美运行,总会跑着跑着就会出错。最开始一直想着要完善完善,但是说实在的这个东西不是说你每天抱着电脑看,就能真的将其完善到完美(可能是我比较笨吧,又或许是我懒的借口)。时间过得很快,我又想项目早点进入实验阶段,想来想去找到了下面的补救办法。在我一直研究的那个脚步里一共有两个问题,一个问题是每天晚上12点以后需要提取资料,手动提取,这个很烦,虽然研究出了新解决办法,但是又抛出了新的问题,总之就是不能完美解决。虽然如此,但是好在可以用程序做一次提取。这样我就开始寻找定 ...

    python 2020年12月21日 95 0
  • python安装apscheduler出现Requirement already satisfied错误

    python安装apscheduler出现Requirement already satisfied错误

    今天想了解下python定时起床的脚步写法,看了相关文章后,发现需要安装apscheduler包才可以。本来很简单的事情,但是在安装这个包的时候报错了。最开始使用的是直接pip install apscheduler,报错了,提示:Requirement already satisfied: apscheduler in d:\python37\lib\site-packages (3.6.3)Requirement already satisfied: pytz in d:\python37\ ...

    python 2020年12月21日 92 0
  • python中同为替换函数,replace与sub相比有何不同

    python中同为替换函数,replace与sub相比有何不同

    在python中replace与sub两个函数都有替换某个字符或者字符串的功能,那么在实战中他们由什么区别呢?要想知道他们的不同点,只需要用代码打印一下就知道了,首先我们来看看以下代码:

    ...

    python 2020年12月15日 21 0
  • python+selenium+Chrome options参数设置详解

    python+selenium+Chrome options参数设置详解

    Chrome Options常用的行为一般有以下几种:禁止图片和视频的加载:提升网页加载速度。添加代理:用于翻墙访问某些页面,或者应对IP访问频率限制的反爬技术。使用移动头:访问移动端的站点,一般这种站点的反爬技术比较薄弱。添加扩展:像正常使用浏览器一样的功能。设置编码:应对中文站,防止乱码。阻止JavaScript执行...Chrome Options是一个配置chrome启动时属性的类,通过这个参数我们可以为Chrome添加如下参数:设置 chrome 二进制文件位置 (binary_loc ...

    python 2020年12月15日 256 0
  • python实现网站友情链接查询与网站死链接查询的两个脚步

    python实现网站友情链接查询与网站死链接查询的两个脚步

    在前几天写的一建抓取网站所有链接的脚步往后衍生了以下的两个脚步,一个是查询网站友情链接,另一个是查询网站的死链。我这里只是初步实现了功能,还有很多地方需要优化,比如说查询友情链接脚步会存在带www与不带www不能共存识别的问题,查询网站死链的脚步运行好慢的问题,这个问题是我目前解决不了的,我的能力还有限。很多人说,爬虫学的好,“劳烦”吃的 饱。所以,在爬虫教程中,都会劝说大家善良,但是我现在能力有限,可以随便放开造,如果有喜欢一起学习的朋友,可以加我微信,相互讨论,共同学习。下面分享这两个脚步源 ...

    python 2020年12月08日 114 0
  • 获取网页所有a标签中的超链接,使用['href']好,还是使用get('href')

    获取网页所有a标签中的超链接,使用['href']好,还是使用get('href')

    前几天不是用python写了一个一建抓取网站所有链接的小脚步吗,我在里面提了下脚步有点问题,但是不会影响大局观,所以就没有提出来。然而多次运行该脚步后发现了一个对大局观有很大影响的BUG,lia['href']遇到a标签中没有href时,就会像个哈比一样不知道怎么办,这是我在抓取自己博客的时候发现的一个问题,所以脚步写好了,要看其兼容性是否好,还得多找些案例来运行下才行。好了,遇到问题就要解决问题。获取a标签中的href我在之前就写过相关脚步,但是具体怎么写的,因为年纪大了忘记了 ...

    python 2020年12月07日 104 0
  • 用pyhon写的一个一键抓取网站所有页面,并排除非本网链接的脚本

    用pyhon写的一个一键抓取网站所有页面,并排除非本网链接的脚本

    最近一直在思考如何能做一个想百度一样的爬虫,能够自行的爬取网站里所有页面,并且排除掉非该网站下的链接。于是,就写了以下的这么个程序。由于本人对于线程还不是了解,刚开始写的初稿并没有加上线程,导致遇到数据多一些的网站,脚本运行时间就很长。这个其实是非常烦恼的,因为调试起来,脚本运行时间太长,会很耽误时间,所以找了个学习Python时在网上认识的一位朋友帮忙加了下线程,才有了以下这段代码:import requests from bs4 import Bea ...

    python 2020年12月05日 113 0

好文推荐

实时访客入口页面出现bd_vid=标识是什么原因

实时访客入口页面出现bd_vid=标识是什么原因

最近查看百度实时访客,总是会看到入口页面会多......

有了微信视频号,但是没有发布权限,怎么开通

有了微信视频号,但是没有发布权限,怎么开通

视频号是微信在2020年1月19号开始内测的......

服务器配置低,宝塔面板安装IIS总是安装不上怎么办

服务器配置低,宝塔面板安装IIS总是安装不上怎么办

对于一般企业网站或者博客来说,对服务器的配置......

又一个论坛宣布做不下去了,推一把论坛整体出售

又一个论坛宣布做不下去了,推一把论坛整体出售

论坛作为曾经的流量聚集地,在这些年逐渐没落,......

6月3日百度下线搜索结果出图功能

6月3日百度下线搜索结果出图功能

搜索结果出图功能能够提高网站内容在搜索结果的......

Nginx实现开机重启自动启动的方法

Nginx实现开机重启自动启动的方法

将Nginx设置为Windows服务需要借助......