Python与SEO,搜狗站长平台链接提交工具Python脚本源码
一个大佬哥要的,估计他用不了,哈哈哈!!!
前面本渣渣有写过不少百度收录提交的工具脚本,这里分享一个狗哥,搜狗链接提交工具脚本,与百度api提交不同的是,搜狗的是网页提交,而且限制为20条一次,同时还需要打码,输入验证码,大概率是被撸怕了?!还是因为服务器资源不够?!
链接提交:
链接提交工具为站长提供链接提交通道,帮助搜狗spider抓取您的网站。您可以通过本工具提交您想被搜狗收录的链接,搜狗搜索会按照自身标准处理,不保证一定收录您提交的内容。
工具地址:
https://zhanzhang.sogou.com/index.php/sitelink/index
限制:
每次最多可提交20条链接,每行一条;
仅支持页面对应链接的提交,不支持sitemap形式的文件提交。
与百度搜录提交的不同的是,需要输入验证码,关键点就在于这个验证码的处理了!
关键点
1.session的使用
由于需要提交验证码,所以需要保持一个会话链接,直接用requests的session即可!
#实例化session
session = requests.session()
2.验证码的处理
本渣渣大意了,以为验证码只是一个png图片,直接下载即可,没想到搜狗的验证码图片是svg格式,但不妨碍处理,原理还是一样的,直接down下来,然后转化一下格式,这里应用到了python的第三方库:cairosvg!
cairosvg库安装:
pip install cairosvg
cairosvg转格式,svg转png使用方法,
cairosvg.svg2png(
url="code.svg", write_to="code.png")
不过这里需要注意的是,有个错误需要处理,好在大佬们已经给出了完美的解决方案!
需要安装gtk2-runtime-2.24.33-2021-01-30-ts-win64.exe,同时重启编辑器!
具体解决方案可查看:python将svg的html转成png图片 https://zhaojiafu.blog.csdn.net/article/details/116199823
附上gtk2-runtime-2.24.33-2021-01-30-ts-win64.exe安装包,文末可获取!
3.获取验证码
获取验证码其实很简单,跟访问下载是一样的!
code_url="https://zhanzhang.sogou.com/api/user/generateVerifCode?timer=1626862066472"
r=session.get(url=code_url,headers=headers,timeout=5)
with open('code.svg','wb')as f:
f.write(r.content)
print("下载验证码成功!")
4.显示验证码图片,手动打码
显示验证码图片,这里应用了第三方库 PIL!
from PIL import Image
im = Image.open('code.png')
im.show()
code=input("请输入验证码:")
Python提交效果:
提交成功:
验证码输错:
扩展
如果想要实现自动,也就是自动打码,可以考虑第三方打码接口,或者使用深度学习!
图片转成文字的方法总结,python批量图片转文字信息参考源码
这里本渣渣没有尝试,不妨可以试试看上面本渣渣推荐的百度ocr接口,当然是付费的,但是新用户是有一定数额权限的,相信已经够用了!
该demo脚本源码
涵盖验证码获取及手动打码
还是比较推荐学习和思考的
完整脚本工具源码可免费获取
获取方式
转发这篇推文至朋友圈截图
添加微信:huguo00289 凭转发截图获取
就是这么简单!!!
更多SEO工具资源:点击下方链接????????????
百度主动推送工具汇总,Python POST工具实例源码
Python与SEO,python采集百度移动端搜索相关关键词源码
Python与Seo工具源码,全网搜录查询助手exe
Python与seo工具脚本,360/搜狗相关搜索词采集源码参考
SEO工具脚本,Python百度下拉框关键词采集工具
Python调用有道智云文本翻译API接口实现“智能”伪原创
百度统计后台总是被广告骚扰?看看应用python是如何实现的
百度推广关键词规划师关键词获取,Python凤巢关键词采集工具
python百度关键词相关搜索词采集,链轮查询采集exe工具
百度快排探究(一),Python selenium 实现自然搜索访问目标网站
Python与seo的应用,sitemap.xml文件制作工具源码
·················END·················
你好,我是二大爷,
革命老区外出进城务工人员,
互联网非早期非专业站长,
喜好python,写作,阅读,英语
不入流程序,自媒体,seo . . .
公众号不挣钱,交个网友。
读者交流群已建立,找到我备注 “交流”,即可获得加入我们~
听说点 “在看” 的都变得更好看呐~
关注关注二大爷呗~给你分享python,写作,阅读的内容噢~
扫一扫下方二维码即可关注我噢~
关注我的都变秃了
说错了,都变强了!
不信你试试
扫码关注最新动态
公众号ID:eryeji
qq_43293247: xmlrpc.client.ProtocolError: <ProtocolError for ethsystems.org/xmlrpc.php: 405 Method Not Allowed>这个错误有哪位博友遇到了呢
kkktom754: 找到提交订单按钮的速度有些慢
m0_58288171: 微信搜索下拉词
CnpeCoder: document.add_paragraph(detail.encode("gb2312")) 报错怎么弄大佬? TypeError: 'in <string>' requires string as left operand, not int