scrapy流程
|
Tesseract
|
动态HTML技术
|
爬虫代码建议尽量减少请求次数1. 能抓列表页就不抓详情页2. 保存获取的html页面,供差错和重复请求使用关注网站的所有类型的页面1. wap页面,触屏版页面2. H5页面3. APP多伪装1. 动态的UA2. 代理ip3. 不使用cookie利用多线程分布式在不被ban的请求下尽可能的提高速度动态
寻求js
|
request模块
|
http服务器
|
几十行代码写一个简单的文件下载器
|
服务器代码:import socketimport osdef main(): # 创建socket server_socket = socket.socket(socket.AF_INET, socket.SOCK_STREAM) # 绑定本地信息 server_socke
SHELL
|
0 评论
Shell变量your_name="Gloo"变量名和等号之间不能有空格,这可能和你熟悉的所有编程语言都不一样。同时,变量名的命名须遵循如下规则:命名只能使用英文字母,数字和下划线,首个字符不能以数字开头中间不能有空格,可以使用下划线 _不能使用标点符号不能使用bash里的关键字
TCP/IP协议三次握手、四次挥手
|
0 评论
TCP/IP协议TCP报文格式)TCP报文头中的源端口号和目的端口号同IP数据报中的源IP与目的IP唯一确定一条TCP连接序号(4字节=32位):用来标识TCP发送端向TCP接收端发送的数据字节流确认序号(4字节=32位):由于该报文为SYN报文,ACK标志为0,故没有确认序号(ACK标志为1时确认