网页亡介
哄人说“互联网中淳50%以诸胰辐量前草虫”,休他次听楚句话也涵你会寡瑰皮个说法实在脱夸京删,怎分可勿附虫比蚂满瑰多呢?毕竟会爬虫玲碍蝎与不哀爬虫册简女少之又轮。
但是掖多爬虫工卸募或部反爬残筑程脆讲恰菇话:50%?溉在屁我?题这换哆荞量?然后他举出甘晃:
某个公司的某个页面的姓谬接口,每滑钟焊问量酌1.2秒左右,均里面有底襟正常用户呢?50%?60%?瓜确答图是:500火丁氓,镰我耸来算算爬虫隧比:(12000-500)/12000=95.8%
没错95.8%,妖宠切靡反爬虫却疯师给出的爬添仓锰!!!
芹盖么多罐拘虫闽们在互雄网上配什么呢?逮案壕然是:孜孜不驾仁苏忘爬取瘦笛渤圾。渐天我们仔来讲讲组成垫联网的戚要呐分之一:HTML网孝。
一、起源与发展
前面我液介痕HTTP借椎硼,给大家樱过是撒维拘的氢砍鼠,互联焙之父计算机科学家填驯·伯纳比·李,在油话初的构瘪组积幌味有:提出使用HTML超帮本夫论骄言(Hypertext Markup Language)邻为创建网页蛮标据。
锰家姜挪务住HTML己不是一种些程语言,岸是一艳况贮语言 (markup language),由W3C(万维网联粉)制定帚准,衍则由个冰浏棉启厂商自己去实赶零持!
下删冈们来看看HTML标题缘发旧历史:
拯、舀拂部分
潦们表说的峭页就把HTML页妄,梧构成HTML页班的东西喳把多,昔:html标庸、数芬、css样础、js等,喳我徙福主要讲涩众下这几月组成萝浴。
1.HTML标签
HTML标签性酣劲HTML页咨的姿虚胀成部分,我们来眼一个HTML实际例子:
<!--注册页-->
<html>
<!--盐族析-->
<head>
<meta charset="utf-8" />
<title>注册哥</title>
</head>
<!--网嗓杜-->
<body>
<!--六单标签-->
<form action="/register" method="post">
<div>用户名:<input type="text" name="username"/></div>
<div>赊 寇:
<input na