方法的参数为url 然后 返回值为 title。
如:
function getTitle(url){
.......
return title
}
getTitle('http://www.baidu.com')
得到 "百度"
getTIttle('http://www.126.com')
得到 "网易邮箱"
如下图,如何写一个方法获取任意网址的title呢?
方法的参数为url 然后 返回值为 title。
如:
function getTitle(url){
.......
return title
}
getTitle('http://www.baidu.com')
得到 "百度"
getTIttle('http://www.126.com')
得到 "网易邮箱"
如下图,如何写一个方法获取任意网址的title呢?
使用superagent+cheerio
superagent.get(url)
.end((err, res) => {
const $ = cheerio.load(res.text)
console.log($('title').text())
})
// npm install request
var request = require('request');
request('https://www.taobao.com', function (error, response, body) {
var array = /<title>(.*)<\/title>/gi.exec(body);
if (array != null) {
console.log('title:', array[1]);
}
});
任意是做不到的,因为有的网站对cookie
有要求,不符合的话是直接403
的。
对于没有验证要求的网站,最基本的使用http.get
获取html
再解析即可。解析可以用正则或者cheerio
10 回答11.3k 阅读
5 回答4.9k 阅读✓ 已解决
4 回答3.2k 阅读✓ 已解决
2 回答2.8k 阅读✓ 已解决
3 回答2.4k 阅读✓ 已解决
3 回答2.2k 阅读✓ 已解决
2 回答2.7k 阅读✓ 已解决
纯前端使用ajax或者iframe都会存在跨域问题。
需要服务端进行请求指定地址,获取到地址对应的页面,然后提取出title标签中内容。