热线电话:13121318867

登录
2019-01-31 阅读量: 933
R爬虫报错

问题描述:

read_html(https://list.tmall.com/search_pr ... mp;type=pc#J_Filter)

报如下错误:

Error in doc_parse_raw(x, encoding = encoding, base_url = base_url, as_html = as_html,  :

  Input is not proper UTF-8, indicate encoding !

Bytes: 0xEC 0xC3 0xA8 0x74 [9]

解决方法:

这种情况是由于编码不是UTF-8格式,

使用guess_encoding()用来探测文档的编码

https://rdrr.io/cran/rvest/man/encoding.html

0.0000
2
关注作者
收藏
评论(0)

发表评论

暂无数据
推荐帖子