2019-01-31
阅读量:
933
R爬虫报错
问题描述:
read_html(https://list.tmall.com/search_pr ... mp;type=pc#J_Filter)
报如下错误:
Error in doc_parse_raw(x, encoding = encoding, base_url = base_url, as_html = as_html, :
Input is not proper UTF-8, indicate encoding !
Bytes: 0xEC 0xC3 0xA8 0x74 [9]
解决方法:
这种情况是由于编码不是UTF-8格式,
使用guess_encoding()用来探测文档的编码
https://rdrr.io/cran/rvest/man/encoding.html
0.0000
0
2
关注作者
收藏
评论(0)
发表评论
暂无数据
推荐帖子
0条评论
0条评论
1条评论