2018-11-19
阅读量:
821
什么是字符串操作?
字符串操作的定义
顾名思义,字符串操作包含一系列用于从文本变量中提取信息的函数。 在机器学习中,这些功能被广泛用于进行特征工程,即从现有的字符串特征创建新特征。 在R中,我们有像stringr and
stringi
这样的包,它们都加载了所有的字符串操作函数。
此外,R还包括几个用于字符串操作的基本函数。 这些函数旨在补充正则表达式。 字符串操作函数和正则表达式之间的实际差异是
- 我们使用字符串操作函数来执行简单的任务,例如拆分字符串,提取前三个字母等。我们使用正则表达式执行更复杂的任务,例如从一组文本中提取电子邮件ID或日期。
- 字符串操作函数旨在以某种方式响应。 他们不偏离自然行为。 然而,我们可以以任何我们想要的方式自定义正则表达式。
例如,假设您获得了一个数据集,其中包含name of the customer
作为变量。 在这种情况下,我们可以使用字符串操作函数来提取和创建新功能作为名字和姓氏。 从下一节开始,我们将实际学习字符串操作函数和命令。 因此,请确保已在机器中安装了R。 此外,您应该安装stringr R包 。
0.0000
0
2
关注作者
收藏
评论(0)
发表评论
暂无数据
推荐帖子
0条评论
0条评论
1条评论