第1章 数据整理

正则表达式练习

1、单选题:
‎能够在字符串“aabaaabaaaab”中匹配“aab”,而不能匹配“aaab”和“aaaab”的正则表达式包括‍
选项:
A: “a*?b”
B: “a{,2}b”
C: “aa??b”
D: “aaa??b”
答案: 【 “aa??b”

2、多选题:
‏能够完全匹配字符串“(010)-62661617”和字符串“01062661617”的正则表达式包括​
选项:
A: “(?d{3})?-?d{8}”
B: “[0-9()-]+”
C: “[(]?d*[)-]*d*”
D: “[0-9(-)]*d*”
答案: 【 “(?d{3})?-?d{8}”;
“[0-9()-]+”;
“[(]?d*[)-]*d*”

3、多选题:
‌能够完全匹配字符串“c:rapidminerlibplugs”的正则表达式包括‍
选项:
A: “c:rapidminerlibplugs”
B: “c:\rapidminer\lib\plugs”
C: “(?i)C:\RapidMiner\Lib\Plugs”
D: “(?s)C:\RapidMiner\Lib\Plugs”
答案: 【 “c:\rapidminer\lib\plugs”;
“(?i)C:\RapidMiner\Lib\Plugs”

4、多选题:
‏能够完全匹配字符串“back”和“back-end”的正则表达式包括‌
选项:
A: “w{4}-w{3}|w{4}”
B: “w{4}|w{4}-w{3}”
C: “S+-S+|S+”
D: “w*b-bw*|w*”
答案: 【 “w{4}-w{3}|w{4}”;
“S+-S+|S+”;
“w*b-bw*|w*”

5、多选题:
‍能够完全匹配字符串“go go”和“kitty kitty”,但不能完全匹配“go kitty”的正则表达式包括‎
选项:
A: “b(w+)bs+1b”
B: “w{2,5}s*1”
C: “(S+) s+1”
D: “(S{2,5})s{1,}1”
答案: 【 “b(w+)bs+1b”;
“(S{2,5})s{1,}1”

6、填空题:
‍观察下面双引号内的两段文本(1)“中文名 贝拉克·侯赛因·奥巴马 外文名 Barack Hussein Obama II 别    名 欧巴马 国    籍 美国 民    族 德裔族 出生地 美国夏威夷州檀香山 出生日期 1961年8月4日 职    业 政治家、律师、总统 毕业院校 哥伦比亚大学,哈佛大学 信    仰 新教 主要成就 1996年伊利诺伊州参议员 主要成就 美国第56届、57届总统 2009年诺贝尔和平奖获得者 时代周刊年度风云人物 2008、2011 任期内清除本·拉登 代表作品 《我相信变革》《我父亲的梦想》《无畏的希望》 所属政党 美国民主党 血    型 AB型 学    院 西方学院 妻    子 米歇尔·拉沃恩·奥巴马 性    别 男”;(2)“中文名 唐纳德·特朗普 外文名 Donald Trump 别    名 Donald John Trump、川普 国    籍 美国 民    族 德意志人 出生日期 1946年6月14日 职    业 政治家、企业家、房地产商人、电视人 毕业院校 宾夕法尼亚大学沃顿商学院、纽约军事学院 代表作品 做生意的艺术、学徒 出生地 美国纽约 主要成就 第45任美国总统(2017年1月20日-2021年1月20日) 《时代周刊》2016年度人物 所属政党 美国共和党 净资产 21亿美元(2020年4月) 身    高 190 cm“。请严格按照答案填写要求回答下面5道填空题,包括本题。注意汉字占一个字符。​‍​‍当使用正则表达式“中文名[填空]”([填空]处填写11个字符,表达式尽可能通用,只能使用圆括号、sS这两个元字符和+?这两个重复元字符)分别抽取奥巴马和特朗普的中文名时,替换字符串“$1”的赋值为需要抽取的中文名。​
答案: 【 s+(S+)s+

7、填空题:
‎当使用正则表达式“外文名[填空]”([填空]处填写12个字符,表达式尽可能通用,只能使用圆括号、汉字、.s这两个元字符和+?这两个重复元字符)分别抽取奥巴马和特朗普的外文名时,替换字符串“$1”的赋值为需要抽取的外文名。‍
答案: 【 s+(.+?)s+别

8、填空题:
使用正则表达式“职[填空]”([填空]处填写19个字符,表达式尽可能通用,只能使用圆括号、汉字、.s这两个元字符和+?这两个重复元字符)分别抽取奥巴马和特朗普的职业时,替换字符串“$1”的赋值为需要抽取的职业。‏
答案: 【 s+业s+(.+?)s+毕业院校

9、填空题:
‌当使用正则表达式“出生日期[填空]”([填空]处填写11个字符,表达式尽可能通用,只能使用圆括号、sS这两个元字符和+?这两个重复元字符)分别抽取奥巴马和特朗普的出生日期时,替换字符串“$1”的赋值为需要抽取的出生日期。‍
答案: 【 s+(S+)s+

10、填空题:
‏使用正则表达式“民[填空]”([填空]处填写17个字符,表达式尽可能通用,只能使用圆括号、汉字、.s这两个元字符和+?这两个重复元字符)分别抽取奥巴马和特朗普的民族时,替换字符串“$1”的赋值为需要抽取的民族。‏
答案: 【 s+族s+(.+?)s+出生

第4章 信用风险评分方法

代价敏感贝叶斯分类器练习

1、填空题:

剩余75%内容付费后可查看

发表评论

电子邮件地址不会被公开。 必填项已用*标注